MonarchBase - Protein-coding gene

DPOGS214351
Transcript	DPOGS214351-TA	1869 bp
Protein	DPOGS214351-PA	622 aa
Genomic position	DPSCF300020 + 440405-445465
RNAseq coverage	557x (Rank: top 23%)

Annotation
*Heliconius*	HMEL020041	80.81%
*Bombyx*	BGIBMGA003971-TA	97.27%
*Drosophila*	Hil-PA	77.13%
EBI UniRef50	UniRef50_Q0E908	77.13%	Hillarin, isoform A n=30 Tax=Pancrustacea RepID=Q0E908_DROME
NCBI RefSeq	XP_976023.1	82.32%	PREDICTED: similar to AGAP005020-PA isoform 2 [Tribolium castaneum]
NCBI nr blastp	gi\|91086663	82.32%	PREDICTED: similar to AGAP005020-PA isoform 2 [Tribolium castaneum]
NCBI nr blastx	gi\|270009747	82.32%	hypothetical protein TcasGA2_TC009044 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[1-622] IPR013998	4.8e-186	Nebulin
	[228-296] IPR002931	8.7e-09	Transglutaminase-like
Orthology group	MCL13441		Single-copy universal gene

Nucleotide sequence:

>DPOGS214351-TA
ATGAAACACAGGCAGGAAGAAGATGATTTGTATAGAAAGTTTTCTAAACACAGAGAGGAAGAAAATCGTAGAATACGAGAAGAAATACAGGACGAGTGGGAGAGGGAGTTAGAAAGATTAACAAACCGATTCCAACAAGAGATGCAAGTGAAGAAACGAAGACCAGAATCTGAGATAGGAGCCCTGACACTTCGACATCAACAGGAGAGAGCTGATCTGGAGAAGAATATGACTCTCCGGAGAGACAAGAAGAAGGAGAGCTTGACTAGAAAGATGTTAGAACACGAGAGGGCTGCTACTGCAGCACTGGTTGAAAAGCAAAGTCACGAGATGATGGAACTGATCCAGGAGCGTAGATCTGAATACATGGCAGCATCCTCCATATTCCTGGACGGAGAAGAAGCACCCCCTTATCCTTCTCGTGCTCCGCCCCCTTTGCCACCGCTTGTATCCAAATTCCACATATACACAGATCCTGCGGAATTCGCGGATGTTGATAAGATTGCTATTTCCGTAGCGCAAGAGGATCAAAAAACTTTTACCGATTTGGTCCGACAACTCGTGGGTAGATGTGCGAGTGATGTCGAGAAAGCAAGAACCATTTTCCGCTGGATAACTGTGAAGAACCTCAACAACATACAGTTTGACGAGAACCTCCGAGGGGATTCCCCCCTGGGATTACTTAGAGGCATCAAGCACGGCACCGAGAGTTATCACGTCCTGTTTAAGAGACTGTGCAGTTATGCTGGTCTCCACTGCGTGGTAATCAAGGGGTACAGTAAATCAGCTGGCTACCAGCCTGGAGTACGTTTCGAAGACAATCGCTTCCGCAACTCTTGGAACGCGGTGTACGTGGCCGGGGCCTGGCGCTTTGTGCAATGCAACTGGGGGGCGAGACACCTTGTTAACGCTAAAGATGCTCCCAAGCCAGGAAACAGAGGAAAGAGCGACAGCTTGAGATATGAATACGACGATCACTATTTCCTGACGGATCCTCGCGAGTTCATCTACGAGTTCTACCCGCTTCAGCCTGACTGGCAGCTGTTGAAGACGCCCATCACTCTACACGATTTCGAGGAACTTCCCTTCGTGAGGTCGCTGTTCTTTAGATACGGACTCTACTTCAGCGATCCCAACACCAAAGCTGTTATGTACACCGACTCTACTGGTGCGGCGACTATGCGTATAGCCATGCCGGCACACATGCAGAGCTCGTTGATCTTCCACTATAACCTTAAGTTCTACGACACGGAGGGCGACGGTTTTGACGGGGTCAGCCTTAAGCGGTTCGTCATGCAGTCTGTGGTTGGTAATGTTGTTTCGTTCCGTGTACACGCGCCCTGTTCCGGGGCCTTTCTCCTGGACATTTTCGCGAACGCCGTCACACCCAGGGAATACCTCACCGGCGAGCCCATGAAATTCAAAAGCGTTTGCAAATTTAAGATTTGCTGCGCCGAACTACAAACAGTAATGGTGCCGCTACCAGATTGTGCTAGCGGTGAGTGGGGGCCGACTAAAGCGACCAGACTCTTCGGCCTCGTCCCCATCACGCACCAGGAAGCACTTGTATTCGCCGGCAGAGAACTAGAGATTCAGTTCCGAATGTCGCGCCCTCTAGCGGACTTTATGGCGACTTTACACAAAAATGGCATCGATGAGAAACGGCTGTCCAAATACGTGCAACAAAACGTCTCGGACGATATCGTCAGCTTTTACATAACATTCCCAGAGGAAGGTCAATACGGTTTGGACATATACACTCGCGAGCGCGGGGGACCCACGGCCATACACAACGGCTCCAGCGAGAAGGAGAAACACCTACTTACACACTGCTGCAAATATCTCATCAACAGCAGTAAACGGAACTAA

Protein sequence:

>DPOGS214351-PA
MKHRQEEDDLYRKFSKHREEENRRIREEIQDEWERELERLTNRFQQEMQVKKRRPESEIGALTLRHQQERADLEKNMTLRRDKKKESLTRKMLEHERAATAALVEKQSHEMMELIQERRSEYMAASSIFLDGEEAPPYPSRAPPPLPPLVSKFHIYTDPAEFADVDKIAISVAQEDQKTFTDLVRQLVGRCASDVEKARTIFRWITVKNLNNIQFDENLRGDSPLGLLRGIKHGTESYHVLFKRLCSYAGLHCVVIKGYSKSAGYQPGVRFEDNRFRNSWNAVYVAGAWRFVQCNWGARHLVNAKDAPKPGNRGKSDSLRYEYDDHYFLTDPREFIYEFYPLQPDWQLLKTPITLHDFEELPFVRSLFFRYGLYFSDPNTKAVMYTDSTGAATMRIAMPAHMQSSLIFHYNLKFYDTEGDGFDGVSLKRFVMQSVVGNVVSFRVHAPCSGAFLLDIFANAVTPREYLTGEPMKFKSVCKFKICCAELQTVMVPLPDCASGEWGPTKATRLFGLVPITHQEALVFAGRELEIQFRMSRPLADFMATLHKNGIDEKRLSKYVQQNVSDDIVSFYITFPEEGQYGLDIYTRERGGPTAIHNGSSEKEKHLLTHCCKYLINSSKRN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: