MonarchBase - Protein-coding gene

DPOGS215043
Transcript	DPOGS215043-TA	4434 bp
Protein	DPOGS215043-PA	1477 aa
Genomic position	DPSCF300208 - 194619-207526
RNAseq coverage	12x (Rank: top 83%)

Annotation
*Heliconius*	HMEL002006	8e-163	63.49%
*Bombyx*	BGIBMGA005675-TA	3e-128	61.22%
*Drosophila*			%
EBI UniRef50	UniRef50_E9J2A1	2e-18	19.45%	Putative uncharacterized protein (Fragment) n=1 Tax=Solenopsis invicta RepID=E9J2A1_SOLIN
NCBI RefSeq	XP_002430737.1	2e-15	23.88%	hypothetical protein Phum_PHUM497560 [Pediculus humanus corporis]
NCBI nr blastp	gi\|383864570	4e-37	21.66%	PREDICTED: androglobin-like [Megachile rotundata]
NCBI nr blastx	gi\|383864570	2e-43	21.04%	PREDICTED: androglobin-like [Megachile rotundata]

Group
KEGG pathway
Orthology group	MCL22102		Lepidoptera specific

Nucleotide sequence:

>DPOGS215043-TA
ATGTCTAAAAAATCGGATATGGGACGAAGTCTTGTGGTCTACGAGGTCGACCCCACGGAATGCCCATTTAGGGAATTTCGGGATAATGAACTCTCCACGGAGTTTTGGGGGATGGGTCCATCTGCTTTTCGAACCAGTCATTTTGTTAGCAAAATTTCGACGAAGACTCAAGCAGACTATGTTTGGGTGGATGACCAAACACAGCCCTTGCCCCGATCAGCGAGACAGTATCTTCATGGATGGGTTAGAGCTGACGAATTAGCTTTGAATCGATGGGACGCTGAAGTTGTTATTTTTGAGGATAACGGCAGTGGTAAGATGTCAATCATAGACATGCAGCTCAGCCATGCACAGGTTCTCCTGAGATCATCCTTCTGCAGACGAGTCCTCTCTATGTGCTTCATGCTTGAAAGGGTTGATAGTTTAATTGTGGAACATCAATGGGAGAACTTTGTATTCACAATGGCCCCGGAAGGCTGGAGGTCTCGGTTTCATATTTACTCCCCGGGATTGAAACCTGGTGGTGGACAACAACATCGACCAACACATTCCAAAAATGGTAATAGAGCCCTCGAAAATACTTTGTTGCCTGGTTGTTATCTCGTTCGCCTATTCTATCTCGGCGCCTGGCGCTGCGTTTGGGTCAGTGATCAGGTTCCAGTGGATGCGACTGATTCACCACTCCTGCCATTCTCTCCGCTACTCAGCCGTGCTCCAGCCAAACCAGGCGGTAAACAAGCCCCCGCCATGGTGACTTCCAACGTCGTACATCTATGGCCCTTACTTATATGCAAGGCGTTGTTGAAGCTGGCAGCACCCGACTTGAATTCGGACGAAGACGCGAATTGTGAAGACGAATTGATGCCAGAGTTTGATATATTACACGCCCTAACTGGTTGTTTGAATCTGGTTTATAATATAAAGAACCCCGAGACCATATGGGACATTATAACAAGTGAGGTTCCATTATTTACTTGGGACGATGATGACGATACCCTGGCTAGCACTGTAAAGTCTAGGAGTACGAAGAAACCTGCTACGAAAGAAACTACGGTTGTCCGGAGAGGATCTATGACGTCAATTCTTATTGAAGACTCAAAGAATTCTCCTCCTTACGCTCTCCCGGGAATTACTCCAGGCCACGAAATGAATCTCCTCGTGACTATGGCTAGGGATTTACCACTTAAAAAACCGCTACCTGAACCGGAGGTCCCACTGTGGAAAACATATCGGTGGGTGGATTGGGCGCGTCGACATGGTTTGTACGAGGCTTATGATTGTCCGCGCACCCAGTTTCTGAAAGTCAATGGGTTCTTAAAGCTATCACACGCTCCGCATTTGTTAGATGTCCAAAGTACTGAATCGATTACATTACAATTTAGAGAAGAACATGATAGGACCAATCCACCGCTAAAGAAAGGTATAAGAGATGTAAATCGTTCGCAAACAGCTAATTCAGCAACAGCTCAGCAACTAAAAGAAGAATTGAGGGAATGGATACCGTATCTGACATTATATGAGTTATTAAAGCAGTGCAGCGTTCTGTTTTACCCTTCTATGTACGAGTTCACATCGGTAGCTAGCAACCCTCCAGTTAGAATTACTAAAACGGCTCCTAATAAAGCGCTAGATATAGCTGCTTCTAAGTCATCACCGCTGTACCTGCAAATTGATGGACCTGATGAGAATATTTTAAGAATTTCTCTGAGCGCTCTTCATCCGCGAGTTCTTTTTAACTGTGGCGTTGCGATACTTGATCATATAGAACCAGCTCATTTAGTACTGGAAGTTTTTGAATGGTTTAATGACTGCGAGTTGCCCAGGGCAAAAGCGTATATTCATACCCGAGGATATGATTCTGTTGAAGTTAAATTACAACCAGGAAGGCACTTTTGCAGAGTTTGGGTTCATTCTCGTATGAATTGGCATGCTATGCTTCTGAGTGAATCATCCTTACTACTTGGAACTCGAGATGTGATCCAGTCTGCAGCTGTCAGAGATTGCCCGTGGGCAGCACGTTTTTTATGTAATCTCGGCAATGCTTTCCAAAATTGGATAAAAGCAACAAGATCAGCAGTGAACTTATCATTAAATGATAAAGAATTTTACGGATCGTACCAGCCCGATTTACAATGGGATGCAAATATAGTGGGTTATGACAAGGCTTTTCTTCATTGGATGTTCAGACAGGCTCTACAGTCCTTACTATCAAAAAAGCTTGTACGATCAGACTACAATAGCGTATGTTTGGTGTTGAGAAAACATTTTCTTGACCCAGATTTTGGGTTCCCACCTAAGCCAAGGCCTCCATTAAAGCCAGTACGATACGTTGCAGAAGTAGATCCATGTGATTGCGTTATGCCAGAAGTAGAAGAACAAGAAGTTGTAGAAGAAGAAACGGAAGAACAACAGTTACTGGAGGAAATTCCATTGGTTAATCAAGAAACAATGGATCGACTGCTCACTTTACCAAAACCACCTCTAACGTCTCAAGTTTGTGAGCTTGCCACTGAAGAATTGCCCTGTGGAGTTCTGAAAAACGAAAGGGAAAAAACCATCCAAAGACATGAGGCAGCAACAACATTGCAAGCTTATTGGAGAGGAACCTGGGTCCGGCAATGCTTGACACGCATGGTCTCCCTTACACCTGAAATTTTAAAACTTATAATGGATAATGCTTTTGGTAATATGGAGGCACTGTCGTCCCTGATGAATGAGTTCTTCAAAATGTACCCAGGAACGAAAAAGTCGTATTCAGTTGCTTCTGCACTTAGCGGAGTGTACGGGCTCCAGCAACACAGCGGATCTTCACCTATAAGTCCAAAATGCAAATGGGTTCCGTACTTTCAGAGCGTATTTACGTGTCACGCTCCAGTTAAAGTTCACTTGGATGTTCAAAGTTCACTCCAACACAGCACATTGGCTGTTTACAATAATGATACCGGTGAACAGATGCCCCAGGCCTACAACTCTCATATAACATTCATTTTTCAACCAAATGATCATGGTTATACGGTCATGGGTCATGGGACATTGAATCAACCATCTGGAGTTAATAGTGAGGTGCATTGGCAGTTAACAGTACTATCATCGATTGCTGACGTTTTTCACGTATGTGACAATGAGATTGACTCTTGCAAGGAGCTGCCACTCTCACCGGCTAGCAAGCTGCATATTGATGAAATTTTCATTCCTAATCGCAAGAATATATTGGGTGGCATACAAATATTGGTCACAAAACATGATGCTGTTTGTTTTAGAGCAGCTGCTACATCCCCAGAGCTCGAAATGGAAGCGATTTTACGTACCGTGAATCCGGATGGATCTGTGGAAGAATTGGGCAGGTGTTCAGGGACGGGAGAGCTGCAGTGGCCTTACATAAGACTAGAACCGACACTACTCATAGCCAACAACCAATTCAAAAAAGCTTCCACTTCGCAAGCAAACTTGGCATCGACGGCCAAAGAAAACATCACGAGTGCGCGTTCTTTGAGGAGTAAGCAAAAAGCACCGAGTGCTAAGAATAAATCTGCAACTAGGGTTAAAGATATCAAACTTAATTTGGAACCGAAGCAGTATTCAATTGAAGTCGTGGCTCCGAAAGGATGGCCTTTGACGTTGGCGCAGTGGAACAGAGTCGATCAGGTCCGGAATTCTCAGGAGTCTAACAAAGTGGAAGCCGCTCCTGTCAAGAAACCTGTCAAAGATAAGGGTGTATTGAAAGACAAGATCCAATCACCAACGCTATACCAGCCTCAGATAGGAGATGCATATGTGGAACTGGAATGCTCGTTGGCGATCGGAGGTGGTTCGGTGGCGAGGCTTGATGATGAGCGGGATATACAGTTCGCAACAGCAAAAAGAAATTGGGATTTACTTGAGCCTGGTAGGAATGCTAGAGGAGCGCAGATCAGGAAAGAGTTCAGGGCGGATTTTTTAGAGTCCGTACCACCTCCACAGTCTCTGAGTGAACAAAGTTTAGGAGAGGAAATACTGGGAGAGGATTTATTCGGAGAGGAGAAAACTCTTGAAGTATCAGAAGAAAGCGAGGAAGAGACCAAGTATCTGACGATGCCGGAAATATTGAAGGACAAATTTTTACCGTTGTACTTCATACCATTGTGTACCAAAGAGTACAATGAAGATGAATGCGTCGTTGTCACACCAGAAATGGCTGAAGTAGCGAAGAATGATCGCCAAAATCGCATTGACGCAGCGTTGAAGCGCATGCGTGAGCTGCAGGCTTACAATGAGCAGTATGTGATATACAGGCAACGACAGAGGTGCCACTTACTAGAGAAATTGTTTGTCGATTCTCAATGGAATGAAGAATTAAATGCCGTTCTGGAAGAGAGAGACGACGCTATAGCGAGAGAAGCACTGATTCGATCTCTCTCTGCGACAAAAAAGAAGCAGGAGGCAAAGAAGAAATAA

Protein sequence:

>DPOGS215043-PA
MSKKSDMGRSLVVYEVDPTECPFREFRDNELSTEFWGMGPSAFRTSHFVSKISTKTQADYVWVDDQTQPLPRSARQYLHGWVRADELALNRWDAEVVIFEDNGSGKMSIIDMQLSHAQVLLRSSFCRRVLSMCFMLERVDSLIVEHQWENFVFTMAPEGWRSRFHIYSPGLKPGGGQQHRPTHSKNGNRALENTLLPGCYLVRLFYLGAWRCVWVSDQVPVDATDSPLLPFSPLLSRAPAKPGGKQAPAMVTSNVVHLWPLLICKALLKLAAPDLNSDEDANCEDELMPEFDILHALTGCLNLVYNIKNPETIWDIITSEVPLFTWDDDDDTLASTVKSRSTKKPATKETTVVRRGSMTSILIEDSKNSPPYALPGITPGHEMNLLVTMARDLPLKKPLPEPEVPLWKTYRWVDWARRHGLYEAYDCPRTQFLKVNGFLKLSHAPHLLDVQSTESITLQFREEHDRTNPPLKKGIRDVNRSQTANSATAQQLKEELREWIPYLTLYELLKQCSVLFYPSMYEFTSVASNPPVRITKTAPNKALDIAASKSSPLYLQIDGPDENILRISLSALHPRVLFNCGVAILDHIEPAHLVLEVFEWFNDCELPRAKAYIHTRGYDSVEVKLQPGRHFCRVWVHSRMNWHAMLLSESSLLLGTRDVIQSAAVRDCPWAARFLCNLGNAFQNWIKATRSAVNLSLNDKEFYGSYQPDLQWDANIVGYDKAFLHWMFRQALQSLLSKKLVRSDYNSVCLVLRKHFLDPDFGFPPKPRPPLKPVRYVAEVDPCDCVMPEVEEQEVVEEETEEQQLLEEIPLVNQETMDRLLTLPKPPLTSQVCELATEELPCGVLKNEREKTIQRHEAATTLQAYWRGTWVRQCLTRMVSLTPEILKLIMDNAFGNMEALSSLMNEFFKMYPGTKKSYSVASALSGVYGLQQHSGSSPISPKCKWVPYFQSVFTCHAPVKVHLDVQSSLQHSTLAVYNNDTGEQMPQAYNSHITFIFQPNDHGYTVMGHGTLNQPSGVNSEVHWQLTVLSSIADVFHVCDNEIDSCKELPLSPASKLHIDEIFIPNRKNILGGIQILVTKHDAVCFRAAATSPELEMEAILRTVNPDGSVEELGRCSGTGELQWPYIRLEPTLLIANNQFKKASTSQANLASTAKENITSARSLRSKQKAPSAKNKSATRVKDIKLNLEPKQYSIEVVAPKGWPLTLAQWNRVDQVRNSQESNKVEAAPVKKPVKDKGVLKDKIQSPTLYQPQIGDAYVELECSLAIGGGSVARLDDERDIQFATAKRNWDLLEPGRNARGAQIRKEFRADFLESVPPPQSLSEQSLGEEILGEDLFGEEKTLEVSEESEEETKYLTMPEILKDKFLPLYFIPLCTKEYNEDECVVVTPEMAEVAKNDRQNRIDAALKRMRELQAYNEQYVIYRQRQRCHLLEKLFVDSQWNEELNAVLEERDDAIAREALIRSLSATKKKQEAKKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: