MonarchBase - Protein-coding gene

DPOGS210436
Transcript	DPOGS210436-TA	2835 bp
Protein	DPOGS210436-PA	944 aa
Genomic position	DPSCF300062 - 245570-250564
RNAseq coverage	236x (Rank: top 43%)

Annotation
*Heliconius*	HMEL015109	4e-160	65.17%
*Bombyx*	BGIBMGA001956-TA	0.0	57.20%
*Drosophila*	mi-PA	6e-33	32.13%
EBI UniRef50	UniRef50_UPI0002246877	6e-47	38.18%	UPI0002246877 related cluster n=1 Tax=unknown RepID=UPI0002246877
NCBI RefSeq	XP_001809235.1	2e-42	29.81%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|345484708	2e-46	38.18%	PREDICTED: hypothetical protein LOC100679267 [Nasonia vitripennis]
NCBI nr blastx	gi\|345484708	5e-49	28.06%	PREDICTED: hypothetical protein LOC100679267 [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL22664		Insect specific

Nucleotide sequence:

>DPOGS210436-TA
ATGGTGGTGATGGAATCCTTCGAAGACTCAAATTGTCCTTCGTTGAGCGATAGTTTATCTTTGTATGAGCGGTATATGAGAAGTTTTAACGTTGTTAATAGCTTTAACGATAACAATAAAGAAATCAATGAACCATCTAGTAACTGTGAAAGTTCTAATAGTGGTGGTAATATAGATCTTTCAACTGTAATACAATCAAATTTATCAAATCATATTGATGTAAATTCAGTAAAACCAGAATATAGTCCAATACAGACTATTTTGGACGATGTGGATAAGGTATCTGATCCAGACATAGTTAAAGTTGGGTCGCCTTGCAATTCACTTGCCGCGTCTCTGACGGAAACTTCTTCCGCAACAAACCCTTGTTTGAATGATAAGTCTGACAATACAGACGTTCCTGTATCCTCTGAAGAGTCCAAATTTGAAGGATTCAGATCAGTTTTTATAACCTCTACAATGGAAAACAGTAACAATGCGGTGGATAGTGTACCTTTGTTTCGTGACGTAAAACAAACCGAAAGTGTTTTTAAATTACCAATTTGTGAATTATCATTTAATGGTACCATACTAAAACATGTTCAGAAACTTAAACCTATAGTTGATCCATTAACTGCTTTAAGCATGTCAAATAATGTTCTTAATTTAAATTACGAGCGATGCACAGATGTAATATCAAATTGTTGCAAAAATGAGTCTAGTGTTGATAGAAAATCACAAATATCAAGTGATATGGAAGACAAAAACTCAAATGAATCTGTTAAAAACTTAAATCCCACTGAGAGTAGCGAGAGCTCATGTGGAGAGGATAGTTCAAAGAAGGAACAGACTAATAATGATGGAAATTCTAAGTGGAACTTGGACCACAGTTATTCATCCCTGGAGGCATCCTTTGATAGTGGGATGCGCTCTCCTGACATGTTTTCAGATGAAGATGAACCTGAACCGAGTCCACCGCCTGAACCATTTTGGAACTTTTTAAAAGATTTTGAGCAATATGATAAACGAAAAGTTAGAAAGATAGAGGAAACATTACAAGGCGTACTACCACCTCCGTCTGTAACAACACTTAAGACTGATGTGACTCAAATGTTGAAGAAATATTACTGTTTTCTGCCAGCTTTCAATGGGGAGGAGAATCTTAATATTGAAGCTAATTCTATGACACCCACAAAAAAGGTTTCATTCGTACAAATACCGGAGACAACAAATGTACACAGTTTTTCAGAAACTGTACATTTGGATAAGACTGATACGAGTTCAATACAGCCAGATGTTTTGCAAAAATCTCAAGCTAACACAAGTATCAGCGATAAGAGCATAGAGATAAAAATGTGTTCGGAAATTGAGGTTTTAGAAGCGTCATGGCCGGATGTGTTGAAATGCAAATACTATGATGTTTACTACAATCTAACGTCCCACTCGGAAAAATATGAGATGCTCATGCAAAAGTATGCGGAAAGGTTCATTGGTGCTGAAACTGATACGAGCGTCAATATATACTCTGGAGGATTGCAGTCACCAAGTAGTGCTTGCAAAAGGAAAGCGCTGAGATTGAAGATGTCTCAAGTCAAATCTCCCGGTCGGAGGCTGTCTCACTTAGCACGTCGTCGGCAGGCCTTTTGCAGCGCGGCCACTATCAATGAGAAGGCACAGACGTCTTCCAAAATGGTGTTAATTGATAAAAAAAAGCTAATCAACTCTGCGGAGAGGAAAAGTCCTAGAACCCGTCGCACACCAGGTAAGAAGACCCCCGGGAAGAAGACGCCGTCGAAGACACCAAAGACAAAGAGCGGGGGCTCCAGTAAGAAGAAAGCGATGCGGCGACTTCTCATGGATTCGGATCTGTCGAAGACTCAACCGTCCAGGGATACGCTGAAACGAGCTTTGTTCATCAGCCCGGATAACAAAAAGCCCGTCGCCACATGTTCCTCCGTCCCAAATCAGGCTTTGAAATCCAAACGAGCGTTATTCGGATCGCCGGTGAGGCAAGCGGAAACCAAGAGCCTGGATGGAACAGCCAGCGATCAGTTCCTGAAGCGGAAAAGAGATACGCTGGATGATGAACCGGAAACCAGTAGGAACAAGATAGCGAAGAGTCTCTCGTTCGGTGGGGATAGTCGACTGTCGTTCAGTTCAGAAAATAGATTGACGTTTGGCGTTGAAAACCGAAGGGCGTCAGAGTGTTTGACGACGAAAACTATGGCTGAACTTAACGAAACCCATAAGAAGAAACTTCTTTGGGCCGTGACCGAAGCCCTACGTCTCCACGGCTGGCGCATGTCTTCCCCGGGTTTCCGTGAGAAAGCTTCATCCCTGGCTCGCCTGACACGCAAGCTGTTGACTCTTCCGCCTCACGCGGCTCGGCTTGCAGCACCCAACCTGTCGACTTCTGATACTATGTTTAAGTTAGCTCGCCAATATGTATTTGCAATAATTCAAGGCCGTACAGTCGATGAATGCTATCAAGATGAGGTCCTCAAAATCTCTAACGAGAATAACAAGATAACTGGCTACATATCAGCCACGGCCTACCAACAGATGAAGACCAAACAAGTTCCGTCGACGCTGACCTCGCAGATCAAAGAAAACACTTTTGGGGAAAGGTCAACTAAACTGGAACAGCCTAGGAGCACCTCCAAGAATATACTACAAGACAAATGGATGAATATAGACTGTAATTCAAACTCAAATAGCAACAGCAGTGGTAGTTTTAGTGTTCTAGATAAGGCTGGAGTTTTCAAGTCCAATTCGATGCCTTCATTCGAAGAAGCAGCCAAGATGAGGGCGAGGAGACAAATCAGTTTTGATAATGTAGATTTTCCAAAGAGGTGA

Protein sequence:

>DPOGS210436-PA
MVVMESFEDSNCPSLSDSLSLYERYMRSFNVVNSFNDNNKEINEPSSNCESSNSGGNIDLSTVIQSNLSNHIDVNSVKPEYSPIQTILDDVDKVSDPDIVKVGSPCNSLAASLTETSSATNPCLNDKSDNTDVPVSSEESKFEGFRSVFITSTMENSNNAVDSVPLFRDVKQTESVFKLPICELSFNGTILKHVQKLKPIVDPLTALSMSNNVLNLNYERCTDVISNCCKNESSVDRKSQISSDMEDKNSNESVKNLNPTESSESSCGEDSSKKEQTNNDGNSKWNLDHSYSSLEASFDSGMRSPDMFSDEDEPEPSPPPEPFWNFLKDFEQYDKRKVRKIEETLQGVLPPPSVTTLKTDVTQMLKKYYCFLPAFNGEENLNIEANSMTPTKKVSFVQIPETTNVHSFSETVHLDKTDTSSIQPDVLQKSQANTSISDKSIEIKMCSEIEVLEASWPDVLKCKYYDVYYNLTSHSEKYEMLMQKYAERFIGAETDTSVNIYSGGLQSPSSACKRKALRLKMSQVKSPGRRLSHLARRRQAFCSAATINEKAQTSSKMVLIDKKKLINSAERKSPRTRRTPGKKTPGKKTPSKTPKTKSGGSSKKKAMRRLLMDSDLSKTQPSRDTLKRALFISPDNKKPVATCSSVPNQALKSKRALFGSPVRQAETKSLDGTASDQFLKRKRDTLDDEPETSRNKIAKSLSFGGDSRLSFSSENRLTFGVENRRASECLTTKTMAELNETHKKKLLWAVTEALRLHGWRMSSPGFREKASSLARLTRKLLTLPPHAARLAAPNLSTSDTMFKLARQYVFAIIQGRTVDECYQDEVLKISNENNKITGYISATAYQQMKTKQVPSTLTSQIKENTFGERSTKLEQPRSTSKNILQDKWMNIDCNSNSNSNSSGSFSVLDKAGVFKSNSMPSFEEAAKMRARRQISFDNVDFPKR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: