MonarchBase - Protein-coding gene

DPOGS215723
Transcript	DPOGS215723-TA	3453 bp
Protein	DPOGS215723-PA	1150 aa
Genomic position	DPSCF300041 + 286108-290820
RNAseq coverage	1391x (Rank: top 9%)

Annotation
*Heliconius*	HMEL009648	0.0	57.14%
*Bombyx*	BGIBMGA005815-TA	0.0	52.66%
*Drosophila*	CG9715-PA	1e-34	39.31%
EBI UniRef50	UniRef50_Q7PP02	2e-37	37.44%	AGAP006128-PA n=2 Tax=cellular organisms RepID=Q7PP02_ANOGA
NCBI RefSeq	XP_316189.4	3e-38	37.44%	AGAP006128-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158295392	6e-37	37.44%	AGAP006128-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|345493249	9e-41	23.68%	PREDICTED: hypothetical protein LOC100678029 [Nasonia vitripennis]

Group
KEGG pathway	aga:AgaP_AGAP006128	8e-38
	K12597 (AIR1_2)	maps->	RNA degradation
Orthology group	MCL25175		Lepidoptera specific

Nucleotide sequence:

>DPOGS215723-TA
ATGGAAGAGGAGCTTAGCGAAAATGAGCTGGAGGAACAAATGTATGCTATGATACACTATGTTGACGATACGCAATCAAATGTCAACTCAAACCAAAACGATAACAACATTGTTGAGAATGTTCCTCAGAGTACCGTACGTCGCTACTGGCGTACTAATGTAGACCAAAACACACCTTATCAGAAAATAAACACACCTAAAGATTCTACTAACAACAAAGAAACAGGTGAAAAGAAAGATGACAAAAGTAAATCCTCAGACCAAAACACATCAGATTTGTCTCTTTTTCAACAACCGGTACCCTCGAATGTCAAGAAAACTGTAGAAATATTGGAAAATGATGATGACAAAAATATAGTGGAACTCGAAACAAGCGACGAAGATGAAGTTATTGAAGTGGCACTTCCACCCAAACCCACCATCACCATTGAGAGTTCAGACGAAGATGATGTCTGTCCAGTTGATCCAGAGCCTGACATTAAACACAAGCCAACAAAGCCCACACAGGAAATTAAAAACTCAGTTGACAGAGAAGTCACTACCAGTCCAGTACCATCCGTGGTGTCATCTATCTCAGATGACTTCATAAGAGGAGACTGCATCGCACTCAATATATCATCAAAACATCCAAATAACCAAAGCTTTGATTTCAGTCTTCATGGCTCCGATCTTCTCGACCAAACACCATCGAAGAAAAAAAAGAAAAAGAAAAGCAAAGAAAAAAATACACCATCATCAGTAACAACGCCTCTTTCAGTATCAACTCCCGTGAGCTCAAAGCAAACGGCTGGTGCAGTTGATGAATGTTTTGCTACTCCCAAGAGCAAGGCCAAGAATAAACGCCAAAGGACAAAATCATATCGAGTTTCAGAGAAAAGTTTACCAAATGCTGACGTGTATGACTCAGACAGCAACCAATCACTGAATGAGAGTAACAAAAACCAGATGACATATGAGGTTACCGACAAAAGTGTACCAAGCACTGATGTCTACGAGTCCGATTCCAATCCATCAGAAAATGCTACAGAATCTGTATCTAAAGAGGCTATTAATGACGCTGAAAGCTCAGAAAGCACAACGGAGAGCCCCGTTGTTGAAATAGTCAAAACATCAAAAAATACTGACATTTCCAATAAGTCCGTAGTAGACCTCACGGAACCAGCCATGAACACAAGTATAGACGAAAACATAGTGATGGGTAACGTTACGGGATTCACAAACATGGAAGAATTCAGTGATCATGATATTTCAGTCAAAGACATATCCAAATGCGGCTCAACTAAAATACCAGCCATCCTTAATGAGGATCTCGATTTTGACAATCTCAAAGGCAGCAACAAAGTGTGCAAACGACGACGATATTCACTAACTACATTGCGAGCCGAAATGGAAAAGTTCTACAACGAAAGCTGGGGAGGAGAGGAATTCAACCATCGGGAGATACAGAAGAATATGTCACGTGACAAAAGTTTGTGGGTAATTGATGCAAAGGACCGTATGCCATCGCTGACTAGACGAAAGACCACATGCAACTACTGTAACCGCGCCGGCCACCGCGACGACGCGTGTCACTTCAAGCCGCCCGTGTGTTTCATGTGCGGCGACGCGGGACACTACGAACCGCGCTGTCCCAGGAAGATATGCGTCAATTGCGGGTCACCCAACTACGTGTACTCCACGATGTGTCGGAACTGCTCCACGTGGAAGTGCATCAAGTGTGCGGAGTGCGACCAGAGCGGTCACCCGGCCAGCCACTGCCCGGACGTGTGGCGCAGATACCATGATACCTTGTCGTTGGAGACTCCGTTGGAAGAGAATCGTCAAACGAAGAAGAATCACCAGATGTTCTGCAGTGGTTGCACGCGCCGTGGTCATTTAGTCCACACCTGCCGTCTCTCTCTACCGTTCTCAGGCCTGCCGATGAACTCCCCATACGTCTCGGTCTACCGACCCGTCTACCAGATGCTGGACACTAACAACCAAAGTAACGATATCGGTAACAAGAAATTTAAGAACAGGAATAATTCTGAAAATTCCTCAACGATCAGACAGGACAGAATGAAACGACAGTCCAAGTCGCCGACCACCCACGATTCACATCTCAACAAGAAACGTAATATGGGTACCATTGAAGTTGAAATAAGCTCAGGAAACAAGTTTCCTACGGGGAATCAAAGGAAAGTTATAATCTCTGAAGAAAATCCCAATAACAGCAGCAAAATTATCACAGAAACAAACATCAATAAAAAATCCACCGAAGTTCAAAGTACAGAGAGGGCTCCAGACTTTATACCGATAACATCATCAGACAATCGAGACAAGAGGGGACAAATAATACAAGACAATGAAGTGTCGGACACGAGCGAGGTCATCACATCCGCGAGGGTCTACATCACCAAGGAGATAGCGGATCTCTTAATGACAGATGAAGGAAGCCTGTGGCTCAACACGACCATCAAAAACAACGATCTGATATTGGAGAATGACACCATAACATTCTACCTGAGCATCAACGGAACAGTCGGCAACCAGGAGGCCTTCCAAGCTGAACTGGGAGAGTGGATCAAGAAGAAACAAGCCGGCAGAGAGAAAGAACGATTTGTGTCCGAGAGTGAAACCGACGTTACCCAGGAAGGTACAAACGATCAGCAATCGTTGACGAATAACATACCCAAGAACAGAAACAACGCTTTGCGCAAACTGAACAAAGCCTTCGATTCATTAAAGAAAGATCTGGGAGATCCGAAGACCATTTATAAGGAGCTGACGTATTTGCAAAATAAACATCAGCAACTTATAAACCAGAAAGTCATAAGCCCCAAAAAACTGTCCAACAACAGGGACAATATTAATCTGATGCTGAGAAAACTTAATATGGTACTTCTCGGGCAAGCTGGTCTAGCGGACGGCTCCACACATTTAAAGGAACTGTACTCCTTACAAGAGAAACTAAGCAATTTCAGGCAGAAAAATATACCGACGTCGCTGCGCGAGGAAATCGGTGAGCACTTTCATTGCATCTTCGCTGCGATACCCAGGGATGATTACATAGAACTCTTAAGTAAATTTTACAATAAACCGGTCATAACGTTCAAGAAGAAAAATGATAGGTCCTTCAAAGTCAGTCCGAAGCCAAACCAGAAGACGTTGAATCCGATCCAGAACATACAACGCAACGTGAGCGGCGTGAAGGATGACACGAAGGAAAACAACGTGGCCAACGACACGTCCCAACTGACCGCGGCGACCAAGAACAAGCTGGTGTTCTATCACAGGCGGTTGCTGCGCTCGCGACCCATGGACGCGGTTCTCAAGAAGACAAAAAGCGAACTGCTAAGGAAGCTCCACTTCAATCTCGCCCTATTAGGCGACAAGGCTCATATATCTTCGAAGGCTCTGAAGAAAATGAGAAAGATTCAAGAGCAGGCCCAGCTGTTCTTAAATAACTTTTAG

Protein sequence:

>DPOGS215723-PA
MEEELSENELEEQMYAMIHYVDDTQSNVNSNQNDNNIVENVPQSTVRRYWRTNVDQNTPYQKINTPKDSTNNKETGEKKDDKSKSSDQNTSDLSLFQQPVPSNVKKTVEILENDDDKNIVELETSDEDEVIEVALPPKPTITIESSDEDDVCPVDPEPDIKHKPTKPTQEIKNSVDREVTTSPVPSVVSSISDDFIRGDCIALNISSKHPNNQSFDFSLHGSDLLDQTPSKKKKKKKSKEKNTPSSVTTPLSVSTPVSSKQTAGAVDECFATPKSKAKNKRQRTKSYRVSEKSLPNADVYDSDSNQSLNESNKNQMTYEVTDKSVPSTDVYESDSNPSENATESVSKEAINDAESSESTTESPVVEIVKTSKNTDISNKSVVDLTEPAMNTSIDENIVMGNVTGFTNMEEFSDHDISVKDISKCGSTKIPAILNEDLDFDNLKGSNKVCKRRRYSLTTLRAEMEKFYNESWGGEEFNHREIQKNMSRDKSLWVIDAKDRMPSLTRRKTTCNYCNRAGHRDDACHFKPPVCFMCGDAGHYEPRCPRKICVNCGSPNYVYSTMCRNCSTWKCIKCAECDQSGHPASHCPDVWRRYHDTLSLETPLEENRQTKKNHQMFCSGCTRRGHLVHTCRLSLPFSGLPMNSPYVSVYRPVYQMLDTNNQSNDIGNKKFKNRNNSENSSTIRQDRMKRQSKSPTTHDSHLNKKRNMGTIEVEISSGNKFPTGNQRKVIISEENPNNSSKIITETNINKKSTEVQSTERAPDFIPITSSDNRDKRGQIIQDNEVSDTSEVITSARVYITKEIADLLMTDEGSLWLNTTIKNNDLILENDTITFYLSINGTVGNQEAFQAELGEWIKKKQAGREKERFVSESETDVTQEGTNDQQSLTNNIPKNRNNALRKLNKAFDSLKKDLGDPKTIYKELTYLQNKHQQLINQKVISPKKLSNNRDNINLMLRKLNMVLLGQAGLADGSTHLKELYSLQEKLSNFRQKNIPTSLREEIGEHFHCIFAAIPRDDYIELLSKFYNKPVITFKKKNDRSFKVSPKPNQKTLNPIQNIQRNVSGVKDDTKENNVANDTSQLTAATKNKLVFYHRRLLRSRPMDAVLKKTKSELLRKLHFNLALLGDKAHISSKALKKMRKIQEQAQLFLNNF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: