MonarchBase - Protein-coding gene

DPOGS201641
Transcript	DPOGS201641-TA	1956 bp
Protein	DPOGS201641-PA	651 aa
Genomic position	DPSCF300254 - 116817-118772
RNAseq coverage	306x (Rank: top 37%)

Annotation
*Heliconius*	HMEL015663	0.0	87.37%
*Bombyx*	BGIBMGA008201-TA	0.0	83.90%
*Drosophila*	lin-PA	3e-154	49.39%
EBI UniRef50	UniRef50_B3ME97	6e-153	50.30%	GF11922 n=4 Tax=Drosophila RepID=B3ME97_DROAN
NCBI RefSeq	XP_001959681.1	1e-153	50.30%	GF11922 [Drosophila ananassae]
NCBI nr blastp	gi\|194754797	2e-152	50.30%	GF11922 [Drosophila ananassae]
NCBI nr blastx	gi\|194754797	2e-170	50.30%	GF11922 [Drosophila ananassae]

Group
KEGG pathway
Orthology group	MCL15886		Insect specific

Nucleotide sequence:

>DPOGS201641-TA
ATGCAATTAATGTTTGATATTTATCTGAAACAAAACAATGTTGGCACTATATGCTCCAGATTAATGTATGCATGTGATATTTTTGTCAGAAACAGACATGACTGGATAACAGAGATTGTAGAATTAGCAGACCATAAGAGCAAATTTATAACCTTCGTCGCATGTAGAGTATTAGCCAGTTTCCTCATTGTATCTAAAGACACCGTCGATGAAAACTGGTTGCAGCAGATCACCGAAAATGTTTACTTGTTTGATAGAATTAATAGAATTACTGTGCAAAAGATAAATTTCAGCTTAGATATAATCAAGAGGATAGTTGAATGGAAGGATGTGGAGCAACATCCCTTGGATGAGACTAGTTATGCTAATGCACCCGGCACCATCCAGGTTCAGGAGGATAATCCATTTAGAGGCAGCTCGAGCTCGCAATCGTCAGCGGGCTCTAGTTCACGTAGTGATAATTTACATAGTGCATTTTCTAATTTGCAAACCCACAGCTCCCCTTCAACATCTTCCGATAGTAAGACAAGTAAACCAACATCCACATTCAAACTTAATGAGCCTGTCTTTAAATTTCCTCACGACCAATCCGACAGCAGAATGGAACCGGCTGATTCTCCAGAACCTTCTCAATCAAGGATAGAAAGAGTTAACGAGCATGGATGCATAACTGTGATATTAACAGACTCCGAGTCGTTTGATACATCTCATATAAAATGTTTAACTATAAAGACTTTAGAGCATCACTGGCCAATTCTAGTAAAAAACATGAAGCTGCTTCTGTTAAGGTACCTGAACTTATCTAATGCTGAAAATTGTATATTAACTTTCTTCTCCCTGTGGGAGAATATTATAAGTGTCAAAGCGAATCTCTCCGTCATTGATACCAAGCCATTTTATGCAGACTTGCAGGGTTTTGTAGATTTATTAAGGAATACAATGCTTCCGGGCTTAATATATGCACATTTACTTAGTTTATTTAATGAAGTCCTATGTTATGGTTCAACGTTGGCCCTTCAGGATATACTGCCCGAGGAAATATGTTGCTTAGCCCATTCTATAGTTAGGTATGTGAAAGACTTTAGATTGTTAAGTGAAGTTAGGGTTCAAAGTAGTAGAAGTGGGTTTGGGTTTTTGGAACATGACTGTAGAGTGATACATGATTATTCTTTGGGACCTGATATCGGGCCGTTATCATCATCAATACAATTGGTCGATCAGAGTTATGGTGAAGATGATAACGAAGATTCCACACAAAGCCGGACTGAAGTAGACAAAACCATGCTCCAACGAATGTCACTGCTGGTCCTCAAATCCGTAGCAGTCACCGTTAAAGAGATGCGATGTGACTCATCGGACAGTTCAATAGATTCGTCAGATTACAACGCTATACAGGACATGCAAATAGTTGAAAGATCGATACGGGATGTGCTTAAGAAATTGGATGTGTTTATAAGGAATCGCTTAGAGTTTCACCCGGAGACTCCGTTCACCAAGATGTTGATACATCTGTTCAGCGAGCAGGATGATTATCTCATTGAATCTATGGTGTGTACATTAGATATAACCGTGGGTATAGTGTATAGGAACTCTATGTATCCCGACTTAATACCAATGCTGAATCCCATAATGTCCTTCATAGAATTCCTCAGGGTTGTCGCACATGATAGTGATGTATTGTTAGATTATCTTGTCAGCAATGAAACCTGTTTTCTTTTATACTTGTTGAGATTCTTAAAATATGTGAGACGTAACTGGCCAAAATTCTTAGACACCTGCCAGCAAATGGATCCAGGTACAACGAGAGGCCTGGATGATACTATGAGGGTTTTGATAAGGTTGCGTTTACAAATCAGTAGGCTAGTATCGAAATCACTGTTCCCATACAACATCAGTCCAGTTCTGAGACTGCTCGAGGTCTGCGAAAGTCTCTATGAAGGAAATGAATTTAGCTGA

Protein sequence:

>DPOGS201641-PA
MQLMFDIYLKQNNVGTICSRLMYACDIFVRNRHDWITEIVELADHKSKFITFVACRVLASFLIVSKDTVDENWLQQITENVYLFDRINRITVQKINFSLDIIKRIVEWKDVEQHPLDETSYANAPGTIQVQEDNPFRGSSSSQSSAGSSSRSDNLHSAFSNLQTHSSPSTSSDSKTSKPTSTFKLNEPVFKFPHDQSDSRMEPADSPEPSQSRIERVNEHGCITVILTDSESFDTSHIKCLTIKTLEHHWPILVKNMKLLLLRYLNLSNAENCILTFFSLWENIISVKANLSVIDTKPFYADLQGFVDLLRNTMLPGLIYAHLLSLFNEVLCYGSTLALQDILPEEICCLAHSIVRYVKDFRLLSEVRVQSSRSGFGFLEHDCRVIHDYSLGPDIGPLSSSIQLVDQSYGEDDNEDSTQSRTEVDKTMLQRMSLLVLKSVAVTVKEMRCDSSDSSIDSSDYNAIQDMQIVERSIRDVLKKLDVFIRNRLEFHPETPFTKMLIHLFSEQDDYLIESMVCTLDITVGIVYRNSMYPDLIPMLNPIMSFIEFLRVVAHDSDVLLDYLVSNETCFLLYLLRFLKYVRRNWPKFLDTCQQMDPGTTRGLDDTMRVLIRLRLQISRLVSKSLFPYNISPVLRLLEVCESLYEGNEFS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: