MonarchBase - Protein-coding gene

DPOGS210121
Transcript	DPOGS210121-TA	4386 bp
Protein	DPOGS210121-PA	1461 aa
Genomic position	DPSCF300017 + 1483161-1493733
RNAseq coverage	211x (Rank: top 46%)

Annotation
*Heliconius*	HMEL010703	0.0	66.14%
*Bombyx*	BGIBMGA000228-TA	0.0	57.53%
*Drosophila*	CG32397-PA	1e-35	44.75%
EBI UniRef50	UniRef50_B0WMN7	1e-45	53.53%	Putative uncharacterized protein n=2 Tax=Culicinae RepID=B0WMN7_CULQU
NCBI RefSeq	XP_001662638.1	4e-48	33.87%	hypothetical protein AaeL_AAEL012536 [Aedes aegypti]
NCBI nr blastp	gi\|157132800	8e-47	33.87%	hypothetical protein AaeL_AAEL012536 [Aedes aegypti]
NCBI nr blastx	gi\|157132800	2e-65	25.71%	hypothetical protein AaeL_AAEL012536 [Aedes aegypti]

Group
KEGG pathway
Orthology group	MCL26713		Lepidoptera specific

Nucleotide sequence:

>DPOGS210121-TA
ATGGACATCCGTGTGGTATTTGTTTTGCACGGCGTCATCGACCACTTAACCCAGCACTCGGTGGACTCGGTCGCGTCGTATTCTAGTCAGAATCACGTTGACCGTATAAGGACTCAAAACTTCTCAGCGGCTTCCTGTCAAGACGAATGTGATTTCGGGTCCATTAGGACGAGCCTTTTCAGAAGATCTTCGTCTAATACAGAAATTCCAATAAAACGACCAGAAAGCGTCACATCCAATACAAGTTCTACAAGAAGCCGTCTTAGAGATTTTGTTGAAAGGAAATCGAGTCAAGACGAACATAGACCCGTGGCAAACACAGTTGCTGACATTCAATACTTTGAAAATCCCACAGAAACATTAGAATTTGACAATCCACGAAATTCACTAGAATCCAAAAAGAGTCAAGACGAAAATACTAAAAAGCGGAAATTTTCTAATAAAGATAAAGACTGTGAAAATAAAATCAAAAAGGAGGACAAGTATCAGAGTAAACTCGCTGAATATTACAAGCTTCCGTTACAGCTACCTCAAGACGAATTTTATCAGCATCTCACACGATCTAAGGCTGCTGAGGAATTTTTACAGAAACGCTTTCCAAATTCCGACACTGAGTTCAGTGCTAGTTACGGAAGATTGTGCAAACATAAAGACGTCGAAGGTTCAAATTTACGTCGTAGCAGGAGTCTAGCTGTAATAAGAGAGGAAACATTTACAGATCTTCAGATTCAAAATCATCCCAAAACTAAGCGGTCTCAACTTATACCGCGTGCCCGTTTATTTGACAAACCTTGTTTTAGAGACAGATTAATTGGTCGTGCAAAATACCAAACCAAGGAAGAAGTTTTGGAAGGCATTTATATTGACAGTACTGTATCTTGTTTTGGAGATATAAATAGACAAAGAGTAGACGAAGAACCCTCAAATCCTCCTGATAACGTAGAAAATAATTCTGCAAAGGAGGACGTTGTATCAAGAAACGAGAGCCATCATTCCCGGTCTATTAGCGGAAGTTGGCCTAATTTACATGGTGAAACGAAGCAAACCAACGGCTCTGAAGAAAGTATCGGCCATTCACGTAATCCAAGTGAAATCGATAGCTTAGATTCTAACTACGTTAGAAAACATTATAACTTTGAAGCCCATTTAAAAAACTATAAAGGAAGTTCTCCAGAGACAGATAGATCTATAGCATCGCCTAATAATAGTAAAGATCTATACATTAGTACTGACGAGCCAGACAGTGATAACGAAGAAGACAAGTCTAAAACACAACGCTCTTCGGTTAAAGAACATAATATATTAACTCAAAAAGTTGTTAATGAAAAAATTGTCTTAAATTCTGATGAGATTTATAAAGCAGAATCACCCGATAAGGTATCTTTACAAAGTAAGCAGAGTTGTAACATAGAGAAAGAGAATAAAGCAACAGAAGAAAACAAACAAGAGAAAAAAGATTCAGACAGTCAGTCGACAATTTCTGAAAACGACGAAAACATTTCTAGTCCAGCTGATAGCATTACATCCTATATATCAATATCTATTGCATCTTCAACGGACAAATCACACAAATTAGAATACTTAGCAAATTCACTTGCTGAGAAAATTGACGAATACTGTGATTCACAAAACGCGTCTGTGAATTCACCTACAATCCATTCTGAAACTCAAACGCTTGACACAGATCCTATCTATACCAAAGTTCAAAAACAAACATTTGCTGACTTAAAAAAACATTCTTTTACCAGGAAACCTCGTGAATCCAAAAAAGTAAAAATAAAAACACCCACAAATGAAAGTTATGTAACAAACACATTTATTAAATGCAAAGACTACAATGAAGATAGCTATTGCACATCAACAAAAAATATAACCACTGAACCTTTTGTTACAACTTTTATAGAAAATCAATACTACTCGTTACCGGATATAAATATAAGTAAATGTTTGAGAAAATCAGAGAGAATAGACGCTCAATTAAGAGAAGAAGATCCAGAAGACATACCTTGTGAAAACACATACGAAGTTGCTCATACACACGTCAGAGAAATTTCGCATCATTCAAATGGTGAAAGCTATGGTCAACTTAATAAAATAAGCCCAAAAATCTCACACAAAAGTCAAGTAGACATTGAAGATAACTCTTCCTATTATAAAGAAGAATCGGAACCTCAACTACTTCAAAACTTTACAAAACTGGAAGACGATTTAAAATCCATAATAACTATTGACAGTTCTTATGCAGACGATACTATTTATTACCAATTAGATCACCATCAAAACGAACGAGAAGTAAATGAAATTGAAGGCACAATACGAAATAATAAAATAATTACAAAATCAGAGAGCTTAAAGTTAGTCTCCAATATATCTAACAAACCGGAAATAAAGCTATTGAAGTCACTATCCAACGACAATATAAATACATCTCTTCAAAGAAAAAGAAGTAAAACTGGGATTCATAAACACTATTCACTTCGTCAACGTAATCCAACTGGTACTGAATCTATCCGTATACCAAGCCCACACCAAGTAGAAAAAAGTTTCAGTAAACCAATTCATCGTAAAATTTCAAATCTATCATTTAGTGACCAAATCAAAAATCATTCACTAATTTCGCGAGTTCAATCTTTTAAAACATCGCCAGATTCGAATGTCTCCATTATTCCATTAAGTGGTCATCAAACTATTGTCATTGATCCCCCTACACAATCTATACCAGAACAACAAACTAAATACTCAGTAAAGGAAAAACAGTCTGAAAGCAATGATAATATAAATTCGAAACCAAGTTACCAAAATCCAACGACTATCAAAATAACAACCAATACCGAAGACGGTACTTGCGAAAACAAAATATTTACAAATAATATAACAGGAGATCCTTTTATAACAATCAAACTAAATAAAATCGTTAAAAAGAATATAGAAAACCAGTACCAAAGACCGCCGTCCAAGTTGGTTATAAACGACAGTAACAATAATCTTGCAGACACTAATTTATCAATCACTATGACCCGACCACAAGTTCTTCAAGTCATCGATTCAAAAAATAAAAAGCTGAATGAAGTTGTTGCAGATAAAAATAAAAAAGGTATAAGTGCAGTTAAAATGAATAACTTAGAGAGTAAAAACGACTTTAAAGAATCCAAATTCGAAAATAATAATGTAAAAGAAAAACTTAATAACGCAATAAAAACGGATATAGAGTATCAAGAAAAAATTAACTCGGTAAAAAACTACTGGTCCAAACTTATTGAAAAATCTCCTGATTATCAAAATAAGGAAGACGATAAGGACAAGACAGAAGGAACAGTGGAAAATATAAACGAAGAAAACGCAAATCGCGATGAGAATGACAACAACAATCATAAATGTGTTCCAGAAGTTTCAGTAGGGAGCATTATAAAGACATTAGAAAGTGCAAAAATAGTAGATAGTGTAAAGAAAGTAAATCAAACAAAACTACAGTTGTGGAAAGAAGAAACAGAAAAAGTTAAGAGTGATTCTGAAATTGAAGAAGCACCAGTGGAAAAGATAGTTAAAGACACAACAAGAACTATTTACGATCACCCGAAAATCGAAAAACCATCTACAAAATCCGAACAGGAGATATGTAGAGATACTCCAGAGATCGAAATTGTAGAGTTAAGCAGTGACAATCAAAACCAAAAAACTCAGGCAACCTTAATTAAAGCTAAAGGATATGAGAAGGGTTGTGACGAATTTGACCATGTAAGGTATAAAGTGATGAAATCAGAATTGTTTAAAAACAGCATGATAGCGAATTATCGAAAAGAAGCCCAATTCGATGGTCTTTTACAATATCTCCAGGATTACAGTTTTCAAGAACTACTAGTTAACAATAATATAGTAATAATAGAACCCGTCAGAACTAAAGTTGAACCAGCTCCTAGAAAAAATACAACAGACACATGTAAGATACCACCCACATTACTTAAGAAACCTGATTGTACATCACAAGTGGACAAATCAAAGAATGCCATTCGCAGGCACTTTTTCTATCATCCAATTAGAGTTAATAAAGAAATCATAGAAGAGGAACTTCCAAATCCAGATACAGTGAAAAAGGTACGTAACTTATTTGAGGACACCCTTAAAATGAAGAACGAATCAAATTCTATCCAGGCAACAAACATACCGATGGATAATGTCCAAGATACAAGAGAGGATATGAGGCATGCAACTCAAACTGACAAGCAAGAAAATGACGACCCACACAGCTTTGAAAAGAAGTTTTACTACGTTAACGACAGTGTAGAACAAAGAAACGTCCCAGTGGGAAAATTCGGGGAGATGATTTTTGAAGAATTTGAGGTTTTAGAAAACTGTTACGATAGTTTAAATAGTAATAAGTCCCCTTAA

Protein sequence:

>DPOGS210121-PA
MDIRVVFVLHGVIDHLTQHSVDSVASYSSQNHVDRIRTQNFSAASCQDECDFGSIRTSLFRRSSSNTEIPIKRPESVTSNTSSTRSRLRDFVERKSSQDEHRPVANTVADIQYFENPTETLEFDNPRNSLESKKSQDENTKKRKFSNKDKDCENKIKKEDKYQSKLAEYYKLPLQLPQDEFYQHLTRSKAAEEFLQKRFPNSDTEFSASYGRLCKHKDVEGSNLRRSRSLAVIREETFTDLQIQNHPKTKRSQLIPRARLFDKPCFRDRLIGRAKYQTKEEVLEGIYIDSTVSCFGDINRQRVDEEPSNPPDNVENNSAKEDVVSRNESHHSRSISGSWPNLHGETKQTNGSEESIGHSRNPSEIDSLDSNYVRKHYNFEAHLKNYKGSSPETDRSIASPNNSKDLYISTDEPDSDNEEDKSKTQRSSVKEHNILTQKVVNEKIVLNSDEIYKAESPDKVSLQSKQSCNIEKENKATEENKQEKKDSDSQSTISENDENISSPADSITSYISISIASSTDKSHKLEYLANSLAEKIDEYCDSQNASVNSPTIHSETQTLDTDPIYTKVQKQTFADLKKHSFTRKPRESKKVKIKTPTNESYVTNTFIKCKDYNEDSYCTSTKNITTEPFVTTFIENQYYSLPDINISKCLRKSERIDAQLREEDPEDIPCENTYEVAHTHVREISHHSNGESYGQLNKISPKISHKSQVDIEDNSSYYKEESEPQLLQNFTKLEDDLKSIITIDSSYADDTIYYQLDHHQNEREVNEIEGTIRNNKIITKSESLKLVSNISNKPEIKLLKSLSNDNINTSLQRKRSKTGIHKHYSLRQRNPTGTESIRIPSPHQVEKSFSKPIHRKISNLSFSDQIKNHSLISRVQSFKTSPDSNVSIIPLSGHQTIVIDPPTQSIPEQQTKYSVKEKQSESNDNINSKPSYQNPTTIKITTNTEDGTCENKIFTNNITGDPFITIKLNKIVKKNIENQYQRPPSKLVINDSNNNLADTNLSITMTRPQVLQVIDSKNKKLNEVVADKNKKGISAVKMNNLESKNDFKESKFENNNVKEKLNNAIKTDIEYQEKINSVKNYWSKLIEKSPDYQNKEDDKDKTEGTVENINEENANRDENDNNNHKCVPEVSVGSIIKTLESAKIVDSVKKVNQTKLQLWKEETEKVKSDSEIEEAPVEKIVKDTTRTIYDHPKIEKPSTKSEQEICRDTPEIEIVELSSDNQNQKTQATLIKAKGYEKGCDEFDHVRYKVMKSELFKNSMIANYRKEAQFDGLLQYLQDYSFQELLVNNNIVIIEPVRTKVEPAPRKNTTDTCKIPPTLLKKPDCTSQVDKSKNAIRRHFFYHPIRVNKEIIEEELPNPDTVKKVRNLFEDTLKMKNESNSIQATNIPMDNVQDTREDMRHATQTDKQENDDPHSFEKKFYYVNDSVEQRNVPVGKFGEMIFEEFEVLENCYDSLNSNKSP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: