MonarchBase - Protein-coding gene

DPOGS212167
Transcript	DPOGS212167-TA	3621 bp
Protein	DPOGS212167-PA	1206 aa
Genomic position	DPSCF300038 + 759542-772219
RNAseq coverage	167x (Rank: top 51%)

Annotation
*Heliconius*	HMEL012550	0.0	70.42%
*Bombyx*	BGIBMGA006614-TA	7e-169	65.45%
*Drosophila*	corn-PC	1e-24	30.63%
EBI UniRef50	UniRef50_B0W6W4	5e-44	31.23%	Cornetto n=2 Tax=Culicinae RepID=B0W6W4_CULQU
NCBI RefSeq	XP_001844448.1	9e-45	31.23%	cornetto [Culex quinquefasciatus]
NCBI nr blastp	gi\|170033163	2e-43	31.23%	cornetto [Culex quinquefasciatus]
NCBI nr blastx	gi\|170033163	1e-46	30.05%	cornetto [Culex quinquefasciatus]

Group
KEGG pathway
Orthology group	MCL24884		Lepidoptera specific

Nucleotide sequence:

>DPOGS212167-TA
ATGGCGGAAGAAAATAAAAATGCTCTCGTCGCGTGCGATCCGCCTCCTAATTTTAATAATTTGGATGCAACTACAAATTCAAACCAGCCTTTAGAAAGTAAAGGACACAATATAATTGATATTTCCATTGCTGCCGTAAAAGAAGACAGTGATATTGTTCCTGTCAAAGTAGATGATTCTAAAAATGCAAATGTCAATGTAAAACAAGATTTAGTAAGAAACGGTTCGTGCGACGCTATAGATGACGTACGATCTTTGGGGGACCTTGACAGTTTGCCTGTCGGAGATGACTTGGTGTTAGGCGCAGCGGGAAGCGACAGCGGTGTAGAAGGATGTGGCAGAGCTCTCAGTAGCGGAGGTGGATCCAGATCTTGTGCATCTAGTGTTGTTTCATGTGGATCTGGATGCGGATCAGAGAGCTCTTCGTTAGCTGGGGCACCTCCGCGACCACGTCGTCGAGTAAACATCACCGTTCAAGAACCTAAGAGAAGTTCACCGGTCAATTTATCATCGCGACCCATAACAGCGCCTCGTGGCCCTAATTTGGCAACTCGCGAACGCGCAAGAAGTAGGGAAAAACCAACACCCCCAGAAAAACCGCGACCTCTAACACCTAAGCCCAAAATACGCCCCACAGCTGATCTTCCCAACTTAGTTCGAGAAAGTCCAGCTCTTCGTGCAAAACCAACAAAAACTTCCACAGCAAGATGTCGAACTCCAAATTCTCCCGTGGATGAAAAGAAATGGCCAACCAATGGTCACGTGCAGCGACTACCAAATGCAACTGATGCCTCAGCAACCCGCGTCGCTGCTGATAAATATGGAACATTACCACGAAGGAGAAGAGACGCTGATCCGGAGTCATCTCCAAAACATGAAAGTATACCGCCCACCTCAAGAAGGCCGACCGTCACACGATCTGTTTCGTCTCGATCAACTAAAACCCGTGTAAGGATTTACGCTGAAAAAACATGCCAGACGGTTCTCGTCGGGGCTGATATTGAATCGGCGCTCGCTGGATTCGTGCCAAACATTGAAAGACGGGACGTTACCCTTTGTCACCGCGGAGTTCAGGCTAGCTCACGGGATACTGAGACAGCTCGGCTAGTAGCAGCAGTAGCGGCGGCAGAGGCAGCAGCAGCTGAGGAGAAGGAGCGAAGACAGCATGTCGAGACGCAGTTAGCCGCTGAACGTTCTGCAAGACTCGCTGCCATTTCAGAGCTAGAGAGAAACTCCCAGAGATTGCTCGAACTCGCCGGCGCTGGCGCTGGCGCTGGCGCTGAAGGTTGTCTGCGAGCTTTGGAAGAACAGCTCCGATCAGCGCGGGAACTGTCAACAAGACAGCGGACGGAAATAGACTCGCTCAGGGAACACTGTGATAAACTACATGCGGAGTGGTGTCGCGTGCGCGAGTCGCGCCGCGTGTTGTCCGCTCGTCTGTCGGAGGCGGAGCGCGAGGCCGCTGAGATGCAAGACTTCCTCGCCGCGGAGACCGGAGCCCTGGGGGACTCGCTCAGGGACGCCGAGGCGGAGATTGAAAAATTAGCTTCTGAACTAGAACGAAGACGCGGCGAGTGTCGTCAGTTAGTCCGTATGTGCGAGCAGCGCCGCCAGGAGGCGTTAGCGGCGAGCGCGCGGGCTCGGCGCGGCGCGGGCGCGGCGGCCGCTCTGGACGCGCTCGCCCGCCGTTTGCACGCGCTCACCGAGGCCGTGCGTGCGGCGTACCAGCTGCCCGCACACGTCGTGCACCCGACAGTCTTCCACAACGAGGCGTATTGCAGCCGTAGCGACAGCGGCGAGACCCTGTCTCCGTCGGAGGAGCCGCTCGGTCTCCTGGGAGCGGTGTCCCGGGCGCTCCGCTCGGCCTGCACACCTCTCGTGCATATGAATCAGCACGAGGACGACCGCTCCAGAATACGGGACGTTACCCTTTGTCACCGCGGAGTTCAGGCTAGCTCACGGGATACTGAGACAGCTCGGCTAGTAGCAGCAGTAGCGGCGGCAGAGGCAGCAGCAGCTGAGGAGAAGGAGCGAAGACAGCATGTCGAGACGCAGTTAGCCGCTGAACGTTCTGCAAGACTCGCTGCCATTTCAGAGCTAGAGAGAAACTCCCAGAGATTGCTCGAACTCGCCGGCGCTGGCGCTGGCGCTGGCGCTGAAGGTTGTCTGCGAGCTTTGGAAGAACAGCTCCGATCAGCGCGGGAACTGTCAACAAGACAGCGGACGGAAATAGACTCGCTCAGGGAACACTGTGATAAACTACATGCGGAGTGGTGTCGCGTGCGCGAGTCGCGCCGCGTGTTGTCCGCTCGTCTGTCGGAGGCGGAGCGCGAGGCCGCTGAGATGCAAGACTTCCTCGCCGCGGAGACCGGAGCCCTGGGGGACTCGCTCAGGGACGCCGAGGCGGAGATTGAAAAATTAGCTTCTGAACTAGAACGAAGACGCGGCGAGTGTCGTCAGTTAGTCCGTATGTGCGAGCAGCGCCGCCAGGAGGCGTTAGCGGCGAGCGCGCGGGCTCGGCGCGGCGCGGGCGCGGCGGCCGCTCTGGACGCGCTCGCCCGCCGTTTGCACGCGCTCACCGAGGCCGTGCGTGCGGCGTACCAGCTGCCCGCACACGTCGTGCACCCGACAGTCTTCCACAACGAGGCGTATTGCAGCCGTAGCGACAGCGGCGAGACCCTGTCTCCGTCGGAGGAGCCGCTCGGTCTCCTGGGAGCGGTGTCCCGGGCGCTCCGCTCGGCCTGCACACCTCTCGTGCATATGAATCAGCACGAGGACGACCGCTCCAGAATGTCCGATGACAACGACAACTCCGCAGACCTGCTAGACTCAGAAACGGAGCCCTGTCTCGTCACTGATCCGGAATACGCCGAGGACTGGTGGTCGGGGGCTGAGGGGGTGGAAGGGGGGGACGGCGCCGCCGGGTCCAGCAACGATGACCTCAGCCCGGAGAGGGAATCAGCAGATGTCGACAGAGAGGTGGAGGGGTCCGCTGAGTCTTCGGTGTCGGAACGGGAGTCGCTTCGAAAATTGTCAGCGGCCATTTCGAGGCAGCGCTGGGAGGCCGAGGCCGAAGCGGACGAGGCGGCTCGTGGAGCTCTGTTGGACAGAGTGTTGTTGCTGGACTTACGCCTGGCGGACCTCTTGCGCGCTCTGGCAGCCGCCGCCTCCGCCTCGGCGGCCTCGACCACCACCCCCGCCTCGACTTCTTCACCAGATACCACCGCTGCGCTCGTTAACGCGCTCAGAGACAAAATAGAAGTTACAGAAAAGAATGTTGCCGACGTTGTCGTCAAGAAACTCGCCGAGCTTGAAGCTTGTAAGAACCTCATAGAACAGTATCAACAAAATATAGAAGCGCTCAAAAACCAGGTCGTTCAGCGCGTTGAAGAAGACGATAGCGAGCTAATAGAACAGGAATTAAACTCTTGTGATCCAAATGAGCGAAGTCGAAGATGCGAAGCCGTGGAAGCGGCGTTAAGCGCTCTACCAGCACGTCCGCGACTGTTGCCGCTCCGCACCCGACTGCAGCGTTTGGCGCGAGCGTTAGCGCCCGCGTCTCCCCCCACCCCGCCCCCCGCGCACACTTCACCCGCCGCTACGCCAACCGCCTGCACATAA

Protein sequence:

>DPOGS212167-PA
MAEENKNALVACDPPPNFNNLDATTNSNQPLESKGHNIIDISIAAVKEDSDIVPVKVDDSKNANVNVKQDLVRNGSCDAIDDVRSLGDLDSLPVGDDLVLGAAGSDSGVEGCGRALSSGGGSRSCASSVVSCGSGCGSESSSLAGAPPRPRRRVNITVQEPKRSSPVNLSSRPITAPRGPNLATRERARSREKPTPPEKPRPLTPKPKIRPTADLPNLVRESPALRAKPTKTSTARCRTPNSPVDEKKWPTNGHVQRLPNATDASATRVAADKYGTLPRRRRDADPESSPKHESIPPTSRRPTVTRSVSSRSTKTRVRIYAEKTCQTVLVGADIESALAGFVPNIERRDVTLCHRGVQASSRDTETARLVAAVAAAEAAAAEEKERRQHVETQLAAERSARLAAISELERNSQRLLELAGAGAGAGAEGCLRALEEQLRSARELSTRQRTEIDSLREHCDKLHAEWCRVRESRRVLSARLSEAEREAAEMQDFLAAETGALGDSLRDAEAEIEKLASELERRRGECRQLVRMCEQRRQEALAASARARRGAGAAAALDALARRLHALTEAVRAAYQLPAHVVHPTVFHNEAYCSRSDSGETLSPSEEPLGLLGAVSRALRSACTPLVHMNQHEDDRSRIRDVTLCHRGVQASSRDTETARLVAAVAAAEAAAAEEKERRQHVETQLAAERSARLAAISELERNSQRLLELAGAGAGAGAEGCLRALEEQLRSARELSTRQRTEIDSLREHCDKLHAEWCRVRESRRVLSARLSEAEREAAEMQDFLAAETGALGDSLRDAEAEIEKLASELERRRGECRQLVRMCEQRRQEALAASARARRGAGAAAALDALARRLHALTEAVRAAYQLPAHVVHPTVFHNEAYCSRSDSGETLSPSEEPLGLLGAVSRALRSACTPLVHMNQHEDDRSRMSDDNDNSADLLDSETEPCLVTDPEYAEDWWSGAEGVEGGDGAAGSSNDDLSPERESADVDREVEGSAESSVSERESLRKLSAAISRQRWEAEAEADEAARGALLDRVLLLDLRLADLLRALAAAASASAASTTTPASTSSPDTTAALVNALRDKIEVTEKNVADVVVKKLAELEACKNLIEQYQQNIEALKNQVVQRVEEDDSELIEQELNSCDPNERSRRCEAVEAALSALPARPRLLPLRTRLQRLARALAPASPPTPPPAHTSPAATPTACT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: