MonarchBase - Protein-coding gene

DPOGS207892
Transcript	DPOGS207892-TA	3333 bp
Protein	DPOGS207892-PA	1110 aa
Genomic position	DPSCF300101 + 238562-243831
RNAseq coverage	420x (Rank: top 29%)

Annotation
*Heliconius*	HMEL010244	0.0	56.75%
*Bombyx*	BGIBMGA008479-TA	1e-172	67.35%
*Drosophila*	CG32685-PC	1e-81	43.45%
EBI UniRef50	UniRef50_D2A1C7	4e-99	57.06%	Putative uncharacterized protein GLEAN_07111 n=2 Tax=Tribolium castaneum RepID=D2A1C7_TRICA
NCBI RefSeq	XP_975380.2	6e-100	57.06%	PREDICTED: similar to YLP motif containing 1 [Tribolium castaneum]
NCBI nr blastp	gi\|189236763	1e-98	57.06%	PREDICTED: similar to YLP motif containing 1 [Tribolium castaneum]
NCBI nr blastx	gi\|345491547	3e-104	38.37%	PREDICTED: hypothetical protein LOC100122795 [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL12947		Single-copy universal gene

Nucleotide sequence:

>DPOGS207892-TA
ATGGCTTGGTCTATGCCTACGGGTCAATGGAATTCCGGCATTTCCATGACGCCAGATATTAATATAGCTAGTATGGGATCATACACACCAGAACAGTGGGCGCTAATGCAACAACAGAACTGGCAGCAGTGGGCACAATGGCAACAACAGTATGCTCAATGGCAAAGCCAGTATGGTGACAAGTATACTCAGCATATGCAAGCCCTTCATGCTATGAGCGGGATACCACCTCCAGCTCCTAATGCGGTTCCACCCCCAGCTCCACCTCCACCGGAAAAGCCTCCTCCACCACCACATGAAAACAACCAACCTCTGTACGGAAATACACCATCGCAAACACAGTCTGTGTCACACACGCCCCATCTTCCATACTCTAAAGTTGGTTATAATGTGGTTCCTAAAACAGGTAACAATTTTAATCAAACTTCCACAATAGATTCCATGTCCGATTTACCGACCTCTCAGGTTGTAAACACGGATGCGCTCATGAAGCTAGCTGAGGAGGAGCGTTTGTTTGATATACAATTTCAAAAATGGGAAGAGGAAATAAAAAAGTGGAAAAATGAGAATGTTAACCACCCCGATAAAAGAGCTTATATGGAGTATGAGCAAAAGTTTGCCAGCTGTCGTGCACAATTGCTGGAGCGGCGTCAACAGATGAAGCTGAAAAGAGATAGTCTAATGGGTGTTAAAGCCACACAGACAGCAAACACTACAATTAACAGCACAGGTAATATATCAACAAGTATTCCTCCACCTACACAAAATATTAACAAAACCAACTATAATACAAATGTGCAAAACTCTCAAACAAAAAATAATGTTACCCAGAATTACATAAACCAAAATCAATCTCAGTATGAGCCAATTGGTCATTTACACCAGACAAGTTTTAATAGGAGTAATAAAAAGCCAGAACATCAAGACAGGTATGAATATTATGGGGATATGAGCAATGATTACACTACTACAAGTGACACTTCTAATTTCTTACCCACAAATGATTCTTTTAACGGCATACCGGGATTAGACTTGGTACCAGATGGTGATAAATCTGTACAAAAACAATTAGATGTAATTGATATAACAGAAGACAGACAGAATCAGCAACGGCAACAAAATATTCAAGCACCTGACTATTCAAAAATATCTAAAGGGATTAACAACATTCTTGGGGATGAAAAAATTATGAACATCCTTTCTATGATGAGCAGTCAGAATACTAGGAACGAAAGCAAAGTAGGTTCAGTTGGTTCTCACAGGCAAGAGCTGAATACTCAGTCTGGAAGCTTGCAATATAGTGGAAATAATAGCAGCTACCACGGAAATAATTACAATAATATGCAACCTCGGAACACGTCCTATCAACAGTCAAGTGAGAATTATACTAATCAAGCTTCAAGTTCTAGTTATACCGATCCTGATTACCAGAGATATGGGGGATCCTCTAACGAACAAAATGAAAATGTAAGAAGTAATGATATGGACAAAAACTATGAATACAACAGACTTGGGAATCAAAATATACAACAAACTAGGTCTAACATGCCAAGAGTTATGCAAAATTTACATTCAAAGCAAAGTGATTATCCGCAAGGGGATTTCGTAAGGAGGATGGATCTAGATGTAAAACAGATTCAGCCTTTAAAACCTAAATGGGTCGATGAACCTCTGTTCACACCCTCAATAATAGTTGAATATGAGCACAAACCATTAAGATTGAAAGCTCGAGATTTTATTGAGCCCGTGCACATGTTTGAATACAATCATCAATCTAAAGATGGAGAAAGTTCGAATAAGAAAAACTTCGATAAAGAATTAGATGATTTATTTTCAAGGAAAAGAAGAGCAGACGATGACTGGAGTAGTTCAGACAAATTTTATTCCAGAGATTATGATCGGAGAGGTTTAAAGGATGATGCGAGAGATAGAAATCGGCTGCGAGATGATCGTGATATGTATGATAGAAGAATTGATGACAGAAGACGTGATGACCGTGATAGATTTAGAAGAGAAGAATATGATAGGAGAGATAGAATAGAACAAGAACGATCCAGAGATATGGGGAGGGGGCGTGATGAAAGAGACAGAGATAGAGATATGGCTAGAGACATGGGTCGAGAGAGAGAGTTGGGAAGAGATAGAGATTACACTAGAGATAGAGATAAAGATTTCAATAGAGATAGGGATACAAGAGATAGAAGTAAAGAATATAGAAAAGATGAAAGAGATATAAGAAATCGTAGTCGAAGTCGTGATAAAGAAAATCGTAAAAGAGGACATAGCAGAGAAACGGAATGTTTTGATAATTATGGATTGAAAAAGAATAGAGATATAAAAGATGAAACGGTTCCAACGAATAAGCCGAAACATGTGGTGATGATAGATGACCTTCTAGAGCCTCCGGGGCGCACCATGAGACCGGACAAGATGGTTATAATACTCAGAGGTCCACCGGGAAGTGGTAAATCTTATTTAGCTAAACTGATAAGAGATAAAGAAGCCGAGCACGGGGGCACAGCAAGAATAATGTCCATAGACGATTATTTCATGCAGGAAGGTGAAATTGAAGAAAAAGATCCCATTACGGGAAAAATTGTGAAGAAGCCGTCACTGAAATACGAATACGACGAGAGCTCCGAGGAATCATATATGACATCGCTAAAGCGGGCGTTCAAGAGGAGTATCACGGATGGCTACTTTACATTCTTAATATATGACGCCGTGAACGATCAGTTGAAGTCCTATGCTGATATTTGGAATTTCTCAAGGCAGAATGGCTTCCAGGTGTACATATGTACGATGGAAATGGATCCCCAAGCTTGCTTCAAGAGGAACATACACAATAGATCGTTGCAAGACATAGAAGCTATAGTTTCTAGTTTTTTCCCAACCCCAGCACATCACATACAGTTGGATCCGACGACCTTACTCCAGAGTGCGTCCATTCGGGAAGTACAAATGGAAGACGCCGATGACGTCACTATGGAGGAGGTGGAAAACCCTGAGGTCGATAATAGTTTTACGTCGAAATGGGAAAAAATGGAAGACGCCGCCCAACTAGCTCGTCTCGACGGCACTAGTCGGCCGCTGCGCTCGTCCCAGCTCTCCATGGAAGACTACCTACAGTTAGACGACTGGAAACCGAATACGGCTAAACCGGGAAAGAAAACTGTACGTTGGGCTGATATTGAAGAGAGAAGACAGCAAGAGAAAATGCGAGCCATCGGTTTTGTCGTAGGTCAAACTGATTGGAATAGAATGACTGACCCCACTATGGGGTCTAGTGCGCTCACGCAAACTAAATATATCGAGCGAGTCAGGCGGCATTGA

Protein sequence:

>DPOGS207892-PA
MAWSMPTGQWNSGISMTPDINIASMGSYTPEQWALMQQQNWQQWAQWQQQYAQWQSQYGDKYTQHMQALHAMSGIPPPAPNAVPPPAPPPPEKPPPPPHENNQPLYGNTPSQTQSVSHTPHLPYSKVGYNVVPKTGNNFNQTSTIDSMSDLPTSQVVNTDALMKLAEEERLFDIQFQKWEEEIKKWKNENVNHPDKRAYMEYEQKFASCRAQLLERRQQMKLKRDSLMGVKATQTANTTINSTGNISTSIPPPTQNINKTNYNTNVQNSQTKNNVTQNYINQNQSQYEPIGHLHQTSFNRSNKKPEHQDRYEYYGDMSNDYTTTSDTSNFLPTNDSFNGIPGLDLVPDGDKSVQKQLDVIDITEDRQNQQRQQNIQAPDYSKISKGINNILGDEKIMNILSMMSSQNTRNESKVGSVGSHRQELNTQSGSLQYSGNNSSYHGNNYNNMQPRNTSYQQSSENYTNQASSSSYTDPDYQRYGGSSNEQNENVRSNDMDKNYEYNRLGNQNIQQTRSNMPRVMQNLHSKQSDYPQGDFVRRMDLDVKQIQPLKPKWVDEPLFTPSIIVEYEHKPLRLKARDFIEPVHMFEYNHQSKDGESSNKKNFDKELDDLFSRKRRADDDWSSSDKFYSRDYDRRGLKDDARDRNRLRDDRDMYDRRIDDRRRDDRDRFRREEYDRRDRIEQERSRDMGRGRDERDRDRDMARDMGRERELGRDRDYTRDRDKDFNRDRDTRDRSKEYRKDERDIRNRSRSRDKENRKRGHSRETECFDNYGLKKNRDIKDETVPTNKPKHVVMIDDLLEPPGRTMRPDKMVIILRGPPGSGKSYLAKLIRDKEAEHGGTARIMSIDDYFMQEGEIEEKDPITGKIVKKPSLKYEYDESSEESYMTSLKRAFKRSITDGYFTFLIYDAVNDQLKSYADIWNFSRQNGFQVYICTMEMDPQACFKRNIHNRSLQDIEAIVSSFFPTPAHHIQLDPTTLLQSASIREVQMEDADDVTMEEVENPEVDNSFTSKWEKMEDAAQLARLDGTSRPLRSSQLSMEDYLQLDDWKPNTAKPGKKTVRWADIEERRQQEKMRAIGFVVGQTDWNRMTDPTMGSSALTQTKYIERVRRH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: