MonarchBase - Protein-coding gene

DPOGS210438
Transcript	DPOGS210438-TA	2148 bp
Protein	DPOGS210438-PA	715 aa
Genomic position	DPSCF300062 - 233865-238249
RNAseq coverage	422x (Rank: top 29%)

Annotation
*Heliconius*	HMEL015112	0.0	71.85%
*Bombyx*	BGIBMGA001957-TA	0.0	65.06%
*Drosophila*	tamo-PA	2e-44	40.30%
EBI UniRef50	UniRef50_D6WTX9	3e-61	33.19%	Tamo n=1 Tax=Tribolium castaneum RepID=D6WTX9_TRICA
NCBI RefSeq	XP_001809413.1	5e-62	33.19%	PREDICTED: similar to GA17922-PA [Tribolium castaneum]
NCBI nr blastp	gi\|383865777	4e-62	36.12%	PREDICTED: uncharacterized protein LOC100877493 [Megachile rotundata]
NCBI nr blastx	gi\|307202244	1e-79	32.03%	Protein tamozhennic [Harpegnathos saltator]

Group
Gene Ontology	GO:0008270	0.0001	zinc ion binding
	GO:0005622	0.0001	intracellular
KEGG pathway
Orthology group	MCL17451		Insect specific

Nucleotide sequence:

>DPOGS210438-TA
ATGATCATGTCGAGCATGATGGGTGATGCTATGTTAAGAGAACGTCTGCCTGCCTTATGGCGGCGGATAGAGGACGCGCATTACAGCTATTTGGAGGTAGACGACAGCCCCGAGAAGTTACTGCAGAAGAAAAAGTTAGAAGGCTATATCCTTGAATACCTTACGCTGGTGCCTCATGAGTGTAAGTTTGGACTAGCAGAGGCTGCTAAGATCTTCCAACGTACTATAGACGAGTTGCCCGATTACAGCGCGTATCGTGCTAGTATAGGCTGGGCGGCCATCGCCAGATACGCCGGCAACCTGCTGGCACAACCATGGAGGAAGGAGTATAAGGAAATACGGCTGTACTCCGGTTTCTACAAGCACGAGGTCGAGTCTAACCTGGTGTGTGCCGAGAGCCTTCTTCATATCCTGGGCTATAGACCATCTGGCCCGGGAAAACTCGCGCTCGACGGGCCCGTGTGCCCGGACATGGCCGCTGCCATATCGAGGGACGCCATCATCGCTTACTGCGAGTGTCAGATAATGTCTGAGATCTGGGAGAGCGTGTGGTCTAACGGCGGCAGAGTGTCGTGGGCGGCGGTGTCTCGGGAGCGAATTGCACGAGCTTCATCACCTTCCTCCGCGGCAGCGAGACTAGCCGGGTGCGGAGAATCTGAAATCTACTCAAATTTACCAGCGACATCAGACCAAAGGAGGATAGAAGCTGATCACACGTCATATCAGATGCCCCCGCCGTGTTACTGTGCGGACCAGGTCGAAGAACCGGTGCAACCCATAATAAACCCCTACCTTATACCTAAAATGCCGCCTATGATGTACGAACTGCCGCCCATGCAGTGCAATCCAGTGCCCATTATGACCCCGTACGGCGTTCCGTATTATTACCCCGTGCAAACGCCGTACATGATACCCACGCCGGTTTACGCGCCAATAAAACACGCGACAAATATACCGGTCAATGGTTATCCCCCGATATATCTGGATATGCCAGCTGTGCCCACTGCGCAGCTGATTGAGCTGGACGGAGCTTCGGTTTACGAGAACGGTAAATTTGGAAGGCAGGATGATAGGGGCCATAAGAGGAATAGACACGCCGAGTCGAAACGTACATCGAAATCCGGGTTCAGTGACGTCTCCCTGCCCAGTCTGCCGCGATCTGACACTCAGCCGGCGTTGAGTAAGGCGAAGGAAGACGGCATGGGCACTTACGAGAGTTGGGACTATGTTTTTCGGAATCTATCTAGCAAGGAACGCCATGGAGATAGCAGAAGTGGGTTTTCTCAATCGCTGGACAGAGATTCAAGGACGCTCGATAGGTTGGACAGAGAAGAGAGGAGATCTAAATACCAACCTACCACCCTAGACTTAGAAGACGGGCTCCAAGCTTTAAACTTGGATAGATCGTATGACGAAGACGCGTATCGGACGGCTAAGGTGAACGAGAATTTAATGAGGCTGAAGCAGGAGCAGGAGTTAAAAAAATCAAAGCAGATGAAGAAGCAAACAGAAGATAAACGACCGAAAAAAACCCTAGAACCCGTTGGCAACCCTAAGGCTGATGGTCTCATCACACCGAAGGTTGCACCGGATAAGGTTAAACTGCTGACCAAAAAGGAGATTAAGGATAGGAAGGACGTCATCAAGCAGCAAAACTCAAACGTCGAGTCATTATCAAGCGTGGCCGATGTCAAGAGAGTCAAGAAAGTATCCAAGCTCATACCGTCTGATGCTGATAAAAAAATTAAACCTTTAGAAAATGGCCTCCATAAGGCACAGAGCTCTAAAACTAATACAGTCGCAAATCAATCAAATCACGATTTGAAAGCACAACTGGTCGTCTCGCTCGACGAACCCGATTACAAGCGAACACCGAAACAGAACGGCGAACGCGAACGAACACCGAACCGAACGGACGAGGGGACTGACACCAGGAGAGACAAATGGGAGTGTAATACATGCACATACCTCAATAAGAACGCGGCTGTAGCGTGCGAGATGTGCGGGAAGTCGAAAAAGGGACCGGAAATCGAACCACTGACTTCCGGTGGCAGGGAATGTCCAGCCTGTACTCTGGTCAACAAACGGGAAGCCAGAATATGCGACGCTTGCGGCACGAGTCTAGACCATTGTCCTACATACATATAA

Protein sequence:

>DPOGS210438-PA
MIMSSMMGDAMLRERLPALWRRIEDAHYSYLEVDDSPEKLLQKKKLEGYILEYLTLVPHECKFGLAEAAKIFQRTIDELPDYSAYRASIGWAAIARYAGNLLAQPWRKEYKEIRLYSGFYKHEVESNLVCAESLLHILGYRPSGPGKLALDGPVCPDMAAAISRDAIIAYCECQIMSEIWESVWSNGGRVSWAAVSRERIARASSPSSAAARLAGCGESEIYSNLPATSDQRRIEADHTSYQMPPPCYCADQVEEPVQPIINPYLIPKMPPMMYELPPMQCNPVPIMTPYGVPYYYPVQTPYMIPTPVYAPIKHATNIPVNGYPPIYLDMPAVPTAQLIELDGASVYENGKFGRQDDRGHKRNRHAESKRTSKSGFSDVSLPSLPRSDTQPALSKAKEDGMGTYESWDYVFRNLSSKERHGDSRSGFSQSLDRDSRTLDRLDREERRSKYQPTTLDLEDGLQALNLDRSYDEDAYRTAKVNENLMRLKQEQELKKSKQMKKQTEDKRPKKTLEPVGNPKADGLITPKVAPDKVKLLTKKEIKDRKDVIKQQNSNVESLSSVADVKRVKKVSKLIPSDADKKIKPLENGLHKAQSSKTNTVANQSNHDLKAQLVVSLDEPDYKRTPKQNGERERTPNRTDEGTDTRRDKWECNTCTYLNKNAAVACEMCGKSKKGPEIEPLTSGGRECPACTLVNKREARICDACGTSLDHCPTYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: