MonarchBase - Protein-coding gene

DPOGS202363
Transcript	DPOGS202363-TA	1899 bp
Protein	DPOGS202363-PA	632 aa
Genomic position	DPSCF300104 - 158821-168868
RNAseq coverage	1034x (Rank: top 12%)

Annotation
*Heliconius*	HMEL002889	7e-149	70.98%
*Bombyx*	BGIBMGA013997-TA	4e-172	76.73%
*Drosophila*	simj-PB	1e-66	41.65%
EBI UniRef50	UniRef50_E3X649	9e-75	41.37%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3X649_ANODA
NCBI RefSeq	XP_968148.1	5e-77	39.06%	PREDICTED: similar to simjang CG32067-PC [Tribolium castaneum]
NCBI nr blastp	gi\|91086667	1e-75	39.06%	PREDICTED: similar to simjang CG32067-PC [Tribolium castaneum]
NCBI nr blastx	gi\|91086667	1e-95	39.71%	PREDICTED: similar to simjang CG32067-PC [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL10974		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202363-TA
ATGGACGTTGACGACTCCGCCGTCGATCTTAGCGTGAGCAGGTCTTTACCGCCTGAACTCAGTGAACTAAGAGCTCTCACTGCCAGCGGACTAACCATAACACCTGCACAACCACCGCCTCATGGTTCGGCTGGTAAGAGGGTACTTCGCCCCCGCGCCGATCAGCGCAGTTACGCGGAGAGCCCTGATATAGTGCTGCTGCCCGCAGACCCTCCGCACAGGAAGCCGGTGTTGCCAGCACCTTCACCGTTTACCGATGTCAGCAGTAAGTTGAACACAAACGTCAACCTGTCTATAACGGCCAGCGAGTGTGCCAGGGACCCCATGGACGACGAAGAGTCTGACGGAGAGAACGAACCACCCCTCCCAACACCCGCGCACAGGGAGCTATCCAGCGCTGAGATATGGGAACGAGAGCGACGTCTGAGATCACTGCGAGAGAAGCTGCGGGCGGAGGAGACGCGCCTCGTACTCCTAAGGAAGCTGAGACAATCACAACAAGCCACTGTCACGACTACTAAGGAGTCTGTGTGCCCGTCCCCCGGCACGGCCCTGGCCGGAAGCGGGTGTGTGGTGCCCCCCGGGGTCACGGTCACCCCCGCCCCGCCGCCCGCGCACCAACACGCCAAGCGCGGTAGTGTGTCGGGCGCCGCTGGCAATCTGTCCACGGCTAGGCGCACGGCCAGTCTGCCAGGGGGCGCCACTCTCACGCCGGGCCCGTACAGGACTCAGTCATCAGGGGGCGCTAGCATCACTCCATCGGTGACGATCACACCAGCGCCGCCTCCGACACACGCCCACAATAACAACAACACTACCAACAACAATAAGGCCAGTTCTCGCAGCTCCGAGGACCCGCAGACGCCGGCCCAGAGGCAGGCGGCCGCCAAACTGGCGCTCAGGAAACAGCTGGAGAAGACACTGTTACAGATCCCGCCTCCCAAGCCCCCCCCGCCGGAGATGAACTTCATCCCCTCCCCCAGCAACACGGACTTCGTGTACCTCGTGGGGCTGGAACACGTGGTGGACTACCTCACTAACGAGGACCGGATGCCGCGGTCGTCGGTGCCGGCGGTGTGCGCGCAGTGCGGCTGCGACTTCACGGCCGTGTGGCGCTGGGAGCGCGCGCCCGCCCGCAGGCAGGACGCCACCTTCCCGACGCCGCACACGCACACGCCGCGCAGGCTGTGCGAGCTCTGCGTCTCCGGGAACGTCAAGAGGGCGCTCAAGGCGGAGCACACGGCCAGGCTGAAGACGGCCTTCGTCCGAGCGCTGCAGCAGGAGCAGGAGATAGAGAGACGACTGGCGGCGCCCAGCCCGCCGCCCCCCGCCAGCGCGGCCCCGCCGCCCGCCCACACGCACCATCACAGACCGCAGACGCTAGAGGTCATCATGCGGAGCGGGCCAGGGACAACGAGGGGAACAATAAGAAAGGTAACACACGGACATACACACATGGACATGTACATATATAATATACTATGGACAGAGTTATATGCAGATGCTATTACAGGGTCTTCATCAAGCACCAGCAGTCAAGGGAGCAGCAAACAACATCAACTGGCAGCAGCTGCGGCCGCTCAGATGGCCTTCGAGCAGCAGAGCGCGGCCGCCATGCAGGCGTTGCAGCACCAGCTGCTGAGAGGTCTGAGCGGCGCGGGCGGGACGGGCGGCGTGTCGCAGGCGGCGGCCGCGGCGGCCATGATGCAGTTCTCTCCCCTGCTCTACACATACCAGCTGGCCATGGCCCAGGCCAGCGCTCTCGGCAAGAGATCCGGCAAAGGTTCGAGTAACGCCGCCATGGCCGCGGAGATGCAGCGCGTAGCCGAAGCTCAGAGACAGTACCTACTGGACATGATCCCGGGACAACACGCGCGCAACCCCTGGACCAAGAACTAG

Protein sequence:

>DPOGS202363-PA
MDVDDSAVDLSVSRSLPPELSELRALTASGLTITPAQPPPHGSAGKRVLRPRADQRSYAESPDIVLLPADPPHRKPVLPAPSPFTDVSSKLNTNVNLSITASECARDPMDDEESDGENEPPLPTPAHRELSSAEIWERERRLRSLREKLRAEETRLVLLRKLRQSQQATVTTTKESVCPSPGTALAGSGCVVPPGVTVTPAPPPAHQHAKRGSVSGAAGNLSTARRTASLPGGATLTPGPYRTQSSGGASITPSVTITPAPPPTHAHNNNNTTNNNKASSRSSEDPQTPAQRQAAAKLALRKQLEKTLLQIPPPKPPPPEMNFIPSPSNTDFVYLVGLEHVVDYLTNEDRMPRSSVPAVCAQCGCDFTAVWRWERAPARRQDATFPTPHTHTPRRLCELCVSGNVKRALKAEHTARLKTAFVRALQQEQEIERRLAAPSPPPPASAAPPPAHTHHHRPQTLEVIMRSGPGTTRGTIRKVTHGHTHMDMYIYNILWTELYADAITGSSSSTSSQGSSKQHQLAAAAAAQMAFEQQSAAAMQALQHQLLRGLSGAGGTGGVSQAAAAAAMMQFSPLLYTYQLAMAQASALGKRSGKGSSNAAMAAEMQRVAEAQRQYLLDMIPGQHARNPWTKN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: