MonarchBase - Protein-coding gene

DPOGS211085
Transcript	DPOGS211085-TA	1770 bp
Protein	DPOGS211085-PA	589 aa
Genomic position	DPSCF300007 - 1204514-1207032
RNAseq coverage	102x (Rank: top 61%)

Annotation
*Heliconius*	HMEL012491	86.59%
*Bombyx*	BGIBMGA002965-TA	91.17%
*Drosophila*	CG7371-PA	65.59%
EBI UniRef50	UniRef50_B0WGM0	65.08%	Vacuolar protein sorting n=5 Tax=Culicidae RepID=B0WGM0_CULQU
NCBI RefSeq	XP_973597.1	68.42%	PREDICTED: similar to CG7371 CG7371-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91083225	68.42%	PREDICTED: similar to CG7371 CG7371-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91083225	68.42%	PREDICTED: similar to CG7371 CG7371-PA [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[1-590] IPR007258	0	Vps52/Sac2
Orthology group	MCL10453		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211085-TA
ATGGAAAGCATGCTGTTGGTTTTTCAGAATGATTTGGGAAGCATAAGTAATGAAATTATTAGCTTGCAAAAACGTTCTGTTAATATGTCCGTTCAACTTTCCAACCGTCAAGCACTTAAAGGTCCACTGTCATCATTCATAGAGGATATTGTAGTCTCCGAAACTCTTATTTTTGGTATCAACAACGTTCCTGTAGTTGACAAAGAATTCATGATACAACTGGCTATACTGAACCAAAAACTTAACTTTGTAAAAGAACAAGAATTCAAAGAGACGAAAGCATGTCATGATGTTAAGGACATCTTGGAAAAGTTGAAAATCAAAGCTGTGGCTAAGATAAGGACATATATATTGGAACAGATATATAAATTTCGGAAACCGATGGCCAACTATCAAATCCCACAGAATGCAATGTTAAAATATAAATTCTTTTTTGAATTCATATTATCCAATGAGAGAAATGTCGCACAGGAAATTTGCAATGAATACATTGATACATTGAGCAAAGTCTACTACTCATACTTCAAGTCTTATGCTTCTAGATTAGATAAATTGAAATATGAAGAAGTTCCCACAAAAGATGATCTAATGGGCATAGAGGATGGCTCGAAAGGGGGTTTCTTTCAAAAATCCAATCTTAAAAATAAAAGCACTATATTCACTATTGGTAATAGAGGCGATGTGCTCGCTCAACAATTAGAGGCTCCTATAATTGTTCCTCATGTGCAACAAAAGACAAAGTATTCCTATGAAGCACTCTTCAGAAGCTTACAATATGCGTTAGTGGACAACAGTTGCAGGGAATACTTGTTTACAACGGAATTTTTCCATGTAAAAGGCAGTCATGCTCAGGAATTGTTCGACAGGATACTTGGCAGAACACTGTCTTTACTTGTGAAAAATGTTGAGAACTATGTGTTGGAGTGTTATGATTGTCTCGCGTTGTTTCTATGCATACAACTTATAAATAGATATCGATGGATGTGTCACAAGAGAGCTGTAGCCGCATTGGACAGTTACTGGGATTCCTTATTGGGGACACTTACACCCAGATTGGAATACATTCTTAAACTGAACATTCAAAGTGTCAGAGATTGTGATCCAGCCAAGTTATCAAATAAAGAGATGGGACCTCATTATATAACAAGGAGATACGCTGAATTTTCTGCGGCAATGCTCAGTTTGAGCGAGCAGTTTCCCAATGAAGAGCAAAGTAACCTTCTACTTGCAATGCAAGACGAAGTACATTGTTTCTTGTTAAAGATGGCGGCTGAATTCCCTCAGAGAATACAGCAATTGATATTTTTGATAAACAATTATGATATGGTCTTGAATATTTTAATGGAAAGAACCAGAGACAATACAAAGGAGGCGGAAAGTTTTAAGGAGCAATTACAAGCTAGAAGCTCAGAGTATGTCGAAGAAATACTCAGCCCACATTTTGGAGGTCTCATGCAGTTTGTTAAGGAAGGGGAACAATTACTTGAAAGTGATAAAAAGAATGAACTTGCGAATTTGGAAAAGAAATCCTTGTCGCTGGTCACATCTTTTACAACGAGTTGGAAGCAGAGTCTTGAAGAAATACACAGAGAAGTGCTGGTGTCATTCCCGAATCTAGTTACCGGCTCGGGTTTATTACAAATGGCTCTAACAAATTTTGTTCAGTATTATCATAAGTTTGTTAAACTCCTAACCCCTAATGCACGCACCCAACTTGTAAATATTCATGTTATAATGGTTGAAATCAAGAAATATAAAACAAATTATTGA

Protein sequence:

>DPOGS211085-PA
MESMLLVFQNDLGSISNEIISLQKRSVNMSVQLSNRQALKGPLSSFIEDIVVSETLIFGINNVPVVDKEFMIQLAILNQKLNFVKEQEFKETKACHDVKDILEKLKIKAVAKIRTYILEQIYKFRKPMANYQIPQNAMLKYKFFFEFILSNERNVAQEICNEYIDTLSKVYYSYFKSYASRLDKLKYEEVPTKDDLMGIEDGSKGGFFQKSNLKNKSTIFTIGNRGDVLAQQLEAPIIVPHVQQKTKYSYEALFRSLQYALVDNSCREYLFTTEFFHVKGSHAQELFDRILGRTLSLLVKNVENYVLECYDCLALFLCIQLINRYRWMCHKRAVAALDSYWDSLLGTLTPRLEYILKLNIQSVRDCDPAKLSNKEMGPHYITRRYAEFSAAMLSLSEQFPNEEQSNLLLAMQDEVHCFLLKMAAEFPQRIQQLIFLINNYDMVLNILMERTRDNTKEAESFKEQLQARSSEYVEEILSPHFGGLMQFVKEGEQLLESDKKNELANLEKKSLSLVTSFTTSWKQSLEEIHREVLVSFPNLVTGSGLLQMALTNFVQYYHKFVKLLTPNARTQLVNIHVIMVEIKKYKTNY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: