MonarchBase - Protein-coding gene

DPOGS210180
Transcript	DPOGS210180-TA	3051 bp
Protein	DPOGS210180-PA	1016 aa
Genomic position	DPSCF300393 + 96406-118764
RNAseq coverage	246x (Rank: top 42%)

Annotation
*Heliconius*	HMEL012752	84.59%
*Bombyx*	BGIBMGA014194-TA	79.38%
*Drosophila*	Vps35-PB	58.08%
EBI UniRef50	UniRef50_E2BGH6	64.60%	Vacuolar protein sorting-associated protein 35 n=7 Tax=Formicidae RepID=E2BGH6_HARSA
NCBI RefSeq	XP_392327.2	64.65%	PREDICTED: similar to vacuolar protein sorting 35 isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|307207458	64.60%	Vacuolar protein sorting-associated protein 35 [Harpegnathos saltator]
NCBI nr blastx	gi\|307207458	64.27%	Vacuolar protein sorting-associated protein 35 [Harpegnathos saltator]

Group
KEGG pathway
InterPro domain	[106-1012] IPR005378	0	Vacuolar protein sorting-associated protein 35
Orthology group	MCL14243		Single-copy universal gene

Nucleotide sequence:

>DPOGS210180-TA
ATGGCCTCTTCGGGTTTGCCGACGTGTCCCGGTAGCTCAGCGACGAGGAGACGCAACGAGAACGGTACCAACGAGCCGCCCTCAAGTAGCCTGTCCGTAGAAGCTCCCGGAGCCCTGCCTCGTCCCGACTCACATGCTCCGCTCGGACCACACCACGGCTACCAGCTGATGACACACCAAGATACTTCACAGCTATCTCTTGAAGTGCATCAGCCTGGTTCGGGTCCAATTGTATCAAAGAATGTTGATGGATCTGGTAAGCTGGTAGCCGGGACTGCAGTTGCCGAACTCACAGTGGGTATTACATTAGCACAAATGACAAACCAGGCGTCGCCCGTAGAGGAGCAGGAGAAGCTTTTGGAGGAAGCGTTAAGCAATGTAAAATTTCAGGCATTTCAGATGAAAAGATGCCTGGACAAATCAAAACTTATGGATGCATTGAAACACGCTTCTACAATGCTGGGAGAGTTGAGGACATCACTTTTGTCACCAAAGAGTTATTATGAATTATACATGGCAATTACTGATGAGCTCCGCCACTTGGAACTGTATCTTCTAGAAGAATTCCAGAAGGGTCGTAAAGTTGCAGATTTGTATGAACTAGTACAGTATGCTGGGAATATTGTACCTCGTTTGTACCTATTAATAACAGTCGGATTAGTTTACATCAAAACTAATACAAATTTAAGGAGGGATTTGCTCAAGGATCTGGTTGAAATGTGCCGTGGCGTGCAGCATCCGTTACGCGGGCTGTTTCTCAGGAATTATCTCCTCCAGTGTACAAGGAATGTTCTGCCCGACACCGTGGAAGCGGAGAATGAAAATGAGGGGAATGTCAGAGACGCTATTGACTTTGTGCTGATGAATTTCGCCGAAATGAATAAGCTGTGGGTCAGGATGCAACACCAAGGACATTCGAGGGACAAAGAGCGTCGTGAGCGTGAAAGATCAGAACTTCGCATCCTGGTTGGCACCAATCTTGTCCGAGTGTCACAGCTGGAGTCTGTCAGTGAGGCGGATTATCGGAGGCTGGTGCTGCCAGCTATATTGGAACAGGTCGTCTTCCCCGATGAGTTTCACTTGGCAAACCTTCAGCCGTTCCTGAAGTCATGCGCTGAACTGCAGCCCGGTGTTAACATAAAGAACATCATTATAGCGCTCATTGAACGACTTGCCGCCTACAGTCAGCTCCTAACAACAAAACCAGACATGGCAATTACTGATGAGCTCCGCCACTTGGAACTGTATCTTCTAGAAGAATTCCAGAAGGGTCGTAAAGTTGCAGATTTGTATGAACTAGTACAGTATGCTGGGAATATTGTACCTCGTTTGTACCTATTAATAACAGTCGGATTAGTTTACATCAAAACTAATACAAATTTAAGGAGGGATTTGCTCAAGGATCTGGTTGAAATGTGCCGTGGCGTGCAGCATCCGTTACGCGGGCTGTTTCTCAGGAATTATCTCCTCCAGTGTACAAGGAATGTTCTGCCCGACACCGTGGAAGCGGAGAATGAAAATGAGGGGAATGTCAGAGACGCTATCGACTTTGTGCTGATGAATTTCGCCGAAATGAATAAGCTGTGGGTCAGGATGCAACACCAAGGACATTCGAGGGACAAAGAGCGTCGTGAGCGTGAAAGATCAGAACTTCGCATCCTGGTTGGCACCAATCTTGTCCGAGTGTCACAGCTGGAGTCTGTCAGTGAGGCGGATTATCGGAGGCTGGTGCTGCCAGCTATATTGGAACAGGTCGTGAGCTGCAGGGATCCCATAGCACAGGAATATCTCATGGAGTGTATCATACAGGTCTTCCCCGATGAGTTTCACTTGGCAAACCTTCAGCCGTTCCTGAAGTCATGCGCTGAACTGCAGCCCGGTGTTAACATAAAGAACATCATTATAGCGCTCATTGAACGACTTGCCGCCTACAGTCAGAGGAACGAGGGGAATGTGAATCTGAGTGTTGTCCTTGATGATGGACAGGAACAAGAGGTGCAATTGTTCGAGGTGTTCTCTGATCAGGTCGCTGCCATCACTCAGAGTCGCACAGACATGCCGCCGGAGGACATGCTCTCTCTGCAGCTGGCGCTGTTGAAACTAGCACAGAAATGTCACCCTGACAAGCTGTCTTATGTGGACAGGGTGTTAGCTCACACCGACAGGATATGTGTAGACATACTACCATCAGGAAAACCATACTTGGAGCACAATACACCCGTGTTCAAAGAGCTCATGAAGATACTGAAGCTGCCAGCTGATCATTACAAGAACATACTCACATTGATCAAGCTCCAGAACTACGCTCCACTCATCAACAGGCTGAGCCAGCCCGGCAGGATGCTGATAGCTGTTCATCTTATCAACGACGTCCTCGAGAGCAATACAACTGTCTCCACACCAGAAGATTGGGCATTGAACGATGCGTCCCGAGCTCTTGACTGTCTGAAGAAAGCGGCCCGCGTCGCCCAGCAGTGTATGGACGGAGGTGTGCAGGCCCAGCTGTTGGCTGAGCTGCTGGGTCGGTACGCGCTTCTCAGGGAGAGGGGACACGCCAGCCTCACCGCGCCTCTCATACAAGCGGTAGGACTGATCCACCACTTCAAGTCGGACTCGGCCGACCAGCAGTACCTCATCTTGAGCACCGCCCGCCGCCTGCTGCAGGGCGGGGGCGCCGCCCGCATACAGCACACTTTCCCGCCGATAGTGTTCCACGCCTACTCGCTGGCATTCACCTACCACCAGCTCAAGGACCAGGATGAGATGTGGGAGAAGAAATGCCAGAAGATATTCCAGTTCTGTCATCAGACGATCAGTTTGCTGGTGAAGGCCGAGCTCGCTGAACTCCCACTAAGATTGTATCTCCAAGGAGCTCTCGCTATAAGCGAGATAGGTTTCGCTAACCACGAGACCATAGCCTACGAGTACTTATCACAGGCGTTCTCGTTGTATGAAGACGAAATATCGGACAGCAAAGCCCAACTGGCGGCCATCACGCTAATAATAGCAACGTTCGAACAAATCAATTGCTTCGGACAGATTTTAATTTGA

Protein sequence:

>DPOGS210180-PA
MASSGLPTCPGSSATRRRNENGTNEPPSSSLSVEAPGALPRPDSHAPLGPHHGYQLMTHQDTSQLSLEVHQPGSGPIVSKNVDGSGKLVAGTAVAELTVGITLAQMTNQASPVEEQEKLLEEALSNVKFQAFQMKRCLDKSKLMDALKHASTMLGELRTSLLSPKSYYELYMAITDELRHLELYLLEEFQKGRKVADLYELVQYAGNIVPRLYLLITVGLVYIKTNTNLRRDLLKDLVEMCRGVQHPLRGLFLRNYLLQCTRNVLPDTVEAENENEGNVRDAIDFVLMNFAEMNKLWVRMQHQGHSRDKERRERERSELRILVGTNLVRVSQLESVSEADYRRLVLPAILEQVVFPDEFHLANLQPFLKSCAELQPGVNIKNIIIALIERLAAYSQLLTTKPDMAITDELRHLELYLLEEFQKGRKVADLYELVQYAGNIVPRLYLLITVGLVYIKTNTNLRRDLLKDLVEMCRGVQHPLRGLFLRNYLLQCTRNVLPDTVEAENENEGNVRDAIDFVLMNFAEMNKLWVRMQHQGHSRDKERRERERSELRILVGTNLVRVSQLESVSEADYRRLVLPAILEQVVSCRDPIAQEYLMECIIQVFPDEFHLANLQPFLKSCAELQPGVNIKNIIIALIERLAAYSQRNEGNVNLSVVLDDGQEQEVQLFEVFSDQVAAITQSRTDMPPEDMLSLQLALLKLAQKCHPDKLSYVDRVLAHTDRICVDILPSGKPYLEHNTPVFKELMKILKLPADHYKNILTLIKLQNYAPLINRLSQPGRMLIAVHLINDVLESNTTVSTPEDWALNDASRALDCLKKAARVAQQCMDGGVQAQLLAELLGRYALLRERGHASLTAPLIQAVGLIHHFKSDSADQQYLILSTARRLLQGGGAARIQHTFPPIVFHAYSLAFTYHQLKDQDEMWEKKCQKIFQFCHQTISLLVKAELAELPLRLYLQGALAISEIGFANHETIAYEYLSQAFSLYEDEISDSKAQLAAITLIIATFEQINCFGQILI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: