MonarchBase - Protein-coding gene

DPOGS208959
Transcript	DPOGS208959-TA	2454 bp
Protein	DPOGS208959-PA	817 aa
Genomic position	DPSCF300009 + 787445-796257
RNAseq coverage	1615x (Rank: top 8%)

Annotation
*Heliconius*	HMEL015776	88.64%
*Bombyx*	BGIBMGA002432-TA	86.83%
*Drosophila*	Vha100-2-PB	69.57%
EBI UniRef50	UniRef50_Q9VE75	69.57%	Vha100-2, isoform A n=19 Tax=Coelomata RepID=Q9VE75_DROME
NCBI RefSeq	XP_001657344.1	71.98%	vacuolar proton atpases [Aedes aegypti]
NCBI nr blastp	gi\|347966205	72.49%	AGAP001587-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347966205	72.49%	AGAP001587-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0015991	0	ATP hydrolysis coupled proton transport
	GO:0033177	0	proton-transporting two-sector ATPase complex, proton-transporting domain
	GO:0015078	0	hydrogen ion transmembrane transporter activity
KEGG pathway	aag:AaeL_AAEL014053	0.0
	K02154 (ATPeVI, ATP6N1A)	maps->	Collecting duct acid secretion
			Oxidative phosphorylation
			Lysosome
			Phagosome
			Vibrio cholerae infection
			Epithelial cell signaling in Helicobacter pylori infection
InterPro domain	[2-818] IPR002490	0	ATPase, V0/A0 complex, 116kDa subunit
Orthology group	MCL10092		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208959-TA
ATGGGGGCCATGTTCAGGAGTGAAGAGATGGCGCTCTGCCAGCTCTTCATTCAACCAGAAGCGGCGTATACCTCCGTCTCGGAGCTGGGAGAAGCAGGTTCTGTGCAGTTCAGAGACCTGAATCCAGACGTGAACGCTTTCCAACGTAAGTTTGTTAATGAGGTCCGTCGCTGCGATGAGATGGAACGAAAATTGAGGTACATAGAGGTTGAGGTACATAAGGACAAAGTTAATGTACCCGCTGTCAAAGACATGCCGAGAGCGCCTAACCCACGTGAGATCATCGATCTGGAGGCGCATCTCGAGAAAACGGAGAATGAAATTCTGGAGTTGTCACATAACGCGATCAACCTCAAACAAAACTATCTAGAGCTGACGGAATTAAAACACGTGCTGGAAAAAACAGAAGCATTCTTCGCCGCTCAAGAAGAAATCGGAATGGACTCGCTCACCAAGTCACTCATCTCTGACGAGGCCGGTCAGCAGGCGGCGACTCGCGGTCGTCTTGGGTTCGTAGCTGGCGTGGTCCAACGCGAACGCGTTCCCGCCTTCGAACGAATGTTGTGGAGAATCTCGAGAGGAAACGTATTCTTGAGACGAGCCGAACTTGACAAGCCCTTGGAGGACCCTAATACAGGCAACGAGATCTATAAAACGGTTTTCGTGGCGTTCTTCCAAGGCGAGCAGCTCAAGTCCCGCATCAAGAAAGTGTGCACCGGCTTCCATGCCTCCCTTTATCCTTGCCCGCCTTCTAACACCGAACGACTTGATATGGTCAAGGGGGTCAGAACTCGACTTGAAGACCTTAATATGGTGCTTAACCAAACCCAAGACCATAGACAACGTGTGTTGGTCAGCGTGGCAAAGGAATTGGGCAGTTGGTCGATAATGGTCCGCAAGATGAAAGCCATCTACCACACCCTCAACTTGTTCAACATGGATGTCACCAACAAATGTCTCATTGGCGAATGCTGGGTGCCAACAGCTGATCTACCAAACGTGCAAAAAGCCCTCGTTGACGGTTCCAGTGATGAAGTGCCTCCAACCTTCAACCGCACCAACAAATTCACTCGCGGATTCCAGACTCTCATCGACGCCTATGGAGTCGCCTCCTACAGGGAATGTAATCCAGCGCTGTACACCATCATCACTTTCCCGTTCCTGTTCGCGGTGATGTTTGGAGACCTGGGTCACGGCCTCATCATGGCTCTCTTCGGCCTCTGGATGGTTGTCAAGGAAGTGTCCCTCGCCGCAAAGAAATCCAACAACGAAATCTGGAACATTTTCTTCGCCGGTCGCTACATCATACTTCTCATGGGCTGCTTCTCTATGTACACCGGCTTGGTTTACAACGACATATTCTCGAAATCCATGAATATCTTCGGATCCGCTTGGTTCAATCCGTACGATAATCAGACGCTTGAAAGGTTTGAAGCTTTCACATTGGACCCTAAGGCTTCTTACGTAGACAAACCATATTTCTTTGGTATTGATCCTATCTGGCAGACTGCTGAGAATAAGATTATCTTCCTTAACTCTTACAAAATGAAACTGTCCATAATATTCGGCGTCATTCACATGATCTTCGGCGTTTGCATGAGCGTCGTCAACTACAACTTCTTCAAGCGCCGCTACTCAATCTTCCTGGAGTTTCTTCCACAAATCATTTTCCTGTTTCTCCTCTTCGCTTACATGGTATTCATGATGTTCTACAAGTGGGTGGCCTACAGCACCTTAGCTACAGATGAGGCGTATACCCAGGGTTGTGCGCCATCAGTGCTGATTCTCTTCATCAACATGATGCTGTTCTCGAGTACGGAACCCGAAGGCGGCTGCAAGGAGTACATGTTCGAGGGTCAGGAAACTCTACAGCGCGCGTTCGTTCTCGTGGCGCTTTGTTGCATACCAGTCATGTTGTTGGGCAAACCGTTGTACTTGTTGTGTGCCGCCAAAAAGAAGCATGACAAGCCGCAATCGAACGGTAGCGTGAACCAGGGCATCGAAATGCAAGAACAGACTGATATAGAGCAAGCCCCGAAGCCCGCGGCCGGCGGACACGACCATGATGATGAACCGTTCAGCGAAATCATGATCCATCAAGGAATACACACCATCGAATATGTTCTCAGTACAATCTCCCACACAGCTTCCTACCTACGACTATGGGCGTTGTCCCTCGCCCACGCTGAGTTATCTGAGGTGCTATGGAACATGGTGCTCCAACTCGGTCTCAAGGACCACAACTGGGTCGGTAGCATCAAATTGTACGTGGCCTTCATGTTCTGGTCTCTCTTCACACTGGCGATCCTCGTCATGATGGAGGGACTTTCAGCTTTCTTGCACACGCTGCGTTTGCATTGGGTGGAATTCATGAGCAAATTCTACGCTGGTTTGGGATACATCTTCCAACCGTTCTGCTTCAAGACGATCCTCGAACAAGAGGATGAAGATTAA

Protein sequence:

>DPOGS208959-PA
MGAMFRSEEMALCQLFIQPEAAYTSVSELGEAGSVQFRDLNPDVNAFQRKFVNEVRRCDEMERKLRYIEVEVHKDKVNVPAVKDMPRAPNPREIIDLEAHLEKTENEILELSHNAINLKQNYLELTELKHVLEKTEAFFAAQEEIGMDSLTKSLISDEAGQQAATRGRLGFVAGVVQRERVPAFERMLWRISRGNVFLRRAELDKPLEDPNTGNEIYKTVFVAFFQGEQLKSRIKKVCTGFHASLYPCPPSNTERLDMVKGVRTRLEDLNMVLNQTQDHRQRVLVSVAKELGSWSIMVRKMKAIYHTLNLFNMDVTNKCLIGECWVPTADLPNVQKALVDGSSDEVPPTFNRTNKFTRGFQTLIDAYGVASYRECNPALYTIITFPFLFAVMFGDLGHGLIMALFGLWMVVKEVSLAAKKSNNEIWNIFFAGRYIILLMGCFSMYTGLVYNDIFSKSMNIFGSAWFNPYDNQTLERFEAFTLDPKASYVDKPYFFGIDPIWQTAENKIIFLNSYKMKLSIIFGVIHMIFGVCMSVVNYNFFKRRYSIFLEFLPQIIFLFLLFAYMVFMMFYKWVAYSTLATDEAYTQGCAPSVLILFINMMLFSSTEPEGGCKEYMFEGQETLQRAFVLVALCCIPVMLLGKPLYLLCAAKKKHDKPQSNGSVNQGIEMQEQTDIEQAPKPAAGGHDHDDEPFSEIMIHQGIHTIEYVLSTISHTASYLRLWALSLAHAELSEVLWNMVLQLGLKDHNWVGSIKLYVAFMFWSLFTLAILVMMEGLSAFLHTLRLHWVEFMSKFYAGLGYIFQPFCFKTILEQEDED-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: