MonarchBase - Protein-coding gene

DPOGS210214
Transcript	DPOGS210214-TA	2763 bp
Protein	DPOGS210214-PA	920 aa
Genomic position	DPSCF300196 - 670548-686508
RNAseq coverage	1549x (Rank: top 8%)

Annotation
*Heliconius*	HMEL015776	59.34%
*Bombyx*	BGIBMGA002539-TA	86.13%
*Drosophila*	Vha100-1-PE	68.52%
EBI UniRef50	UniRef50_Q0IFY3	70.37%	Vacuolar proton atpases n=49 Tax=Metazoa RepID=Q0IFY3_AEDAE
NCBI RefSeq	XP_002054489.1	70.01%	GJ22780 [Drosophila virilis]
NCBI nr blastp	gi\|307213911	73.23%	Vacuolar proton translocating ATPase 116 kDa subunit a isoform 1 [Harpegnathos saltator]
NCBI nr blastx	gi\|307213911	73.23%	Vacuolar proton translocating ATPase 116 kDa subunit a isoform 1 [Harpegnathos saltator]

Group
Gene Ontology	GO:0015991	0	ATP hydrolysis coupled proton transport
	GO:0033177	0	proton-transporting two-sector ATPase complex, proton-transporting domain
	GO:0015078	0	hydrogen ion transmembrane transporter activity
KEGG pathway	dmo:Dmoj_GI22777	0.0
	K02154 (ATPeVI, ATP6N1A)	maps->	Collecting duct acid secretion
			Oxidative phosphorylation
			Lysosome
			Phagosome
			Vibrio cholerae infection
			Epithelial cell signaling in Helicobacter pylori infection
InterPro domain	[2-920] IPR002490	0	ATPase, V0/A0 complex, 116kDa subunit
Orthology group	MCL10092		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210214-TA
ATGGGGTCGTTATTTCGAAGTGAGGAAATGACTCTGTGTCAACTATTTCTGCAGAGTGAAGCAGCCTATGCATGCGTGTCTGAACTTGGTGAACTGGGGCTTGTTCAGTTCCGCGATTTGAACCCAGACGTGAACGCGTTCCAACGGAAGTTCGTCAATGAAGTGCGCCGTTGCGATGAGATGGAGAGGAAGCTGCGCTACCTGGAGAAGGAGATCAGGAGAGACGGCATCCCCATGCTGGAGATACCGGGGGAGGTGCCCGAGGCGCCGCAGCCCAGGGAGATGATCGACCTTGAGGCTACGTTTGAGAAACTCGAAAATGAACTCCGGGAAGTCAATCAGAACGCTGAGGCGTTGAAGAGGAACTACTTGGAACTGACGGAGCTGAAGCACATACTGAGGAAGACGCAGGTGTTCTTCGACGAGATGGCGGACCCGTCGCGGGAGGAGGAACAAGTCACCCTCCTGGGGGAGGAGGGGCTGATGGCGGGAGGGCAAGCGCTCAAGCTGGGGTATGCAGTATATATAAGTGCTATCAGCTACGGACCGCTCCCGACTCCTGCGACCGCTCGGTCAGGGCCGGTCCTAGCTCGGTATTATTTTTGCAGCGCTTGTACTGTGACGCTGATACGGGAGTCTACCGGTCACCACTCAGGCAAGCATTGGAGACAGCCGCACGAGGGTGGTGCCAATACCACTGAGTCAATGACCCGGGCTCTGATATCCGACGATCCGAACAGACATATGGGACAGGTCCAACTAGGTTTCGTTGCCGGAGTTATTCTCCGTGAGAGAATTCCTGCCTTTGAGCGTATGCTGTGGCGTGCGTGTCGCGGTAACGTCTTCCTGAGGCAGGCCGAGATCGACACGCCTCTAGAGGACCCGTCATCGTCGGACCAGGTGTACAAGTCGGTGTTCATAATCTTCTTCCAAGGAGACCAGCTCAAGACCCGCGTGAAGAAGATCTGTGAAGGTTTCCGCGCCACCTTATACCCGTGCCCGGAGGCTCCCGCCGACCGTCGGGAAATGGCCATGGGGGTCATGACCAGGATCGAAGATCTTAACACGGTGTTGGGTCAGACCCAGGACCACCGTCACCGCGTGTTGGTCGCCGCTGCCAAGAACATAAAGAACTGGTTCGTGAAGGTGCGCAAGATTAAGGCCATCTATCACACCTTGAACCTGTTCAACCTGGACGTGACCCAGAAGTGTCTCATCGCCGAGTGCTGGGTCCCCGCCCTGGACATGGAGACCATACAGTTGGCCCTACGGAGAGGAACGGAGCGCAGCGGCAGTTCGGTCCCGCCGATCCTGAACCGCATGGACACGTCCGAGCCGCCGCCGACCTACAACCGCACTAACAAGTTCACCTCCGCCTTCCAGCACCTCATATACGCCTACGGTGTCGCCACCTACCGGGAGGTCAACCCCGCTCCGTACACCATAATCACGTTTCCGTTCCTGTTCGCCGTGATGTTCGGTGACCTGGGTCACGGGGCGCTCATGGCCGCCTTCGGCTTCTGGATGTGTTACAAGGAGAAGCCGCTGCAGGCCAAGAGGATCGACAGCGAGATCTGGACCATCTTCTTCGGCGGGCGCTACATCATCTTGCTGATGGGCCTGTTCTCCATGTACACGGGCATCATCTACAACGACATCTTCTCTAAGAGTCTCAACATCTTCGGCTCCTCGTGGGTCAACAACTACAACGAGTCCACTCTCCTCACCAACAAGGACCTCCAGCTCAACCCCGACTCCGAGGACTACTTGCAGACGCCCTACCCCTTCGGCATAGATCCTGTGTGGCAGCTGGCGGAGGCTAACAAGATCATCTTCATGAACGCCTACAAGATGAAGATCTCCATCATCATCGGCGTCTTCCACATGTTGTTCGGAGTCTGCCTCTCGCTGTGGAACCATCTGTACTTCAAGCGCCGCATCTCGATATACGTGGAGTTCGTCCCTCAGATCTTTTTCCTCACGCTGCTGTTCTTCTACATGGTGCTGCTGATGTTCATCAAGTGGACCTCCTACGGCCCGACCCCCGGGCACTTCGGAGACGAGGCCTACGTGAAGACCAGCGGCTTCTGCGCGCCGTCCATCCTGATCACCTTCATCAACATGATGCTGTTCAAGACGGACGAGAACACGCGGCCGCAGTGCGACGACACCATGTACGCCGGACAGATAGGACTCCAGAAGCTGTTCGTCATACTGGCCCTGATGTGCGTGCCTGTGATGTTGTTCGGGAAGCCGTACTTCATCAGGAAGGAGCAGAAGTTACGCGCTGCGCAAGGTCACCAGAGCATCGAGGCGAGCGCTGAGAACGGCACGGCCGGCGGAGCGCCCGTCCCCGCTCACGACCACGGCGACGAGGACATCACCGAGGTGTTCATACACCAGGCCATCCACACCATCGAGTACGTGCTGGGGAGCGTCTCGCACACGGCGTCCTACCTGCGACTGTGGGCGCTGTCTCTGGCGCACGCTCAGCTGGCCGAGGTCGCCTGGAACATGTTGCTGAGGAAGGGTCTCATGTCTCCCAGCTACGAGGGCGGCATCTTCCTGTACATCGTGTTCGCGGGCTGGGCCGCCATCTCCGTCTCCATCCTGGTGCTGATGGAGGGCCTGTCCGCCTTCCTGCACACACTGCGTCTGCATTGGGTGGAGTTCCAGAGTAAGTTCTACGCGGGCGAGGGTTACCTCTTCATGCCGTTCTCGTTCGAGATCATTCTGGACTCGGCGGGTCAGGCCGAGGAGTAA

Protein sequence:

>DPOGS210214-PA
MGSLFRSEEMTLCQLFLQSEAAYACVSELGELGLVQFRDLNPDVNAFQRKFVNEVRRCDEMERKLRYLEKEIRRDGIPMLEIPGEVPEAPQPREMIDLEATFEKLENELREVNQNAEALKRNYLELTELKHILRKTQVFFDEMADPSREEEQVTLLGEEGLMAGGQALKLGYAVYISAISYGPLPTPATARSGPVLARYYFCSACTVTLIRESTGHHSGKHWRQPHEGGANTTESMTRALISDDPNRHMGQVQLGFVAGVILRERIPAFERMLWRACRGNVFLRQAEIDTPLEDPSSSDQVYKSVFIIFFQGDQLKTRVKKICEGFRATLYPCPEAPADRREMAMGVMTRIEDLNTVLGQTQDHRHRVLVAAAKNIKNWFVKVRKIKAIYHTLNLFNLDVTQKCLIAECWVPALDMETIQLALRRGTERSGSSVPPILNRMDTSEPPPTYNRTNKFTSAFQHLIYAYGVATYREVNPAPYTIITFPFLFAVMFGDLGHGALMAAFGFWMCYKEKPLQAKRIDSEIWTIFFGGRYIILLMGLFSMYTGIIYNDIFSKSLNIFGSSWVNNYNESTLLTNKDLQLNPDSEDYLQTPYPFGIDPVWQLAEANKIIFMNAYKMKISIIIGVFHMLFGVCLSLWNHLYFKRRISIYVEFVPQIFFLTLLFFYMVLLMFIKWTSYGPTPGHFGDEAYVKTSGFCAPSILITFINMMLFKTDENTRPQCDDTMYAGQIGLQKLFVILALMCVPVMLFGKPYFIRKEQKLRAAQGHQSIEASAENGTAGGAPVPAHDHGDEDITEVFIHQAIHTIEYVLGSVSHTASYLRLWALSLAHAQLAEVAWNMLLRKGLMSPSYEGGIFLYIVFAGWAAISVSILVLMEGLSAFLHTLRLHWVEFQSKFYAGEGYLFMPFSFEIILDSAGQAEE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: