MonarchBase - Protein-coding gene

DPOGS200084
Transcript	DPOGS200084-TA	3189 bp
Protein	DPOGS200084-PA	1062 aa
Genomic position	DPSCF300044 - 210362-220193
RNAseq coverage	617x (Rank: top 21%)

Annotation
*Heliconius*	HMEL015065	80.56%
*Bombyx*	BGIBMGA002074-TA	78.48%
*Drosophila*	CG8177-PA	51.66%
EBI UniRef50	UniRef50_E0W1T8	56.45%	Anion exchange protein, putative n=2 Tax=Neoptera RepID=E0W1T8_PEDHC
NCBI RefSeq	XP_001652863.1	55.90%	anion exchange protein 2, slc4a2 [Aedes aegypti]
NCBI nr blastp	gi\|197318100	55.75%	SLC4-like anion exchanger [Aedes aegypti]
NCBI nr blastx	gi\|332026606	56.56%	Anion exchange protein 2 [Acromyrmex echinatior]

Group
Gene Ontology	GO:0006820	1.4e-187	anion transport
	GO:0016021	1.4e-187	integral to membrane
	GO:0008509	1.4e-112	anion transmembrane transporter activity
	GO:0006810	2.1e-93	transport
	GO:0005215	2.1e-93	transporter activity
	GO:0016020	1.3e-34	membrane
	GO:0005452	1.3e-34	inorganic anion exchanger activity
KEGG pathway	gga:395809	0.0
	K13855 (SLC4A2, AE2)	maps->	Salivary secretion
			Gastric acid secretion
InterPro domain	[13-1061] IPR003020	0	Bicarbonate transporter, eukaryotic
	[502-993] IPR011531	1.4e-187	Bicarbonate transporter, C-terminal
	[314-464] IPR013769	1.4e-112	Bicarbonate transporter, cytoplasmic
	[112-463] IPR016152	2.1e-93	Phosphotransferase/anion transporter
Orthology group	MCL10090		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200084-TA
ATGCCTGTGACGTATTCCCGGGCTTCTGATGTACATCATCAACGTCGACACTTGCATCACAAATCACGAAAATATTCCCTACAAGAGGGGGCGAGAGGTGGTGGGGCAGATGGCGAGAGACAAGTGCCTGCGGCATCAACGGATGAACCATTACCCGAAGCTGATCTCGATGAACTCCGGAGCCATCGAATTGATGACCAGCGGGTTTTGCGGAGACTTAAACTTCAGCCCAGGAGTCCAACCATTCATGTAGGGCGCAAGGATGGAGGCGATAAAATACAAAACATTTTTTCTGACTTAACTCTGAAAAAAATGTACGACCACAGTCCACATTCGGTGTTTGTTCAACTGGACGAATTACTAGCCACAGAAGATGGTGATACGGAGTGGAAGGAAACTGCACGTTGGATTAAATATGAAGAAGATGTTGAAGAAGGATCTGCCAGATGGGGTCGGCCCCACGTAGCCTCTCTTTCTTTCCATTCCCTATTAAACCTACGCCGTTGTTTAGAAACTGGAGTGGTACTGCTTGACCTCGATGAAAAAGACCTTCCTGGTGTTGCATACAGGGTTGTAGAAAGTATGGTTAATGAAGGATTGATAGAAGAAGATGACAAACCAGTCGTAATGAGATCTCTACTTCTTCGCCATCGACATGTACATGATGAAAGGTTCCGATTCTCCATAAGTGGTCGAAAGCACTCTTCCTATACAAGCCTACAGTCGCTGTGGTTGGAGGAAGGTGGTGGCGCCCGCCAGCGATACTCCACATGCTCTGCCATCGGTCCCTGTCGTCGACACAGCTCTCATATTCTCAATCTTTCGGATAACAAGCGACGAAGAAGCTCCAATGCTCTACCACAAGATCGAACAGAAGCTCGAGCAAAAACATCAGTGGCGGGCATGGATACACGCGAAGTAGAATATTTAGCCACAGCCCCCGTGGGGTCTCAGGATGAATTAAGACGGGGTCACAATGATTCAATCATGAAACGTATACCTGACGATGCGGAAGCCACAACAGTCCTCGTTGGTGCAGTTGGATTTTTAGATCAACCAACGATTGCCTTTGTACGTCTCGCTCAAGGCATATTAATGCCATCCATCACAGAGGTTCCCATACCAGTCCGCTTTATGTTCATATTACTTGGGCCAACATCAGCTGACCTTGACTATCATGAAGTGGGTAGATCCATTTCTACTCTTATGTCAAACCCTTCCTTTCATTCTATTGCGTACAAGGCTGATGATCGACGTGAACTTTTGTCGGCAATTAATGAATTCTTAGACGATTCGATAGTGTTACCGCCTGGTGATTGGGAGCGGCAGGCTCTATTGCCTTTCGAAGAATTACGAGCTAAAAGTGAAATGATAAGAAAACGTAAGCGTGATGCTTTGGAGCGTAAAAAGGGCATTGAAATTACAACAGCTTCGCCAATAGATGAAAAAAAGGCTTTGTTAGCTGGTGAAACTGGTGGATTGCCAGAAAAAGAACGTGATGATCCATTATCCAAGAGTGGTCGTCTCTTTGGTGGTGTTATAAGAGACATAAAAAGGCGTTATCCCCACTATATATCCGACTTTCGTGATGCATTAAATGGACAATGTGCGGCAGCTACAATATTCATGTACTTTGCTGCGCTTTCATCAGCCATTACTTTTGGAGGACTGTTAGCTGAAAAAACTGACAGACAGATTGGTATCTCGGAAACATTGGTATTTACTTGCGTAGGTGGATTATTTTTCGCCCTAGTAGCAGGTCAACCAATGATGATTACTGGCGCTACTGGACCTTTGCTGCTTCTCGACGAATCGCTTTTTGTATTTTGCCGCTCCTACGGTTTTGATTTTTTGGCCGCTAGAATGTACTGTGGTTTATGGATGATAGTGATTGCTTTGTGTGTTGCCTCTGTTGAAGGTAGTGTCGCCGTAAAGAAAATTACGAGATTTACTGAAGACATCTTCGCATTTTTGATATCGCTTATTTTCATATCTGAGCCTGTGACGAATATAATAAATGTTTACCGTGCTCACCCGCTCGGTTATGACTACTGCGGCAATTACACACTTGAAAATTCCACTGCTGGCGTTGATACGGTTAACTCAAATTTTACAGGAAACCTAACAGTTCCTCCAGTTTTACCGCCTACAAATATGTTACTTACACCGAAACCAAATACAGCTTTGTTTTGTACAATGTTGACTCTTTGTACCTTTATTCTTGCTTACTATCTCCGCATATTCCGCAACGGAAAATTTCTTGGTCGAAGTGCTCGACGTGCACTTGGTGATTTCGGAGTTCCGATTGCGATTGTTTTAATGGTTGGAATATCCTGCTTAGTACCCGTTTGGACTGAAAAATTACAAGTACCGGATGGTCTGAGCCCAACCTCAAATCGTTCTTGGCTTGTGCCCCTTAATAAGGGACTTGAAACAATACCACTGTGGGCAACAATTGCTATGGTTTTACCGGCGCTCATGGTTTACATCATCGTCTTTATGGAAACCCACATCGCAGAGTTGATTATTGACAAACCAGAGAGAAAACTGAAGAAAGGCAGTGGATTCCACATGGACATAGTCGTCATGTCGTTAGTGAACTCGGTGTGTGGCATGTTTGGGGCTCCGTGGCAGTGTGTAGCCACAGTACGATCTGTGAGCCATGTTTCCGCATTAACTGTTATGTCAACAACTCATGCCCCCGGTGACAAACCTTATATTGTTGAAGTTAAGGAACAACGTCTTACTGGATTACTAGTTGCTTTTCTCGTTGGCATATCTGTTTTGGCTTCCGGCTGGCTAAGATTAGTTCCAATGGCTGTATTATTTGGAGTTTTCCTCTATATGGGAATTTCTGCCCTCGGAGGAATTCAGTTCTGGGATCGATGTATTTTACTATTAAAACCTGTGAAGCATCACCCGCAAATACCTTACGTGAGACGAGTACCGACATTTAAAATGCATCTCTACACTCTTATCCAAATAGCTGGTGTATGTGTATTGTATGCTGTGAAGTCTTCGAAGTTTTCCCTCGCGCTTCCCTTCTTCTTGGTACTCATGGTGCCGCTGCGAATGGCAATCAGTTACATTTTTACCCCGCTACAACTGCGTGCGTTGGATGGATCCCAAAAAGATATTGACGTCGATGATGAGCCAGATTTCTATGAAGAAGCGCCTTTGCCCGGATAG

Protein sequence:

>DPOGS200084-PA
MPVTYSRASDVHHQRRHLHHKSRKYSLQEGARGGGADGERQVPAASTDEPLPEADLDELRSHRIDDQRVLRRLKLQPRSPTIHVGRKDGGDKIQNIFSDLTLKKMYDHSPHSVFVQLDELLATEDGDTEWKETARWIKYEEDVEEGSARWGRPHVASLSFHSLLNLRRCLETGVVLLDLDEKDLPGVAYRVVESMVNEGLIEEDDKPVVMRSLLLRHRHVHDERFRFSISGRKHSSYTSLQSLWLEEGGGARQRYSTCSAIGPCRRHSSHILNLSDNKRRRSSNALPQDRTEARAKTSVAGMDTREVEYLATAPVGSQDELRRGHNDSIMKRIPDDAEATTVLVGAVGFLDQPTIAFVRLAQGILMPSITEVPIPVRFMFILLGPTSADLDYHEVGRSISTLMSNPSFHSIAYKADDRRELLSAINEFLDDSIVLPPGDWERQALLPFEELRAKSEMIRKRKRDALERKKGIEITTASPIDEKKALLAGETGGLPEKERDDPLSKSGRLFGGVIRDIKRRYPHYISDFRDALNGQCAAATIFMYFAALSSAITFGGLLAEKTDRQIGISETLVFTCVGGLFFALVAGQPMMITGATGPLLLLDESLFVFCRSYGFDFLAARMYCGLWMIVIALCVASVEGSVAVKKITRFTEDIFAFLISLIFISEPVTNIINVYRAHPLGYDYCGNYTLENSTAGVDTVNSNFTGNLTVPPVLPPTNMLLTPKPNTALFCTMLTLCTFILAYYLRIFRNGKFLGRSARRALGDFGVPIAIVLMVGISCLVPVWTEKLQVPDGLSPTSNRSWLVPLNKGLETIPLWATIAMVLPALMVYIIVFMETHIAELIIDKPERKLKKGSGFHMDIVVMSLVNSVCGMFGAPWQCVATVRSVSHVSALTVMSTTHAPGDKPYIVEVKEQRLTGLLVAFLVGISVLASGWLRLVPMAVLFGVFLYMGISALGGIQFWDRCILLLKPVKHHPQIPYVRRVPTFKMHLYTLIQIAGVCVLYAVKSSKFSLALPFFLVLMVPLRMAISYIFTPLQLRALDGSQKDIDVDDEPDFYEEAPLPG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: