MonarchBase - Protein-coding gene

DPOGS215409
Transcript	DPOGS215409-TA	3435 bp
Protein	DPOGS215409-PA	1144 aa
Genomic position	DPSCF300088 + 473616-492613
RNAseq coverage	279x (Rank: top 39%)

Annotation
*Heliconius*	HMEL017422	75.87%
*Bombyx*	BGIBMGA012368-TA	61.75%
*Drosophila*	Ncc69-PA	57.29%
EBI UniRef50	UniRef50_Q9VTW8	57.29%	GH27027p n=18 Tax=Pancrustacea RepID=Q9VTW8_DROME
NCBI RefSeq	XP_321556.3	57.20%	AGAP001557-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|118794513	57.20%	AGAP001557-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|195493820	57.39%	GE20127 [Drosophila yakuba]

Group
Gene Ontology	GO:0006821	0	chloride transport
	GO:0016021	0	integral to membrane
	GO:0015377	0	cation:chloride symporter activity
	GO:0006814	0	sodium ion transport
	GO:0016020	2.6e-131	membrane
	GO:0006810	2.6e-131	transport
	GO:0055085	2.6e-131	transmembrane transport
KEGG pathway	tgu:100230871	0.0
	K10951 (SLC12A2)	maps->	Salivary secretion
			Vibrio cholerae infection
InterPro domain	[197-1144] IPR004842	0	Na/K/Cl co-transporter superfamily
	[225-719] IPR004841	2.6e-131	Amino acid permease domain
Orthology group	MCL10131		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215409-TA
ATGGAATCCAATCCAAAAGACATCGAATTAAGCCCGGTAAATTCTAGCCCAGACAATAGTAGATCGGCAAGAGAAAAGTTTATCACGCCGGCAAACGACGAAGAGGATGTTATTATCGGTCGATTTAGAAAAATTAGTTCAGCCAAATCCATGGCAGCTACCAATGGTAACATTCAATATCCTTCCGAGATTATTAGGAATGAAGCCGACGTAGAGGCCGGGTTACAGTTTAAAGTTAAAGAATGCGAAAAGGAGCGGTTGTTGCCTGAGCCTTCGGATAGCAACGTGGTTGTTCTTCCCAAGTCTCCCGTCACGAAGAGCAGCTTTCGAGACATGGAGAAACCTTCACGATTCAAGGATCAACCGTCCACAACCAGATTTCAGATGGAAAATCCTGACCCTCGTTCGGATTCTGACAGTTCAGGCATGGAGAGCGACGACCCTTTAACGACCTCTGACACGAAATACGGTAAAAGTTTCAGACACTTCACCCGCGAGGCCCTACCTCGGCTGGACAACTACAGGAATGTCCTGTCGCTGCACGCGGCTCCTAGACCCACCCTGGATGAGCTTCATAATGCATCGTTATCAAGGAAGCCAGGTCAGACCATGGAAAAGGACCAGGCCACAGTGGCCATACCAACCACATCTGTCAAGTTCGGCTGGATCAAGGGTGTCCTGATGAGATGTCTCCTCAACATCTGGGGTGTGATGCTGTTCTTGCGACTGTCCTGGGTCGTGGGTCAGGCCGGGATTGCGCAGGCATCTCTGTTGATATTGACCACCAGCGTGGTGACCACCATCACTGCCCTCTCGATGTCCGCCATCAGCACCAACGGAGTCATTAAAGGAGGTGGTACGTACTACATGATTTCTCGCTCCCTGGGCCCGGAGTTCGGTGGTTCCATCGGGCTCATCTTCTCTATGGCCAACGCAGTCGCCTGCGCCATGTACGTGGTGGGCTTCGCGGAGTCACTCATCACACTCATACCAGAAACCGCCTACATGGTCGACAAGAATTGGGACCAGGCCATCTACGGCTGCATCACGATCGTTTTACTCACCGGTATCGTGATGGTGGGTATGGAATGGGAGGCGAAGGCCCAGATTGTGTTGCTGGTGGTATTGTTGGCAGCCATAGCGGACTTCTGTGTGGGGGCGCTCGTGGGGCCCAAGAGCGAGCAGGAGGTCGCGCAGGGCTTCGTCGGCTTTAACTGGACTGTGATGCTGAGTAACCTGGGTCCGGACTATAGATATTTCGAGGGCCAGCACCACAACTTCTTCTCGGTGTTCTCGATATTCTTCCCAGCCGCTACCGGTATACTCGCAGGGGCTAACATATCCGGGGACCTGAAGGACCCGCAGAAGTCAATCCCCAAGGGCACCCTACTGGCCATTCTCCTCACGACCCTGTCGTACTTGTTGATCGCGGTGGTGGCGGGCGCGTGTGTGGTGAGGGATGCGTCGGGAAACCTCCAGGACGTGGTGGACGGCACCCTCGGCCTCTGTAGAGACAACGGCACCTGTCAATACGGCCTACATCACAGCAACGATGTAATAAGGCTGGTGTCAGGGTTCGGGCCTCTGATATACGGCGGCTGTTTCGCGGCCACACTGTCCTCGGCGCTCGCGTCCCTGGTCTCCGCGCCCAAGGTGTTCCAGGCGCTGTGTCAGGACAAGCTGTACCCGTGGCTGGAGTTCTTCGCGAAGGGTTACGGAGCTAACAACGAGCCGGTCAGGGGATACGTGCTCACCTTCGTCATAGCCGTGGCCTTCATCCTGATGGGCGGGTTGAACCAGATCGCTCCCCTGATATCTAACTTCTTCCTGGCCGCCTACGCCCTCATCAACTTCGCCACGTTCCACGCCAGCCTCGCCCGCCCCGTGGGCTGGAGACCCACCTTCAGATTATACAACATGTGGCTGTCCCTGGCGGGATCGCTGGTGTGCGCCGCCATCATGTTCGTGGTGTCGTGGTTCAACGCGCTCCTGACGCTGGCAGCCCTGCTGGCCCTCTATCTGCTGGTGTCGTATCGCAAGCCAGATGTGAACTGGGGCTCCACCACCCAGGCCCAGAGGTACAAGGCGGCCCTGTCCGGCGTACACCAGCTGAACGCGGTCAGCGAACACGTCAAGAACTACAGGCCTCAGATCCTGGTGCTGACGGGTTTCCCCGGGGAGAGGTCCATGCTCACGGACTTCACGTATCTCCTTACCAAGGGACTGTCGCTGATGCTCTGTGGACACATCCTGCAGAGCGCCATCAACCACCGCACCCGCGAGGCGCTGTCGGCGCGCGCCTACCAGTGGTTCAGCAAACGAAACATCAAGGCCTTCTACACCATCGTGGACGACGCCAGCTTCAAGGACGGAGCCGGCGCGCTCCTACAGGCGAGCGGTCTGGGCAAGTTGAAGCCGAACATTCTTCTGATGGGCTTCAAGGAGGACTGGCAGACCTGCCCGCGACAGGAACTGGCCGGCTACATCGACGTCATGCACAAAGCTCTAGACTTGCACATGGGCCTGTCCCTGCTGCGCGTGTCGGGAGGTCTGTACAGCTGCGACACGCTGGACGAGGACCTGCTGGCCTGCCTCCAGCCGCCCGCCCAGGTCGAGCCCGCCCTGGCACTCACGCGGAGCCGGTCTAATAGAATATATCTTGATCAAACCGATAGCAAATATTCTTTGAGAGTCGTGATTAGCGAACCGTTCAATAATATTCTTACTATTTGGTCCCCAGCATCAATGGGCGACGGACACAAGAAGTCCTCCGAGACGCTGAACTCTCAGTCCAGAGGTGAGGGAGTCAGCAGCGTGTCCGACGTGTCGTGTGAGGCGGGCGGGGCGAGCGGCGCGTGTCCCACCCCCGAGCGCTTCCCCCGGCTGGCGGGCGGGGTGGACGTGTGGTGGCTGTACGACGACGGCGGCCTGACGCTCCTGCTGCCCTACATCCTCTCCACGAGGCGGGCCTGGGCCTCGTGCCCGCTCCGGGTCTTCACCCTGGCCAACAACAACGCCGAAATGGAGATAGAGGAACGCAACATGGCGTCCCTCCTGTCCAAGTTCCGTATCGACTACTCGTCGCTGAAGATGATCCCGGACGTGTCCCGGCGGCCGCGGGACTCCACCCTCGCCTACTTCAACAAGCTCATAGAACCCTTCACCGCCAGGGACGACTCGGACGACAGCTTCGGCATCACCCCGTCGGAGCTGCGCGCGGCCGAGTCCCGCACTCACCGCTACTTGCGCGTGCGGGAGCTGGTGAGCAGCCAGTCGGCCTGCAGCCGCCTGGTGTGCGTGACGCAGCCCATGCCGCGGCGCCGGGGCCTGCCGCCCGCGCTGTACGCCGCCTGGCTGCACGCCCTCGCCACCGCCGCCGACCGCGTGCTGCTGGTGCGGGGGAACCACTCGTCCGTGCTCACCTTCTACTCCTAG

Protein sequence:

>DPOGS215409-PA
MESNPKDIELSPVNSSPDNSRSAREKFITPANDEEDVIIGRFRKISSAKSMAATNGNIQYPSEIIRNEADVEAGLQFKVKECEKERLLPEPSDSNVVVLPKSPVTKSSFRDMEKPSRFKDQPSTTRFQMENPDPRSDSDSSGMESDDPLTTSDTKYGKSFRHFTREALPRLDNYRNVLSLHAAPRPTLDELHNASLSRKPGQTMEKDQATVAIPTTSVKFGWIKGVLMRCLLNIWGVMLFLRLSWVVGQAGIAQASLLILTTSVVTTITALSMSAISTNGVIKGGGTYYMISRSLGPEFGGSIGLIFSMANAVACAMYVVGFAESLITLIPETAYMVDKNWDQAIYGCITIVLLTGIVMVGMEWEAKAQIVLLVVLLAAIADFCVGALVGPKSEQEVAQGFVGFNWTVMLSNLGPDYRYFEGQHHNFFSVFSIFFPAATGILAGANISGDLKDPQKSIPKGTLLAILLTTLSYLLIAVVAGACVVRDASGNLQDVVDGTLGLCRDNGTCQYGLHHSNDVIRLVSGFGPLIYGGCFAATLSSALASLVSAPKVFQALCQDKLYPWLEFFAKGYGANNEPVRGYVLTFVIAVAFILMGGLNQIAPLISNFFLAAYALINFATFHASLARPVGWRPTFRLYNMWLSLAGSLVCAAIMFVVSWFNALLTLAALLALYLLVSYRKPDVNWGSTTQAQRYKAALSGVHQLNAVSEHVKNYRPQILVLTGFPGERSMLTDFTYLLTKGLSLMLCGHILQSAINHRTREALSARAYQWFSKRNIKAFYTIVDDASFKDGAGALLQASGLGKLKPNILLMGFKEDWQTCPRQELAGYIDVMHKALDLHMGLSLLRVSGGLYSCDTLDEDLLACLQPPAQVEPALALTRSRSNRIYLDQTDSKYSLRVVISEPFNNILTIWSPASMGDGHKKSSETLNSQSRGEGVSSVSDVSCEAGGASGACPTPERFPRLAGGVDVWWLYDDGGLTLLLPYILSTRRAWASCPLRVFTLANNNAEMEIEERNMASLLSKFRIDYSSLKMIPDVSRRPRDSTLAYFNKLIEPFTARDDSDDSFGITPSELRAAESRTHRYLRVRELVSSQSACSRLVCVTQPMPRRRGLPPALYAAWLHALATAADRVLLVRGNHSSVLTFYS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: