MonarchBase - Protein-coding gene

DPOGS208044
Transcript	DPOGS208044-TA	3183 bp
Protein	DPOGS208044-PA	1060 aa
Genomic position	DPSCF300203 + 186398-201813
RNAseq coverage	380x (Rank: top 31%)

Annotation
*Heliconius*	HMEL010896	70.72%
*Bombyx*	BGIBMGA001472-TA	76.33%
*Drosophila*	CG31547-PB	55.78%
EBI UniRef50	UniRef50_Q25479	80.39%	Bumetanide-sensitive sodium-(potassium)-chloride cotransporter n=29 Tax=Endopterygota RepID=NKCL_MANSE
NCBI RefSeq	XP_967948.2	60.63%	PREDICTED: similar to bumetanide sensitive NaK2Cl cotransporter isoform 1 [Tribolium castaneum]
NCBI nr blastp	gi\|2500792	80.39%	bumetanide sensitive NaK2Cl cotransporter [Manduca sexta]
NCBI nr blastx	gi\|2500792	80.39%	bumetanide sensitive NaK2Cl cotransporter [Manduca sexta]

Group
Gene Ontology	GO:0006821	0	chloride transport
	GO:0016021	0	integral to membrane
	GO:0015377	0	cation:chloride symporter activity
	GO:0006814	0	sodium ion transport
	GO:0016020	3.3e-114	membrane
	GO:0006810	3.3e-114	transport
	GO:0055085	3.3e-114	transmembrane transport
	GO:0006811	5.2e-05	ion transport
	GO:0005215	5.2e-05	transporter activity
KEGG pathway	rno:83629	0.0
	K10951 (SLC12A2)	maps->	Salivary secretion
			Vibrio cholerae infection
InterPro domain	[92-1060] IPR004842	0	Na/K/Cl co-transporter superfamily
	[125-630] IPR004841	3.3e-114	Amino acid permease domain
Orthology group	MCL10131		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208044-TA
ATGTCGGACAACAGGTTCACAGTTTCGACAGTTGAGTCGGAATGTAAAAAAAATGGAATTCACATGGGTGCCAGTATTATTGGCAGGCCGCTACGAACCTCTTTGGAGACGGTGGAACGAGGGGATCCCAACTCACAGTCTGATACATGGCTACACGATGCAGGCTGGAGGAGAAAGCGATCGTTGGCTCAGCTCACACGAGAAGCCTTACCAAGAATGGAGAACTATAGGAACTCCAAGCGAGCTCTAAAGAGACCGAGCTTGGGGGAACTACATGGAGATCATCTGATAACCGAAGAGGACGAGAAACAATGTCAAAGGGAAACAAAATCACCGACGCCGGCACACGGGATCAAACTAGGATGGATTCAAGGCGTGTTGATACCATGCCTGCTGAACATCTGGGGTGTTATGTTGTTTCTGCGTATATCGTGGGTGGTGTCGCAGGCTGGTATTGGCCTCACCCTTATAATCATCGCCATATCAGCGATCGTGTGCGTCATAACCACCCTCTCCATGAGCGCCATATGCACCAACGGGGAGGTGAAAGGAGGTGGTATATACTACATAATATCAAGATCTTTGGGTCCTGAATTCGGTGCCTCTGTTGGCATTATATTCGCGTTCGCCAATGCAGTAGCTGCGAGCATGAACACAATCGGATTCTGCGACTCTCTCAACGACCTGCTCAGAATACAGGGGGTCAAAATTATTGACAATGGAGTCAATGATGTCAGAATAGTTGGGGCTGTAGCGTTGGTTGTGATGTGTATAATCTGCGCAGTCGGCATGGACTGGGAAAGTAAGGCGCAGAATTTTCTGATCGCCATTATTGTTGGAGCGATGGTGGACTTCATAGTAGGGACTCTGATGGGCCCCAATGACGCGAGCGATGTTGCTCACGGCTTCGTAGGGTTGTCAGCGACAACCCTCTCGGAGAACTTCAATTCAGACTTTCGGTTCAGTGAGGGTCTTCACCAGGACTTCTTTAGCGTCTTCGCAATATTCTTTCCTTCCGTCACCGGTATCCAGGCCGGTGCTAACATCTCCGGAGATTTGAAGGATCCAGCTTCCGCGATTCCCAAAGGTACGCTTCTGGCGCTACTGATATCCATGGTGAGTTACGCGCTCATGGTGTTGTTTTCTGGTGGCGGAGCCCTGAGGGACGCGTCAGGGAACGTCTCCGACCTCATCATGGCCAATGGAACTGTCGTCAACTACACCGGGATATCGAATTGCGTAAATAGCTTACACGGCTGCGGTTATGGCCTCCACAATAGTTATTCCGTGATGCAATTGATGTCAGCCTGGGGACCTCTTATTTACGGTGGTTGCTGGGCGGCGACTTTATCGACCGCTCTGACAAACCTTCTATCAGTCCCTCGACTGATCCAAGCGCTCGGAGTCGACCGCATCTACCCCGGACTGATATTCTTCTCTAAGCCTTACGGCAAACACGGAGAGCCTTACAGAGGATACGTGCTTACTTTCATTGTATCGCTGATGTTCTTGCTTATAGCTGATCTTAATACGATCGCCCCTCTTATATCCAACTTCTACTTGGCGTCGTATGCTCTCATCAATTTCTGCACCTTCCACGCTGCCCTGGTGCGCCCCCTGGGCTGGCGGCCTACATTCCGGTACTACAACGTGTGGTTATCAATGAGCGGTTTCCTAATGTGTGTTGCCATCATGTTTCTCATAAGTTGGATTATGTCCCTCGTCACATTCGCTGTATTCTTCACTCTGTACCTCATAGTACACTATCGGAAACCCGACGTTAATTGGGGCAGTAGCACGCAAGCTCAAATGTACAAAACAGCGTTATCCAGCGCCCATAACCTGGCGCGGACTGGTGAACATGTCAAGAACTACTGGCCACAGCTATTAGTTCTGGCTGGGAGACCTTCTGATAGACCAGCTTTAGTCGACCTCGGCAATCTCATCACAAAATCTGGCTCGCTCATGATGATTGGTGACATATCGCAGAAAAAGTTAAGCTACAAAGAGCGTGTACATCGCTCGCGGACTGGTGACGAGTGGTTGAGGGGACGGAAGGTCCGCGCGTTCTGTGCCTCTGTGAACGGGTTCAGCTTCGAGTCCGGTGCGAGAGCCTTGATGCAAGCGGCGGGCGTCGGGAGACTCGCCCCCAACGTGCTGCTCATGGGATATAAAGCAGACTGGGCCACCGCGCCGGCCGCTGATTTAGAGTCTTACTTCAATGTTCTGCATACTGCATTTGAGACGCGCCTCGCGGTGGCCATAGTGCGAGTTGCCGGCGGCTTGGACTACAGTGCTGTAGAGGGTCAGGGGGAGGCACCAGGGGAGGGACAGGGAGAGGGAGCCGCTCTCACCGCCACCTCCAGTGGAAGCGGAGACCTCAGGATAAAGAGACCACAAGCCCAGATAATGCACGCGGACTCAGATCTCGATATACGATCGACGGCAACCACTGGATCCCAACCTTCCAGCAGACATAATCTTAACCTATTGACACTGACAACATCGCGTTCATTCACGATATCAGAGAAAAGTGACAGCAAGGAAAAGAAGAAGGACAAGAAACTATTTGACATTCAGCGACAAATCATTTACAAGTCATCGTCTGGCGTGGAAATGACGTTGTTCAAGAGGAAGCAGGAGTCTGGCACTTTGGATGTGTGGTGGTTGTATGATGACGGTGGCCTCACCATTCTTCTGCCGTACATCGTGTCCCAGCGGGCCTCGTGGCAGAGGTGCAAGTTGAGGATCTTCGCCCTCGCCAACAGGAGACACGAGATGGAACTGGAGGAGCGGAATATGGCTAATCTGTTAGCGAAGTTCCGTATAGACTACTCGTCGCTGACCATGGTGCAGGACATCATGGAACCTCCGCAGGCGGAAACCAAGAAACTCTTTGAAGAAATCATAAAAGGTTTCACAGACGGCAAAGGAGAGTGCAGTATCGCTCAGTCGGAGCTAGCAACCCTGTGTGAGAAGACCCACCGTCAACTGCGACTCCGAGAGCTCCTCCTCGCGAACTCCTCGAACGCCCAGCTGGTTGTGATGTCCCTACCCATGCCTAGAAAGGGTTCCGTATCAGCTCCGCTGTACATGGCCTGGTTAGAGGTGATGAGTCGCGACCTCCCGCCCATGTTGTTCGTGAGAGGCAACCAGACCTCCGTGCTCACTTTCTATTCATAG

Protein sequence:

>DPOGS208044-PA
MSDNRFTVSTVESECKKNGIHMGASIIGRPLRTSLETVERGDPNSQSDTWLHDAGWRRKRSLAQLTREALPRMENYRNSKRALKRPSLGELHGDHLITEEDEKQCQRETKSPTPAHGIKLGWIQGVLIPCLLNIWGVMLFLRISWVVSQAGIGLTLIIIAISAIVCVITTLSMSAICTNGEVKGGGIYYIISRSLGPEFGASVGIIFAFANAVAASMNTIGFCDSLNDLLRIQGVKIIDNGVNDVRIVGAVALVVMCIICAVGMDWESKAQNFLIAIIVGAMVDFIVGTLMGPNDASDVAHGFVGLSATTLSENFNSDFRFSEGLHQDFFSVFAIFFPSVTGIQAGANISGDLKDPASAIPKGTLLALLISMVSYALMVLFSGGGALRDASGNVSDLIMANGTVVNYTGISNCVNSLHGCGYGLHNSYSVMQLMSAWGPLIYGGCWAATLSTALTNLLSVPRLIQALGVDRIYPGLIFFSKPYGKHGEPYRGYVLTFIVSLMFLLIADLNTIAPLISNFYLASYALINFCTFHAALVRPLGWRPTFRYYNVWLSMSGFLMCVAIMFLISWIMSLVTFAVFFTLYLIVHYRKPDVNWGSSTQAQMYKTALSSAHNLARTGEHVKNYWPQLLVLAGRPSDRPALVDLGNLITKSGSLMMIGDISQKKLSYKERVHRSRTGDEWLRGRKVRAFCASVNGFSFESGARALMQAAGVGRLAPNVLLMGYKADWATAPAADLESYFNVLHTAFETRLAVAIVRVAGGLDYSAVEGQGEAPGEGQGEGAALTATSSGSGDLRIKRPQAQIMHADSDLDIRSTATTGSQPSSRHNLNLLTLTTSRSFTISEKSDSKEKKKDKKLFDIQRQIIYKSSSGVEMTLFKRKQESGTLDVWWLYDDGGLTILLPYIVSQRASWQRCKLRIFALANRRHEMELEERNMANLLAKFRIDYSSLTMVQDIMEPPQAETKKLFEEIIKGFTDGKGECSIAQSELATLCEKTHRQLRLRELLLANSSNAQLVVMSLPMPRKGSVSAPLYMAWLEVMSRDLPPMLFVRGNQTSVLTFYS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: