MonarchBase - Protein-coding gene

DPOGS213633
Transcript	DPOGS213633-TA	2649 bp
Protein	DPOGS213633-PA	882 aa
Genomic position	DPSCF300165 - 356115-371489
RNAseq coverage	733x (Rank: top 18%)

Annotation
*Heliconius*	HMEL006054	0.0	83.97%
*Bombyx*	BGIBMGA004574-TA	1e-157	71.04%
*Drosophila*	CG10413-PA	4e-128	57.18%
EBI UniRef50	UniRef50_UPI00022467B5	0.0	46.23%	UPI00022467B5 related cluster n=1 Tax=unknown RepID=UPI00022467B5
NCBI RefSeq	XP_001601569.1	0.0	46.05%	PREDICTED: similar to cation chloride cotransporter [Nasonia vitripennis]
NCBI nr blastp	gi\|345483891	0.0	46.23%	PREDICTED: solute carrier family 12 member 9-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345483891	0.0	46.23%	PREDICTED: solute carrier family 12 member 9-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0016020	5.3e-49	membrane
	GO:0006810	5.3e-49	transport
	GO:0055085	5.3e-49	transmembrane transport
KEGG pathway	rno:83629	2e-39
	K10951 (SLC12A2)	maps->	Salivary secretion
			Vibrio cholerae infection
InterPro domain	[127-506] IPR004841	5.3e-49	Amino acid permease domain
	[8-60] IPR001163	9.9e-13	Like-Sm ribonucleoprotein (LSM) domain
	[5-61] IPR010920	2.2e-12	Like-Sm ribonucleoprotein (LSM)-related domain
	[7-62] IPR006649	2e-11	Like-Sm ribonucleoprotein (LSM) domain, eukaryotic/archaea-type
Orthology group	MCL12104		Single-copy universal gene

Nucleotide sequence:

>DPOGS213633-TA
ATGTCTAAGGCACATCCTCCAGAGTTGAAAAAGTTCATGGACAAGAAGCTGTCCATCAAACTAAACGCTGGTCGTGCTGTGACGGGCGTTCTTAGAGGATTTGATCCTTTCATGAACTTGGTACTTGATGAATCTGTTGAGGAATGTAAGGACGGGCAGAGGAATAATATAGGGATGGTCGTAAGGACAAAGCCATCTATAATGGCGGATACCCTGGACCCATTGTCACCGAGTACAAATGACTCCTCACCAGGCTTAATGCATATATTGAGACAGAGGCTGGGCAGGGCACCAACGGGTTCTAACGGAGATGGATATGTCGAGTTTGGTGAGTTCAGATCAGAACGGCCAGGTGTCAAGAAGGTGGGCACCTTCGCGGGAGTGTTCTGTCCTGTTGTCTTATCAATGTTCAGCGCTCTCGTGTTCATAAGAATGGGATATCTCATTGGTAACGCCGGTCTTCTGGTGACTCTGGCGCAATTCGGCATGGCGTATTTAATAGTTGGCTTCACGGTAACATCGATCTGTGCCATTTCCACGAATGGGGCTGTGGAGGGCGGAGGCGTGTACTTCATGATAAGCAGGACTCTCGGTCCCGAGTTTGGTGGTGCTATCGGAACTCTCTTCTTCTTCGCCAACGTGGTGTCCAGTGCTCTCTGTATATCAGCCTGCGCTGAGGCTATGGTGGAGAATTTTGGGGACGATGGTGGATACCTGATCGGTTCCAGCCCTGGCTTGCCGAGTGGTTACTGGTACAATTTCCTGTACCGCTCGTCGTTGAACGCGGTGGGTCTAGGCGTGTCCCTGGCCGGAGCCTCATTATTCGCGTCAACGAGTCTAGCGATCTGGTTGACGACCATCATTTGTCTGTTCAGCGCCTTCCTCAGCTTCTTCATAACAGCTCCCGGACAGATAGAAAAGCCAGCTTCAAACACTATAGTGAACGCTACCAACTTCACCTACACCGGTCTGAGTTCGGTCACGTTACGAGAGAACCTCTATCCTAACTACTCCCGCGACTACACAGCTGATGGGGAATTCGTGGATTTCGCGTCAGTTTTTGGGGTGCTCTTCACTGGGGTCACCGGGGTCATGGCTGGGGCGAATATGAGTGGCGAATTGAAGAATCCATCTCTGAACATACCCCGCGGTACGTTGGGTGCTCTGCTTCTAACAGCTTTGACGTACCTCTCGTTGTCGCTACTGACTGCTGCGACGTGTTCGAGAGAGTTGCTCCAGAACAACTACGTGTACCTCCTGCCTATCAACATCTGGCCGCCGTTCATAGCGGTGGGTATGCTGACCGCGACCTTCTCAGCTGGGTTGTCAAACCTTATTGGAGCTTCCAGAGTACTCGAAGCGTTGGCCAAAGACGATATATTCGGATTCCTCCTCCGCCCCATGGTGTCGACTTCCGGTAACCCCGTGCTAGCGGTCATCGCCTCCTGGCTGCTGGTACAGTTTGCCATAATGGCAGATTCGCTGAACGCAATCGCTCAGGTCCGTAAGTACCTCCTGCTGCTGGATCCTCGTCGTCAGCACGTGAAGTTCTGGAGACCCCAGATGTTACTCCTGGTCGCGTCCCCGAGACACTGTGCTCCCCTCATCGACTTCGTTAACGATCAGAAGAAGGGCGGTCTGTTCGTGTTGGGTCATGTTCGTGTCGGTGAGCTGGACGGCAGTGGGGATCCTCTGTCTGATGAACACAAGTACTGGCTTCAGCTGATAGACCACCTCAAGGTGAAGGCTTTCGTGGAACTCTGTCTGTGTGAATCTGTGCGAGGGGGGGCCGCCCAGCTATCGCGGCTCTCTGGGCTTGGAGCTATGAAGCCGGATACTGTACTCCTGGGATTCAGGGACCAGGCGCCGCATAGAGATTTCTTCAGGGACCCCTCGTCACCTTACAAGACGGCTATGTTTGACCTGGAGGGCGGGGAGGTGGTGTTCCCCGCCAGATCCTCCAAGATCTCCGTCACGGAGTACGTTAGGATCGTGTCTGATGTCCTCTGTGTCGGGAAGAACGTCTGTCTGTGTCGACATTTCCACAAACTCGATATGGACGCGATCGCCAAACGCTCCTCGTCATCTCGGTCCATCGACGTGTGGCTGGTTGAGCCTCTCCGTCCATCTCGCGAGGAACCGTTCTCTGTCCGAGCTCTGTTCGCGCTGCAGCTAGCGGCCGTCGTTCGCTCAGCCAGGGGCTGGACCCGTCTCGGCCTGAGAGTGCATATCATAACAGGGGTGTCTACTATCGGAACCCTACCCTCGTCCCCTGATCAGTTGTCTCCTGGCCGTCCAATCACCGAGCGTCTCGAACAGCTCCTCAAGATGCTCAGAATCAATGCCACCATACATCCCGTTCCTGAATGGCCTTCATTAGAGGGGTCTCATCGCTGGGCGGACCTCGACGACGATCAGGTCTATCAGAGAGTGCCCCTGAACTATTTACAAAAAGTGAACTCTATAATAAAGGCTCGCAGTTCAGAGGCGGTGGTGACGTTCATCCAGCTCCCCCCTCCCCCGCCCAGCGTCAACAGGGACGACGACATATGTAGTGATTACTTGAAGACTTTAGACGAGCTCACCAAGGACCTGTCGCCCACGATCCTCGTCCGGGGACTGAAATCCGTGACATCAACATCCTTGTAA

Protein sequence:

>DPOGS213633-PA
MSKAHPPELKKFMDKKLSIKLNAGRAVTGVLRGFDPFMNLVLDESVEECKDGQRNNIGMVVRTKPSIMADTLDPLSPSTNDSSPGLMHILRQRLGRAPTGSNGDGYVEFGEFRSERPGVKKVGTFAGVFCPVVLSMFSALVFIRMGYLIGNAGLLVTLAQFGMAYLIVGFTVTSICAISTNGAVEGGGVYFMISRTLGPEFGGAIGTLFFFANVVSSALCISACAEAMVENFGDDGGYLIGSSPGLPSGYWYNFLYRSSLNAVGLGVSLAGASLFASTSLAIWLTTIICLFSAFLSFFITAPGQIEKPASNTIVNATNFTYTGLSSVTLRENLYPNYSRDYTADGEFVDFASVFGVLFTGVTGVMAGANMSGELKNPSLNIPRGTLGALLLTALTYLSLSLLTAATCSRELLQNNYVYLLPINIWPPFIAVGMLTATFSAGLSNLIGASRVLEALAKDDIFGFLLRPMVSTSGNPVLAVIASWLLVQFAIMADSLNAIAQVRKYLLLLDPRRQHVKFWRPQMLLLVASPRHCAPLIDFVNDQKKGGLFVLGHVRVGELDGSGDPLSDEHKYWLQLIDHLKVKAFVELCLCESVRGGAAQLSRLSGLGAMKPDTVLLGFRDQAPHRDFFRDPSSPYKTAMFDLEGGEVVFPARSSKISVTEYVRIVSDVLCVGKNVCLCRHFHKLDMDAIAKRSSSSRSIDVWLVEPLRPSREEPFSVRALFALQLAAVVRSARGWTRLGLRVHIITGVSTIGTLPSSPDQLSPGRPITERLEQLLKMLRINATIHPVPEWPSLEGSHRWADLDDDQVYQRVPLNYLQKVNSIIKARSSEAVVTFIQLPPPPPSVNRDDDICSDYLKTLDELTKDLSPTILVRGLKSVTSTSL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: