MonarchBase - Protein-coding gene

DPOGS210498
Transcript	DPOGS210498-TA	1533 bp
Protein	DPOGS210498-PA	510 aa
Genomic position	DPSCF300186 - 66530-70146
RNAseq coverage	69x (Rank: top 66%)

Annotation
*Heliconius*	HMEL022265	0.0	65.17%
*Bombyx*	BGIBMGA012587-TA	3e-149	69.01%
*Drosophila*	CG7442-PA	1e-81	34.52%
EBI UniRef50	UniRef50_E2A7K4	3e-86	34.76%	Solute carrier family 22 member 21 n=7 Tax=Formicidae RepID=E2A7K4_CAMFO
NCBI RefSeq	XP_391853.2	2e-87	36.36%	PREDICTED: similar to CG7442-PA [Apis mellifera]
NCBI nr blastp	gi\|380015366	1e-88	36.44%	PREDICTED: solute carrier family 22 member 21-like [Apis florea]
NCBI nr blastx	gi\|328782698	5e-90	35.78%	PREDICTED: solute carrier family 22 member 21-like [Apis mellifera]

Group
Gene Ontology	GO:0055085	4.7e-29	transmembrane transport
	GO:0016021	4.7e-29	integral to membrane
	GO:0022857	4.7e-29	transmembrane transporter activity
KEGG pathway
InterPro domain	[105-479] IPR016196	6.4e-36	Major facilitator superfamily domain, general substrate transporter
	[105-474] IPR005828	4.7e-29	General substrate transporter
Orthology group	MCL25982		Lepidoptera specific

Nucleotide sequence:

>DPOGS210498-TA
ATGCTGGCCCTCGTCTACTCTACCAACTCCATGTATATCGTGAACTACGTCTTCGCGGTTGAAGATGTCAGTTACAGGTGTAAGGTCCCGGAATGCGAGAGCGGCAGCAGTTTCTCCGTCCCCTGGCTGAACGCTTCGAGTTTGGATTCGTTTGAGGTCGGTGTGAAGCAATGTCACCGCAGTCCACCGCTCAACGGACGCTGTACACACTTCAATCAAACTGAACTGATGAGATGCGATGAGTGGGTGTACGAGGTCCCCGACAGCTTCGTGGCCGAATTTGGTTTAGCCTGCCAGGACTGGAAACCCCCTTTAGTCGGGACCATACATAGCCTCGGATGCCTCATAGGACAAATAATACAAGGACAAATATCAGACAGGTTCGGTCGTAAGACAGCTGCAGTATTCTCGGGCACAATGGGGGCTGTACTCGGTCTATCCAAAAGTTTTGCCTCGTCTTTCTGGGTGTATCTCGCGCTGGAGGGCCTGGAGGCTACTATCGGAGATGCCTTATCTCCTATGTTTATGTTAAGCATCGAGATCGTAGATAAGCAGCGTGCTGTGTTATATCAAATGATATTACTGAATTTCTACACTATCGGTCAAATTGTAATGTCATTTGTCGCCTGGGCGGTGCCATACTGGAGGAACTTCCTCCGTGTGATCTACGCGCCGACTCTCCTCATAATTACATACTCATTCTTTTTGGATGAGAGTATTCGATGGCTTTTTAGTAAAGGACAAAAAGAGAGAGCTATCCGATTAATAGAAAAAATAGCAAAAAGAAACAATGTACAGATTGACCGAAATATGATTAACAAACTTGAGTATACGGATGAAAAAACTTCAAGCAAAGCAGACAGGAAGTTGCTGTTAAAGACTTTTAAATCACAAATAATGATGCGAAGGTTCCTCGTGTGTCTCGTCTGGTGGTTCACGATCACTCTCATCAACTACGGTATGATGATCAGCTCGGTTCTCATCAACGGCAACAAGTACTTGAACTTCGCTCTCCTTATAATGATGGACATTCCGTCCAATATCTTCTATTGGTTAGCTTTGTCAAAGTATAAAAGAAAGATCCCGCTGATGGGATCGTTCGTCATGGGTGGGATTTTTTGTATCTCCCAACCTTTTGTTCCTAAAGACCTGGCGTGGATGGGCTTGGCTCTTTTTATGTTATTCGAGATGCTGGCCACCTTCTCTTACAACATTGTGTACATGTACACGTCCGAGCTCTTCCCGACTTACACCAGGAACTCCATGCACTCCATTTGCTCCGCCATAGGACGAGTAGGATCCCTGATTGCGCCTCAGACACCCCTCTTGATGACCTACTGGTCAGGTTTGCCCGCGCTCCTCTTCGGTCTGTCGTCCCTCGTTTCTGGAGCCCTGACTATCTTCATGCCGGAGACAGCGTGCACTCAGCTACCTGACACGGTGAGGGAAGCTGAGGCCCTCGGGAGGAAAACAAATAAGAAGAGATCACAGATGCATTTCGACCAGACAGAACAAATGTTGAAAGCGTCATAA

Protein sequence:

>DPOGS210498-PA
MLALVYSTNSMYIVNYVFAVEDVSYRCKVPECESGSSFSVPWLNASSLDSFEVGVKQCHRSPPLNGRCTHFNQTELMRCDEWVYEVPDSFVAEFGLACQDWKPPLVGTIHSLGCLIGQIIQGQISDRFGRKTAAVFSGTMGAVLGLSKSFASSFWVYLALEGLEATIGDALSPMFMLSIEIVDKQRAVLYQMILLNFYTIGQIVMSFVAWAVPYWRNFLRVIYAPTLLIITYSFFLDESIRWLFSKGQKERAIRLIEKIAKRNNVQIDRNMINKLEYTDEKTSSKADRKLLLKTFKSQIMMRRFLVCLVWWFTITLINYGMMISSVLINGNKYLNFALLIMMDIPSNIFYWLALSKYKRKIPLMGSFVMGGIFCISQPFVPKDLAWMGLALFMLFEMLATFSYNIVYMYTSELFPTYTRNSMHSICSAIGRVGSLIAPQTPLLMTYWSGLPALLFGLSSLVSGALTIFMPETACTQLPDTVREAEALGRKTNKKRSQMHFDQTEQMLKAS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: