MonarchBase - Protein-coding gene

DPOGS201153
Transcript	DPOGS201153-TA	1179 bp
Protein	DPOGS201153-PA	392 aa
Genomic position	DPSCF300065 - 842-11260
RNAseq coverage	42x (Rank: top 72%)

Annotation
*Heliconius*	HMEL002360	2e-131	71.62%
*Bombyx*	BGIBMGA002910-TA	2e-99	53.87%
*Drosophila*	CG5002-PA	1e-83	44.62%
EBI UniRef50	UniRef50_E1ZW29	2e-91	50.82%	Sodium-independent sulfate anion transporter n=7 Tax=Camponotus floridanus RepID=E1ZW29_CAMFO
NCBI RefSeq	XP_001601834.1	3e-95	50.67%	PREDICTED: similar to sulfate transporter [Nasonia vitripennis]
NCBI nr blastp	gi\|345483112	1e-94	50.67%	PREDICTED: sodium-independent sulfate anion transporter-like [Nasonia vitripennis]
NCBI nr blastx	gi\|307196751	2e-97	51.90%	Sodium-independent sulfate anion transporter [Harpegnathos saltator]

Group
Gene Ontology	GO:0006810	1.6e-52	transport
	GO:0055085	1.6e-52	transmembrane transport
	GO:0016021	1.6e-52	integral to membrane
	GO:0005215	1.6e-52	transporter activity
KEGG pathway
InterPro domain	[94-378] IPR011547	1.6e-52	Sulphate transporter
Orthology group	MCL23298		Lepidoptera specific

Nucleotide sequence:

>DPOGS201153-TA
ATGGATTTCGACGATCCGAGGCAGCCGCTATTGGGTATAACAGTGGGTCTAACGTCAATACCGCAAGGGATAGCGTACGCCATTGTAGCAGGACTTCCGCCACAGGTGGGCCTGTACTCCAGTATATTCCCTGGCGTCATGTACGCTATATTCGGCAGCTGTAAGCAGGTGACTGTTGGCCCGACGGCCATATTGGCAGCGTTATTGACCAAGTACGTAGCACAATCAGAAGATTTTGCGTACTTGGCATCCTTTTTGACTGGCTGTGTTATATTACTACTTGGTGTTTTGCAATTAGGTTTCCTTTTAGATTTCATATCAAAGCCAGTTATAAGCGGGTTCACTGCGGCCGCCGCCTTGCAGATATCAGCTTCACAATTAAAATCGTTGTTCAACACGACCGGTAGTTCTGGTGGGACGTTTATAAAGGCTGTTATAAATTTCTTCTCAAATATAAAATCTGTTCAGCTGTGGGACACCTTACTAGGCGTCCTCACCATCGTATCTCTGTTTCTTCTTAAATGCTGCTCCCCCTCCTCCCCCCTCTCGTGCTGTGCCACGTGTCGCGTGCACTCGGTCCGCGCTCGTAACGCCGTAGTCGTGTTTGCGGCTACGGCCGTGGCGTACTTGTTCTACATCTACGGCATGACGCCGTTCAAACTAACCGGTAAAATAGAGGGTGGTTTGCCTAAATTCGGTCTACCTCCATTCCAGACTGTAGTAAATAATAATACTATTGGTTTTGATAAAATGTTGGATGTCTTAGGCCCGGAAGGTCTCGTGATGCCGCTAGTAGCGATACTGGAGAGTATCGCTATTGCTAAAGCCTTCGCCGGCACAGCATCAGTGGACGTCACGCAGGAGATGATAGCTGTGGGTATGTGTAACATAGTGTCGTCGTTCGCGCAGAGCATGCCGGCCACGGGCTCCTTCACACGGACCGCCCTCAACCACGCCAGCGGGGTCATGACGCCAGCCGGCTCCCTGTTTAAAGCGGCGTTAGTGTTACTGTCAGTGACGTACTTGTCCGAGGCGTTCCGCTTCATCCCTCGCTCGACCCTGGCCGGCATCATCATGGTGGCGATGGTGTCCATCGTCGACTTCTCTATTCTACCGCCACTATGGAGACACAGCAGTAAGTGGGCTCGTCCGAGGTCTGTATGGAGACGGGTAGTGTGA

Protein sequence:

>DPOGS201153-PA
MDFDDPRQPLLGITVGLTSIPQGIAYAIVAGLPPQVGLYSSIFPGVMYAIFGSCKQVTVGPTAILAALLTKYVAQSEDFAYLASFLTGCVILLLGVLQLGFLLDFISKPVISGFTAAAALQISASQLKSLFNTTGSSGGTFIKAVINFFSNIKSVQLWDTLLGVLTIVSLFLLKCCSPSSPLSCCATCRVHSVRARNAVVVFAATAVAYLFYIYGMTPFKLTGKIEGGLPKFGLPPFQTVVNNNTIGFDKMLDVLGPEGLVMPLVAILESIAIAKAFAGTASVDVTQEMIAVGMCNIVSSFAQSMPATGSFTRTALNHASGVMTPAGSLFKAALVLLSVTYLSEAFRFIPRSTLAGIIMVAMVSIVDFSILPPLWRHSSKWARPRSVWRRVV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: