MonarchBase - Protein-coding gene

DPOGS201167
Transcript	DPOGS201167-TA	1875 bp
Protein	DPOGS201167-PA	624 aa
Genomic position	DPSCF300065 + 706439-710309
RNAseq coverage	1397x (Rank: top 9%)

Annotation
*Heliconius*	HMEL013734	2e-156	47.87%
*Bombyx*	BGIBMGA003964-TA	0.0	88.42%
*Drosophila*	Esp-PB	0.0	52.32%
EBI UniRef50	UniRef50_Q7QBV8	0.0	58.32%	AGAP002331-PA n=5 Tax=Endopterygota RepID=Q7QBV8_ANOGA
NCBI RefSeq	XP_972290.1	0.0	56.93%	PREDICTED: similar to AGAP002331-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91089581	0.0	56.93%	PREDICTED: similar to AGAP002331-PA [Tribolium castaneum]
NCBI nr blastx	gi\|347967643	0.0	58.32%	AGAP002331-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0006810	3.2e-52	transport
	GO:0055085	3.2e-52	transmembrane transport
	GO:0016021	3.2e-52	integral to membrane
	GO:0005215	3.2e-52	transporter activity
KEGG pathway
InterPro domain	[157-458] IPR011547	3.2e-52	Sulphate transporter
	[502-589] IPR002645	1.1e-06	Sulphate transporter/antisigma-factor antagonist STAS
Orthology group	MCL10158		Insect specific

Nucleotide sequence:

>DPOGS201167-TA
ATGATACCGCGGAGAAAACACAACGCGTCTTCAGGGTCGCTTCCGCCACCAGACGACAAGAACGCCAGCAACGACTATATTCTTTCAGAAAATGGCACGAGCGAGGGTTGGCGAGCAGCTCTACGAAGACGGTTCAATAAGAAAACCCTTAACAAGAGATTTCCCGTCACAGCCTGGCTACCGCAGTACAATGTGGAAGAGGCGATCGGAGACGTCATAGCGGGGGTTTCTGTGGGTTTGACAGTTATCCCCCAGTCTTTGGCCTACTCTAACATCGCCGGTCTGCCTCCTCAATACGGATTGTACGGCTCGTTCATCGGTTGCTTTGTATACATCATACTGGGAGGGTGCCGGGCCGTACCCGCAGGACCTACTGCCATTGCATCGTTACTCACTTGGCAAGTGGCTGGCGGCGTAGTGGAGAAGGCGATCCTCTTGAATTTGCTCACGGGACTCGTGGAACTTATGATGGGAGTGCTCGGTCTAGGCTTTCTTATCAATTTCGTCTCAGGACCCGTTTCTTCAGGTTTCACATCAGCAGTTGCTCTGATGATCGCCACATCCCAAGTCAAAGACATGTTCGCTATATCTGTGACCGGAACTACTTTCTTACAACAGTGGATTTCTGTATTCCAAAATATTCACAATGCATCACTTTGGGATCCAGTACTAGGATTCATCTGCATTGCGTTACTTCTTTCAATGAGGAAAATCGGGATGATTAAATTAGGAGCAAAAAACCCGGAAGGTCCAAGCACGCGACAAAAAGTTCTGACGCGTTGCATGTGGCTGTTGGGGACATGTCGGAATGCCATCGTGGTGGTGGCGTCGGGAGCTTTGGGATTCTGGTTTGTGAGCGAACAGGGATCCTCACCCGTGCGACTCATGGGAGCGATACCGTCGGGAGTACCGACACCGCAGGCGCCGCCGATGAGCTACGTGCGTGCCGACAACACCACAGCAGACTTCTTAGAGATGGTCTCGGAATTGGGCTCGGGTCTGCTGGTGATACCCATCATTGTACTTCTGGAGGATATCGCTATCTGCAAGGCGTTCTCAGATGGACGAACTATAGATGCCACGCAGGAGATGATCGCACTCGGTGTAGCCAACATCGCTAACTCCTTTATGCAAGCGTACCCGGGCGGCGGGTCACTGGCACGATCCGTCGTCTCCAACGGCTCCGGAGTCAGAACAACCTTCAATGGACTTTATACTGGTGTCATGGTTATCTTGGCCCTACAATTTTTTACGCAATATTTCGAGTACATACCCAAAGCTGCACTTGCTGCTGTGATTATTTCTGCAATTTTATTTATGGTGGAATACGATGTTATAAAACCAATGTGGCGAGCTAAAAAATTGGACTTGATACCTGGCGTAGGCACATTCATTCTCTGCTTAACTCTTCCTATCGAGTTGGGTATTCTAACTGGAGTCGTCGTCAACATTATTTTCATCCTGTACCACGCAGCACGCCCTAAATTCTCTGTTGAAATGTTAAAGACGGAGCAGGGTGTGGAGTATTTGATGATCACCCCCGACCGCTGTCTCATGTTTCCGTCTGTCGACTATGTGCGCCGGCTCGTCACTAAATGTGCCGCCAGCAGCTCGGTACCCGTCGTGATCGAATGCACACACATATACAGCGCTGACTACACCGCTGCCAAGAGTATCGAACAACTCACAGGGGACTTTCACGCCCGCCAACAGCCCCTCTACTTCTACAACGTCAAACCCTCAGTCTGCTCTATTTTCGAAGCTGTTACGAAGCCTGAGCACTTCGTTGTGTTCTACGAGGACGATGAATTGGACCGCCTCTTGGCCGCCGACGAACGCCTCGCACCTCGTAAACCGCCCCCACTGCACGTTTAG

Protein sequence:

>DPOGS201167-PA
MIPRRKHNASSGSLPPPDDKNASNDYILSENGTSEGWRAALRRRFNKKTLNKRFPVTAWLPQYNVEEAIGDVIAGVSVGLTVIPQSLAYSNIAGLPPQYGLYGSFIGCFVYIILGGCRAVPAGPTAIASLLTWQVAGGVVEKAILLNLLTGLVELMMGVLGLGFLINFVSGPVSSGFTSAVALMIATSQVKDMFAISVTGTTFLQQWISVFQNIHNASLWDPVLGFICIALLLSMRKIGMIKLGAKNPEGPSTRQKVLTRCMWLLGTCRNAIVVVASGALGFWFVSEQGSSPVRLMGAIPSGVPTPQAPPMSYVRADNTTADFLEMVSELGSGLLVIPIIVLLEDIAICKAFSDGRTIDATQEMIALGVANIANSFMQAYPGGGSLARSVVSNGSGVRTTFNGLYTGVMVILALQFFTQYFEYIPKAALAAVIISAILFMVEYDVIKPMWRAKKLDLIPGVGTFILCLTLPIELGILTGVVVNIIFILYHAARPKFSVEMLKTEQGVEYLMITPDRCLMFPSVDYVRRLVTKCAASSSVPVVIECTHIYSADYTAAKSIEQLTGDFHARQQPLYFYNVKPSVCSIFEAVTKPEHFVVFYEDDELDRLLAADERLAPRKPPPLHV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: