MonarchBase - Protein-coding gene

DPOGS213537
Transcript	DPOGS213537-TA	1143 bp
Protein	DPOGS213537-PA	380 aa
Genomic position	DPSCF300033 - 540323-559852
RNAseq coverage	68x (Rank: top 67%)

Annotation
*Heliconius*	HMEL007904	4e-116	86.04%
*Bombyx*	BGIBMGA011817-TA	6e-111	88.63%
*Drosophila*	pip-PL	9e-76	47.18%
EBI UniRef50	UniRef50_E9IF14	1e-119	63.72%	Putative uncharacterized protein (Fragment) n=1 Tax=Solenopsis invicta RepID=E9IF14_SOLIN
NCBI RefSeq	XP_969659.1	1e-128	72.73%	PREDICTED: similar to heparan sulfate 2-o-sulfotransferase, partial [Tribolium castaneum]
NCBI nr blastp	gi\|270015724	5e-128	72.73%	pipe [Tribolium castaneum]
NCBI nr blastx	gi\|270015724	7e-126	72.73%	pipe [Tribolium castaneum]

Group
Gene Ontology	GO:0008146	1.9e-136	sulfotransferase activity
	GO:0016021	1.9e-136	integral to membrane
KEGG pathway	spu:593546	2e-27
	K03193 (UST)	maps->	Glycosaminoglycan biosynthesis - chondroitin sulfate
InterPro domain	[2-377] IPR007734	1.9e-136	Heparan sulphate 2-O-sulfotransferase
	[87-345] IPR005331	1.3e-20	Sulfotransferase
Orthology group	MCL15596		Insect specific

Nucleotide sequence:

>DPOGS213537-TA
ATGGAGCGCCTCAACGACGTCACCGCCTTCAACCACCTAACTGACAAGATTCAGACTGATCGTTCCGAACACGCTTATGCATCAGCTCAAGAATACAAAGAAGCCTTGGAGGCTATACGCAGAAACACAGGAGCCGAACGCAGTAGACCGCAGCGTACTTTAGAAGAGACGAATAGATCGGAGGAAGATCTGGATGCACCAGATGAAGTGATACCAGAGCCCTGGGAACTGAATAATACTGCGAGAGCTGATATAGAGCTGTTGTTCTTTAATAGAGTGCCGAAGGTCGGCAGTCAGACCTTCATGGAATTACTAAGACGACTCGCTATAAAGAATCAGTTTGGTTTCCACCGAGATTCTGTGCAGCGTGTCGAGACGATCCGCCTGGCTCCTGCTAACCAGCAAGTTCTAGCCAGTGTGGTGACGTCACACGCGCCGCCGGCCTCGTACATTAAACATGTCTGCTACACTAACTTTACCAGATTCGGTTATCCTTCTCCGATATACGTGAACGTAGTTCGCGATCCCGTAGAACGCGTCATCTCGTGGTACTACTACGTGCGCGCCCCCTGGTACTACGTGGAAAGGAAACAAGCCTTCCCTGACCTTCCACTACCGGATCCAGCGTGGTTAAAGAAGGACTTCGAGACGTGCGTGTTAAGCGGCGATCGCGAGTGTCGTTATTTGGAGGGCGAGACTCACGAGGGTATTGGAGACCACAGGAGACAGACGCTGTTCTTCTGCGGACACGAACCACAGTGCACGCCATTCAACAGTGTGGAGGCGCTACAACGAGCTAAGCGAGTTGTCGAACAGCAGTACGCTGTGGTTGGAGTGCTGGAAGACCTGAATTCAACGCTGCTGGCCTTCGAGAGATACATACCCAGGTTCTTTACGGGCGCACTCAAAATGTACTGGGAGGAGCTGAACACATTCAACAGAATAAATAGGAACCACTTCAAACTACCCGTCTCCGAGGCTGTTAAGCAAATCGTCCGAGCAAACTTCACCAGAGAAATTGAATTCTACGAGTTCTGCAAACAGAGACTTCACTTACAACTGAAGGCGCTCAGAGATCCATCGATCATACTTCCAACACACAAACAAACTCAATCAACACACTTATATAACAATATGGTATAG

Protein sequence:

>DPOGS213537-PA
MERLNDVTAFNHLTDKIQTDRSEHAYASAQEYKEALEAIRRNTGAERSRPQRTLEETNRSEEDLDAPDEVIPEPWELNNTARADIELLFFNRVPKVGSQTFMELLRRLAIKNQFGFHRDSVQRVETIRLAPANQQVLASVVTSHAPPASYIKHVCYTNFTRFGYPSPIYVNVVRDPVERVISWYYYVRAPWYYVERKQAFPDLPLPDPAWLKKDFETCVLSGDRECRYLEGETHEGIGDHRRQTLFFCGHEPQCTPFNSVEALQRAKRVVEQQYAVVGVLEDLNSTLLAFERYIPRFFTGALKMYWEELNTFNRINRNHFKLPVSEAVKQIVRANFTREIEFYEFCKQRLHLQLKALRDPSIILPTHKQTQSTHLYNNMV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: