MonarchBase - Protein-coding gene

DPOGS202450
Transcript	DPOGS202450-TA	1053 bp
Protein	DPOGS202450-PA	350 aa
Genomic position	DPSCF300174 - 198444-199730
RNAseq coverage	56x (Rank: top 69%)

Annotation
*Heliconius*	HMEL015653	3e-157	72.78%
*Bombyx*	BGIBMGA009973-TA	1e-107	57.57%
*Drosophila*	CG14024-PA	4e-59	43.40%
EBI UniRef50	UniRef50_B0W1J7	2e-60	41.98%	Chondroitin 4-sulfotransferase n=2 Tax=Culicinae RepID=B0W1J7_CULQU
NCBI RefSeq	XP_001660640.1	6e-65	48.45%	chondroitin 4-sulfotransferase [Aedes aegypti]
NCBI nr blastp	gi\|157125192	1e-63	48.45%	chondroitin 4-sulfotransferase [Aedes aegypti]
NCBI nr blastx	gi\|157125192	2e-61	48.45%	chondroitin 4-sulfotransferase [Aedes aegypti]

Group
Gene Ontology	GO:0016051	2e-79	carbohydrate biosynthetic process
	GO:0008146	2e-79	sulfotransferase activity
	GO:0016021	2e-79	integral to membrane
KEGG pathway	mdo:100015110	1e-25
	K01017 (CHST11)	maps->	Glycosaminoglycan biosynthesis - chondroitin sulfate
			Sulfur metabolism
InterPro domain	[61-348] IPR018011	2e-79	Carbohydrate sulfotransferase-related
	[106-340] IPR005331	2.6e-36	Sulfotransferase
Orthology group	MCL18889		Insect specific

Nucleotide sequence:

>DPOGS202450-TA
ATGCCATGTTTGAGATGCGGGGCGAAGACCGCTACTTTCATTTTTTGGGCCGCTCTCTATGTGGCGGTCATGAAAGTGACGTTTTTAAGGAACAACGACAACGAAGATGCGAAGGAATTATCGATGGAACCTGACAATTATACTAAGTGGCTGATGCAAGGTCCTGTATTGGGTGACGATGAGGAACAGGTCCAAAGCAACAGCGATTGGCTCGAACCGGATAACACTACTATAAACGAGCTCGAACAACGTGTCAACAAGGTTAAAGAGACTTGCCATTTAAGATCTCTTGACGGTCAATCTATTAACAGTAAAGAATTCTTCGTGGATCACGCTCACAATCTTGTTTGGTGCAACATATTTAAGGCGGCCAGCTCTTCGTGGTTATATAATTTCAATATATTAGGTGGATATGACAAAGCTTTCCTCGCTCGGACTAGACACACGCCATTGACGTTGGCTAGAGACGCTATTGATACCCCAGGAGTGTTGTCGCTATTGATTGTAAGGGAGCCTTTTGTACGATTGTTATCAGCCTACAGGGATAAACTGGAGAATATAACGCCTCCGTATTACAGAAAACTAGCCAGAGCTATTGTGGCTGAACATAGAGAAGCTGCGACGAAAGTTTTAGGACCGATAAAGTCTTTTGGTCCAACGTTTTACGAATTCGTCGCCTATCTCATTTCGAAATATGAATCTGGAACGTTGACCTTCGATGAGCATTGGGCGCCATTTTACCAATTCTGTTCTCCGTGCGCCCTTAATTACACGGTAGTGGCTAAAGTTGAAACGCTATCGAGAGATTCGTCGTATGTAGTACAACAACTAGGACTGGGCGATATTTTAGGACGCAAAGTTGTTAGTCGTAGAACGCGTCTCAGAACTGTCATGAACAAATCGAGGGACGGAAAAAACACATCAGCGCTGATAAAACACTATTTCCGACAGCTGGACATGGATATGCTAGAAAAATTATTACTTATTTACGGCATAGATTTCGAAATGTTTGGATATAATTCAGATATATATCGAAGTTATGTGAGAAATTAA

Protein sequence:

>DPOGS202450-PA
MPCLRCGAKTATFIFWAALYVAVMKVTFLRNNDNEDAKELSMEPDNYTKWLMQGPVLGDDEEQVQSNSDWLEPDNTTINELEQRVNKVKETCHLRSLDGQSINSKEFFVDHAHNLVWCNIFKAASSSWLYNFNILGGYDKAFLARTRHTPLTLARDAIDTPGVLSLLIVREPFVRLLSAYRDKLENITPPYYRKLARAIVAEHREAATKVLGPIKSFGPTFYEFVAYLISKYESGTLTFDEHWAPFYQFCSPCALNYTVVAKVETLSRDSSYVVQQLGLGDILGRKVVSRRTRLRTVMNKSRDGKNTSALIKHYFRQLDMDMLEKLLLIYGIDFEMFGYNSDIYRSYVRN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: