MonarchBase - Protein-coding gene

DPOGS202663
Transcript	DPOGS202663-TA	1404 bp
Protein	DPOGS202663-PA	467 aa
Genomic position	DPSCF300039 + 135214-136851
RNAseq coverage	32x (Rank: top 75%)

Annotation
*Heliconius*	HMEL002228	7e-101	65.41%
*Bombyx*	BGIBMGA001291-TA	0.0	65.82%
*Drosophila*	CG12014-PA	9e-126	46.82%
EBI UniRef50	UniRef50_Q1WJM2	7e-129	48.60%	Iduronate 2-sulfatase n=11 Tax=Endopterygota RepID=Q1WJM2_ANOGA
NCBI RefSeq	XP_967324.1	5e-134	53.46%	PREDICTED: similar to iduronate 2-sulfatase [Tribolium castaneum]
NCBI nr blastp	gi\|91079414	1e-132	53.46%	PREDICTED: similar to iduronate 2-sulfatase [Tribolium castaneum]
NCBI nr blastx	gi\|91079414	9e-134	53.04%	PREDICTED: similar to iduronate 2-sulfatase [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	2.4e-76	metabolic process
	GO:0003824	2.4e-76	catalytic activity
	GO:0008484	1.5e-42	sulfuric ester hydrolase activity
KEGG pathway	tca:655669	1e-133
	K01136 (IDS)	maps->	Lysosome
			Glycosaminoglycan degradation
InterPro domain	[3-467] IPR017850	2.4e-76	Alkaline-phosphatase-like, core domain
	[4-365] IPR017849	2.3e-72	Alkaline phosphatase-like, alpha/beta/alpha
	[10-376] IPR000917	1.5e-42	Sulfatase
Orthology group	MCL10621		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202663-TA
ATGCGATACCTTTCAGAGGAAGTTTACTTGCCAAATTTTCAAAAATTGGCGGCAAAAGGAATCACATTTCAAAAGGCTTTTGCACAACAAGCATTGTGTGCACCAAGTAGAAATTCTATTTTAACCGGTCGTCGACCAGATGAGTTACGCTTGTATGACTTTTATAATTATTGGCGCGACACTGTTGGAAATTTTTCTACATTTCCTCAAATATTCAAGGAACACGGATACGATACGTACTCAGCTGGAAAAATATTCCACCCAGGAAAGAGTTCCAATTTTACGGACGACTATCCTTATAGCTGGACACTAAAACCTTATCATCCTCCAACCGAAAAATATAAAGACGATGCATTGTGTAAAGATAGACATAGTATAACTTTACACAAAAATCTGATTTGTCCAATCAACGTTAAGGAACAGCCCGATAATACATTACCTGACCTCGAAACCCTCAAATACTCAATTGATATTATTAAAAATAGAAACCAAACTAAACCCTTCCTGCTAGCTGTCGGATTTCACAAGCCTCATATTCCTTTAAAATATCCTCATAAATACTTGAAAAATGTTCCAATTAGTTCAGTGAATCCGCCACGTGTGTCGTCTATCCCTAAGGGTCTACCGCTGGTATCTTGGCATCCTTGGACGGATGTCCGGCGAAGAGATGACATTAAGAAACTAAACCTTACTTTCCCATTTGGTATAATGCCTCCGAAATGGACGTTAAAGATAAGGCAAAGTTATTATGCTGCGTCACTATACATAGATGATCTTTTGGGAAAACTTATGAGCCATGTAAATCAAACCAACACCATAATTGTTGTTACTAGTGATCATGGTTGGTCTTTGGGTGAAAATGGACTTTGGGCAAAGTATAGCAACTTTGATGTCGCCCTGAGGGTGCCCTTGCTTTTTAAAATACCCGGATTTCAGCCCAAGGTCATAACTAATCCTGTTGAATTGGTCGACATATACCCAACTTTACTTGAAGTGGGTTTAAATATATTTGTACCAAAATGTAAGAATAATGATGATAAATCCACTTTATGTTCGAGTGGAAAAAGTTTAGTACAATTAATGTCAAACAAACATAATACTGGTAGATCATTTGCCATATCCCAGTATCCACGGCCACAGGTACAACCTACAAAAAGTTCTGATAAACCAAAACTGAAAGATATAAAAATAATGGGTTATAGCATCCGAACGGAAAAATATAGATACACTGAATGGATATCATTTAATAATACACATTTCACTAGGAACTGGAATAAAATACACGGGATCGAACTATACAACCATGTTTATGATGACGAAGAATCAAATAATCTGTACCTAGTACCATATTATCAGGATATAAAAAAACAATTATCAGCATTACTGAGGTCAACAATAAATTAG

Protein sequence:

>DPOGS202663-PA
MRYLSEEVYLPNFQKLAAKGITFQKAFAQQALCAPSRNSILTGRRPDELRLYDFYNYWRDTVGNFSTFPQIFKEHGYDTYSAGKIFHPGKSSNFTDDYPYSWTLKPYHPPTEKYKDDALCKDRHSITLHKNLICPINVKEQPDNTLPDLETLKYSIDIIKNRNQTKPFLLAVGFHKPHIPLKYPHKYLKNVPISSVNPPRVSSIPKGLPLVSWHPWTDVRRRDDIKKLNLTFPFGIMPPKWTLKIRQSYYAASLYIDDLLGKLMSHVNQTNTIIVVTSDHGWSLGENGLWAKYSNFDVALRVPLLFKIPGFQPKVITNPVELVDIYPTLLEVGLNIFVPKCKNNDDKSTLCSSGKSLVQLMSNKHNTGRSFAISQYPRPQVQPTKSSDKPKLKDIKIMGYSIRTEKYRYTEWISFNNTHFTRNWNKIHGIELYNHVYDDEESNNLYLVPYYQDIKKQLSALLRSTIN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: