MonarchBase - Protein-coding gene

DPOGS211903
Transcript	DPOGS211903-TA	1722 bp
Protein	DPOGS211903-PA	573 aa
Genomic position	DPSCF300011 - 145781-151864
RNAseq coverage	595x (Rank: top 21%)

Annotation
*Heliconius*	HMEL017720	0.0	71.22%
*Bombyx*	BGIBMGA001098-TA	7e-180	65.62%
*Drosophila*	CG8646-PB	9e-175	54.40%
EBI UniRef50	UniRef50_Q8SZ72	1e-172	54.40%	CG8646 n=26 Tax=Pancrustacea RepID=Q8SZ72_DROME
NCBI RefSeq	XP_624454.1	5e-174	55.14%	PREDICTED: similar to CG8646-PA [Apis mellifera]
NCBI nr blastp	gi\|270005303	0.0	60.19%	hypothetical protein TcasGA2_TC007349 [Tribolium castaneum]
NCBI nr blastx	gi\|270005303	0.0	59.33%	hypothetical protein TcasGA2_TC007349 [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	2.1e-118	metabolic process
	GO:0003824	2.1e-118	catalytic activity
	GO:0008484	2.2e-69	sulfuric ester hydrolase activity
KEGG pathway	dme:Dmel_CG8646	7e-173
	K01135 (ARSB)	maps->	Lysosome
			Glycosaminoglycan degradation
InterPro domain	[57-564] IPR017850	2.1e-118	Alkaline-phosphatase-like, core domain
	[57-418] IPR017849	7.8e-101	Alkaline phosphatase-like, alpha/beta/alpha
	[59-411] IPR000917	2.2e-69	Sulfatase
Orthology group	MCL12070		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211903-TA
ATGCGGCTTGAGACTCGATGTACCAATCACATGAATAATTCATGTGACAGCTCCGTTGAGTGTCCGCGGCTGACAGCTGAGGAACTTTTTGAATTTGAATCTCCCAGCAGTATGTTGTTGGTCTTATTATTGTTTATTGTGACCAGTCTGTCTGATTGTGAGTGTCACGAAAGGCCTAATATTGTGTTAATAATAGCCGACGATTTAGGCTGGAACGATGTTGGATTCCACGGATCGAACCAAATACCGACCCCCAATATCGATATTATGGCCTGGTCTGGTGTATCGTTGCACAATTATTACGTGACGCCCATATGCACGCCGTCTAGAGCTGCGCTCATGACGGGGAAGTATCCGATACATACTGGTATGCAACACACTGTAATTTTCGCGGCTGAACCTCGAGGGTTGCCGCTCACTGAGAAAATTTTACCCCAATATTTAAAGGAGCTAGGTTATAAGACACATCTAGTGGGCAAGTGGCATCTCGGATCATACAAAAAGGAATACTTGCCGTTAAATAGGGGATTCGACAGCCATCTTGGATTTTGGAACGGAAAAATAGACATGTACGATCACACGAACCAGGAGAAAGGATATTGGGGATTTGATTTCAGGCGAGACTTCTCCACGGCCCACGACCTGTTCGGGCAGTACGCCACAGATGTCTACACTAACGAAGCTGTCAAGATAATAAAGTCCCACAACACGAGCTCCCCGCTGTTCCTGATGCTGTCTCACTCCGCGGTCCACACCGGCAACCCCTCCGAGCCGATCCGGGCTCCAGAAAAGCTATTCGTCAACTTCACACATATTCAGGATTTCCAACGGAGAAAATTTGCCGCCGTGCTCACGAAACTGGACGAGTCGGTCGGGGAAGTGGTCGCCGCGTTGAAGGCGAAGGGTGTGTTGAACGACAGTATCGTGGTGTTCACGACGGACAACGGCGGGGCCGCGGCCGGGTTCAACGACAACGCCGCCTCCAACTACCCTCTTAGAGGGGTAAAGAATACTCTGTGGGAAGGAGGCGTGCGCGGGGCGGGCTGGCTGTGGAGTCCCTTCATAGACAAGAGATCCCGAGTCGCCACACAGAGGATGCATCTAGTGGACTGGCTGCCGACCTTGCTCAGCGCGGCCGGCATGAACGTTAGTTCGATTAAACATATAGATGGCGTCGATCAGTGGTGCGCGCTGTCCCAGGACCTCCCGTCCGCCAGAGAGTCCTTAGTCCACAACATAGACGATGAGTCCGGCAGCGCTTCCATCACGTACAAACAGTGGAAGGTACATAAAGGCACCAACTACGGCGGGTCCTGGGACGGGTGGTACGGTCCGGCGGGGCGCGAGGGAGCGTACGACACCACACGATTACTAGCATCTAAGGCGGCCGGCGCCCTACTGGATATAGGGATGTTGCCGGATACGGAGCATATACTGAGACTGAGATCTGAAGCGACCGTGGAGTGTGGAGACCGCGAGGCGCTCCCGTGTCGACCGCTGGAGGCGCCGTGCCTCTTTAACATAGACGAAGACCCGTGCGAAACCAGGAACCTCGCCGACATACATCCAGATGTCTTACAAGTGATGTTGAAGGAGCTCGACAGGGTGAACCGCACCGCGGTCCCCCCGAACAACCAGCCGCTGACCCCCGGAGGTGACCCCAAGTATTGGGGCTACGTGATAACGAACTTCGGTGATTATATTAATAATGAAATAAAATAG

Protein sequence:

>DPOGS211903-PA
MRLETRCTNHMNNSCDSSVECPRLTAEELFEFESPSSMLLVLLLFIVTSLSDCECHERPNIVLIIADDLGWNDVGFHGSNQIPTPNIDIMAWSGVSLHNYYVTPICTPSRAALMTGKYPIHTGMQHTVIFAAEPRGLPLTEKILPQYLKELGYKTHLVGKWHLGSYKKEYLPLNRGFDSHLGFWNGKIDMYDHTNQEKGYWGFDFRRDFSTAHDLFGQYATDVYTNEAVKIIKSHNTSSPLFLMLSHSAVHTGNPSEPIRAPEKLFVNFTHIQDFQRRKFAAVLTKLDESVGEVVAALKAKGVLNDSIVVFTTDNGGAAAGFNDNAASNYPLRGVKNTLWEGGVRGAGWLWSPFIDKRSRVATQRMHLVDWLPTLLSAAGMNVSSIKHIDGVDQWCALSQDLPSARESLVHNIDDESGSASITYKQWKVHKGTNYGGSWDGWYGPAGREGAYDTTRLLASKAAGALLDIGMLPDTEHILRLRSEATVECGDREALPCRPLEAPCLFNIDEDPCETRNLADIHPDVLQVMLKELDRVNRTAVPPNNQPLTPGGDPKYWGYVITNFGDYINNEIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: