MonarchBase - Protein-coding gene

DPOGS214376
Transcript	DPOGS214376-TA	1233 bp
Protein	DPOGS214376-PA	410 aa
Genomic position	DPSCF300020 + 882111-885750
RNAseq coverage	171x (Rank: top 51%)

Annotation
*Heliconius*	HMEL014237	3e-120	76.47%
*Bombyx*	BGIBMGA004000-TA	2e-137	61.83%
*Drosophila*	CG7997-PA	6e-145	57.14%
EBI UniRef50	UniRef50_E0VBI5	2e-124	53.63%	Alpha-N-acetylgalactosaminidase, putative n=5 Tax=Bilateria RepID=E0VBI5_PEDHC
NCBI RefSeq	NP_001040191.1	7e-164	66.01%	alpha-N-acetylgalactosaminidase [Bombyx mori]
NCBI nr blastp	gi\|114051916	1e-162	66.01%	alpha-N-acetylgalactosaminidase precursor [Bombyx mori]
NCBI nr blastx	gi\|114051916	4e-163	66.17%	alpha-N-acetylgalactosaminidase precursor [Bombyx mori]

Group
Gene Ontology	GO:0008152	1.4e-115	metabolic process
	GO:0003824	1.4e-115	catalytic activity
	GO:0004553	2.6e-52	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	2.6e-52	carbohydrate metabolic process
	GO:0043169	2.8e-18	cation binding
KEGG pathway	der:Dere_GG22272	1e-143
	K01189 (GLA)	maps->	Galactose metabolism
			Lysosome
			Glycerolipid metabolism
			Sphingolipid metabolism
			Glycosphingolipid biosynthesis - globo series
InterPro domain	[16-306] IPR013785	1.4e-115	Aldolase-type TIM barrel
	[18-305] IPR017853	2.3e-99	Glycoside hydrolase, superfamily
	[20-39] IPR002241	2.6e-52	Glycoside hydrolase, family 27
	[307-399] IPR013780	2.8e-18	Glycosyl hydrolase, family 13, all-beta
	[51-132] IPR000111	1.7e-12	Glycoside hydrolase, clan GH-D
Orthology group	MCL17256		Insect specific

Nucleotide sequence:

>DPOGS214376-TA
ATGGGAACTCATTTAATCGCCATTTTTGCAATAATACCATATGTCTTGGCTCTCGATAATGGACTAGCGCTCACTCCGCCAATGGGGTGGTTGACCTGGCAGCGATTTCGATGTATAACAGATTGCGATAAATATCCAAATGAGTGTATAAGTGAATCTCTCATTAAACGGATGGCAGACATTATGGTCAACGAGGGATATTCCCACGCTGGGTACAAATACGTCGGCATCGACGACTGTTGGCTCGAGAAAACACGTGACGCAAACGGTCGATTGGTTCCCGATAGGAAACGGTTTCCGAACGGTATGAAGGCTGTCGCAGATTATCTGCATGATCTCGGTTTAAAATTCGCGTTATACCAGGATTACGGTACAAAAACCTGCGCTGGTTACCCCGGGGTACTAGGGCATGAGGCTGTTGACGTTCAGACATTCGCCGAATGGGAAGTGGATTATATTAAATTAGACGGATGTAATGTCAACGTTTCCAAGATGGACACCGGTTATCCGGAATTTGGAAAATTGATGAATGAAAGCGGTCGGCCCATGGTATACTCATGTAGCTGGCCAGCGTATCAGAATAAACCTGATTATGCATCGATATCGAAGCACTGTAACATGTGGCGTAACTGGGACGATATCCAGGACTCGTGGGCTTCACTCACCACGATCATGAGCTGGTTTGCGGAAAAACAGGAAGAAATCGCCAAATACGCCGGACCCGGAAGATGGAATGACCCGGATATGTTGCTCATAGGAAATTTTGGATTATCACTGGACCAGGCGAGAGTTCAAATGGCCGTGTGGTCGATACTGGCCGCCCCACTGCTCATGAGTGTAGATCTGGCCACCATCCGACCGGAGTTTAAGGAGGTGTTGCTTAACAAAGACATCATAGCCATAGATCAAGACGAGCTGGGCAAGCAAGGGTTAATGGTGTGGAATAAAGCGAAATGCGAGATCTGGACACGCGAATTAGTGGACGGTATAGCGGTAGCGTTTGTCAGTAAAAGAGATGATGGAGCGCCTCACACTGTTGATGTTACAACTGAGGATATGAAAATACCACCGACGACGTATCATATACAGGATCTGTACAAAGATGGACATAATTTCAAATTTGATTGCAAAGGAAACTTCACAACCAGAATCAATCCGTCAGGCGTCAGATTCTACAAGTTCATCCCCATAAAAGGCAATGAGGTTGATAGCCCTTCTATCACCTATATATAG

Protein sequence:

>DPOGS214376-PA
MGTHLIAIFAIIPYVLALDNGLALTPPMGWLTWQRFRCITDCDKYPNECISESLIKRMADIMVNEGYSHAGYKYVGIDDCWLEKTRDANGRLVPDRKRFPNGMKAVADYLHDLGLKFALYQDYGTKTCAGYPGVLGHEAVDVQTFAEWEVDYIKLDGCNVNVSKMDTGYPEFGKLMNESGRPMVYSCSWPAYQNKPDYASISKHCNMWRNWDDIQDSWASLTTIMSWFAEKQEEIAKYAGPGRWNDPDMLLIGNFGLSLDQARVQMAVWSILAAPLLMSVDLATIRPEFKEVLLNKDIIAIDQDELGKQGLMVWNKAKCEIWTRELVDGIAVAFVSKRDDGAPHTVDVTTEDMKIPPTTYHIQDLYKDGHNFKFDCKGNFTTRINPSGVRFYKFIPIKGNEVDSPSITYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: