MonarchBase - Protein-coding gene

DPOGS213790
Transcript	DPOGS213790-TA	1869 bp
Protein	DPOGS213790-PA	622 aa
Genomic position	DPSCF300212 + 774663-776531
RNAseq coverage	228x (Rank: top 44%)

Annotation
*Heliconius*	HMEL013911	0.0	69.13%
*Bombyx*	BGIBMGA009235-TA	0.0	65.97%
*Drosophila*	CG13397-PA	2e-138	42.54%
EBI UniRef50	UniRef50_E2C930	7e-152	45.06%	Alpha-N-acetylglucosaminidase n=10 Tax=Endopterygota RepID=E2C930_HARSA
NCBI RefSeq	XP_001606979.1	4e-148	45.42%	PREDICTED: similar to alpha-n-acetylglucosaminidase [Nasonia vitripennis]
NCBI nr blastp	gi\|307192254	2e-151	45.06%	Alpha-N-acetylglucosaminidase [Harpegnathos saltator]
NCBI nr blastx	gi\|307168312	7e-150	47.38%	Alpha-N-acetylglucosaminidase [Camponotus floridanus]

Group
KEGG pathway	nvi:100123351	1e-147
	K01205 (NAGLU)	maps->	Lysosome
			Glycosaminoglycan degradation
InterPro domain	[1-596] IPR007781	2.4e-199	Alpha-N-acetylglucosaminidase
Orthology group	MCL13146		Single-copy universal gene

Nucleotide sequence:

>DPOGS213790-TA
ATGGCATTAAATGGCATTAATATGGCATTGGCTCCGGTAGCACAGGAGGCCGCCTGGACGAGGGTTTACAAACAGCTAGGAATGACCGATGACGAGATTAAGGAACACTTCACGGGGCCTGGTTTCCTCGCATGGCTTCGGATGGGAAATGTTCATGGTTGGGGAGGGCCACTTCCACAATCTTGGCATGACAGGCAGAAACAAATCCAAGAAGTTGTCACCGATTTGATGTTCAAGTTAGGTATGATACCGGTATTTCCAGCTTTCAATGGACACGTCCCGAAAGCATTTGAAAAAATATTCCCAAACACAACCTTCCATCCGGTGGAGACGTGGAACAAATTTGACGAAGACTACTGTTGCAATCTATTCGTAGACCCCAGGGAGCCGGATTTTAAGATGATATCTAAAATGTTCATGAGAGAAATAACCGCAGGATTGGGCAGCAGTCACATATACACGGCGGATCCGTTCAACGAGATAAAAATACAACCCTGGTCCACATCATTGGTGGTAGAAACAGCTAAAGCTATATTTTCAAGTATCTCCGAGTATGACAAGGATGCCGTGTGGCTTGTACAGAACTGGATGTTCGTTCACAATCCCTTACTTTGGCCATTGAAGAGAGTTAACAGCTTCTTAACATCTGTACCAAACGGTAGAATGCTTGTATTGGACCTTCAATCGGAACAGTGGCCACAATATGACTTATATCAAATGTATTACGGACAGCCGTTTATTTGGAGTATGCTACATAATTTCGGGGGTACTTTAGGTATGTTCGGTAATACTAAAACCATAAACAAGGACGTGTATGAAGTAAGGAAAAGGGAGAACAGCACTATGGTAGGGATAGGACTGACCCCGGAAGGTATAAACCAGAATTATGTTATCTACGATTTAATGTTAGAATCAGCTTGGCGCAAGGGACCCGTACCGGATCTCGAAGAATGGGTATCAGACTACGCAGAAAGGAGATACGGCTGCAATGCAACTTCCATAGGATGGAAATATCTGCTTAGGAGCGTCTATAATTTTACAGGTCTCAACAGAATTAGAGGTAAATATGTAATGACTAGACGTCCCAGCTTTAACATCAGACCATGGGCGTGGTACAAGGGGCATGATTTATTCGAAGCTTTAAAGAACTTCGTCTATGTACAAAACCCAGCCTGCTCTACATCAGGTTTCTTACACGACTTGGTTGATGTCACCCGTCAAGCGTTGCAATACAAAATTGAACAGATCTATATGAACTTACAAAACGACAGATATTCAAACTACATGGTGTTCAACTACACCATATCTAGCTTCATAGATGCCATGACTGATATGCAAAATATATTAGCAACGAGCAGTGATTTCAAAATTACATCGTGGTTATCCAGCGCAAGGGCAATCTCAAATCTACCTTTGGAATCATCACTGTATGATTTCAACGCGCGCAATCAAATAACCCTATGGGGTCCCAATGGGGAAATCAGTGATTATGCATGTAAACAATGGGCCGAACTTTTTAAGTACTACTACATACCAAGATGGTCGATATTTTTATCCATGGCATTAGATGCCAAGACAAGAAACGAACCTTTTGATGAAAAAGGAGCTCAGAGAGTAGTGAGGTCTTCGGTGGAAGAGAAATTCGCGAGCATCAATATAGACTACATACCGTCTGATAATCCACAACAACTCGCCCTAAATCTGTACCAAAAATGGTTCAGTGTATCAGGACACGCGGATTTACCTATGAGGATAATTAAACAGGATCCAAAGAAAAAGACAACATTGCCTGATACGGACACAGACGGCGAAGATTACAATGAAAATACCCCAACAGTTATTTTCTTGCACTCTACGACACCTAATTAG

Protein sequence:

>DPOGS213790-PA
MALNGINMALAPVAQEAAWTRVYKQLGMTDDEIKEHFTGPGFLAWLRMGNVHGWGGPLPQSWHDRQKQIQEVVTDLMFKLGMIPVFPAFNGHVPKAFEKIFPNTTFHPVETWNKFDEDYCCNLFVDPREPDFKMISKMFMREITAGLGSSHIYTADPFNEIKIQPWSTSLVVETAKAIFSSISEYDKDAVWLVQNWMFVHNPLLWPLKRVNSFLTSVPNGRMLVLDLQSEQWPQYDLYQMYYGQPFIWSMLHNFGGTLGMFGNTKTINKDVYEVRKRENSTMVGIGLTPEGINQNYVIYDLMLESAWRKGPVPDLEEWVSDYAERRYGCNATSIGWKYLLRSVYNFTGLNRIRGKYVMTRRPSFNIRPWAWYKGHDLFEALKNFVYVQNPACSTSGFLHDLVDVTRQALQYKIEQIYMNLQNDRYSNYMVFNYTISSFIDAMTDMQNILATSSDFKITSWLSSARAISNLPLESSLYDFNARNQITLWGPNGEISDYACKQWAELFKYYYIPRWSIFLSMALDAKTRNEPFDEKGAQRVVRSSVEEKFASINIDYIPSDNPQQLALNLYQKWFSVSGHADLPMRIIKQDPKKKTTLPDTDTDGEDYNENTPTVIFLHSTTPN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: