MonarchBase - Protein-coding gene

DPOGS205168
Transcript	DPOGS205168-TA	1137 bp
Protein	DPOGS205168-PA	378 aa
Genomic position	DPSCF300197 - 195608-201232
RNAseq coverage	509x (Rank: top 25%)

Annotation
*Heliconius*	HMEL012799	4e-48	73.73%
*Bombyx*	BGIBMGA001270-TA	3e-77	85.00%
*Drosophila*	CG6903-PA	3e-32	40.22%
EBI UniRef50	UniRef50_C3YL82	9e-41	31.06%	Putative uncharacterized protein (Fragment) n=1 Tax=Branchiostoma floridae RepID=C3YL82_BRAFL
NCBI RefSeq	XP_002100049.1	8e-57	36.62%	GE16376 [Drosophila yakuba]
NCBI nr blastp	gi\|350423601	1e-58	35.40%	PREDICTED: heparan-alpha-glucosaminide N-acetyltransferase-like [Bombus impatiens]
NCBI nr blastx	gi\|350423601	2e-59	34.65%	PREDICTED: heparan-alpha-glucosaminide N-acetyltransferase-like [Bombus impatiens]

Group
KEGG pathway	dya:Dyak_GE16376	2e-56
	K10532 (HGSNAT)	maps->	Lysosome
			Glycosaminoglycan degradation
Orthology group	MCL16628		Insect specific

Nucleotide sequence:

>DPOGS205168-TA
ATGGCTGTGCCTTGTGAATGTCAGCTTATGGAATCTCTGCTCCTACTATTAGGAGTTCTGATCGGGGCGTCGATTCTCTATGGTGTGTTGAGGCTCATCATGTCGAGGGTGAGGAGATCGGCCAAGTTGAGGTATGGAGATAAGGAACTTGCCCTACAGCAACGTCTACGAGCTCTGGACACGTTTCGAGGGATAGCTATCGTTTTCATGATATTTGTGAACGATGGTGCGGGAGGGTACTGGTGGTTGGAACACGCCACCTGGAACGGTCTCTCAGCTGGAGACCTGGTGTTCCCCGCCTTCCTCTGGATCATGGGAGTCTGCATCCCATTATCAATAAAGAGCGCCTTCGCTAAGGGTATACCCAGGTGGAAAATCGTCCTACACATTTTTAAGGTAAATCAAATACTATATTTTATCACAATACGAAGAGAAAGAAATAAATATAAAATTAATTCGTATAATGAATTTCGAGTGATTTATCTTAGAAGAGTTTTTAATTCGTGTCCAATATCTCTACATCTTATTTCGCAAGCTCATACAGTTAAGCATTACCTCCGTATAACGACTACACCGAGAAGTAATAGATTTTTTAGCTTCCAAGTCAGTCATTTTGTGCATTCTCCAGATTATATTTCCTATCGGTATGTCGCAGGATGCCTCACCTCCGCGGTTCAAGCCCTGGTCGGCATCCAAGCCGGCGCCACTGTCCTTCTCCAACGTTCGCACAAAGCCCGGGTGTCTCGTTGGCTGGCCTGGGCTCTAGTGCTAGCTCTAGCCGGGGCCCTACTCGCTGGATTCTCGAGGGAACACGGAGTGCTACCCATCAATAAGAACTTGTGGTCCATGTCGTTCGTGCTGGTGACGTCAGCGGTGTCCCTCGCGATACTCAGCATCTGTTACACATTCACGGACGCCTGGCGGCTGTGGGGCGGAGGACCCTTCAGAGCTCCAGGTCTTAACGCCATCGCCCTGTACATAGGCCACTCGATCTGCGCGCACATATTCCCATTCCATTGGAAAATCCCAACCATGAGAACGCACGCCGTCTATCTCGTGGAAGCCGTATGGGGAACCGCGTTGTGGGTCATCATCGCTCACGTCATGGCCAGAAAGAAAGTATTCATCACCCTCTGA

Protein sequence:

>DPOGS205168-PA
MAVPCECQLMESLLLLLGVLIGASILYGVLRLIMSRVRRSAKLRYGDKELALQQRLRALDTFRGIAIVFMIFVNDGAGGYWWLEHATWNGLSAGDLVFPAFLWIMGVCIPLSIKSAFAKGIPRWKIVLHIFKVNQILYFITIRRERNKYKINSYNEFRVIYLRRVFNSCPISLHLISQAHTVKHYLRITTTPRSNRFFSFQVSHFVHSPDYISYRYVAGCLTSAVQALVGIQAGATVLLQRSHKARVSRWLAWALVLALAGALLAGFSREHGVLPINKNLWSMSFVLVTSAVSLAILSICYTFTDAWRLWGGGPFRAPGLNAIALYIGHSICAHIFPFHWKIPTMRTHAVYLVEAVWGTALWVIIAHVMARKKVFITL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: