MonarchBase - Protein-coding gene

DPOGS215795
Transcript	DPOGS215795-TA	1506 bp
Protein	DPOGS215795-PA	501 aa
Genomic position	DPSCF300041 + 2063720-2068593
RNAseq coverage	305x (Rank: top 37%)

Annotation
*Heliconius*	HMEL005931	0.0	83.67%
*Bombyx*	BGIBMGA003512-TA	0.0	81.17%
*Drosophila*	CG9701-PA	2e-133	46.87%
EBI UniRef50	UniRef50_G6D5V2	0.0	100.00%	Glucosidase n=2 Tax=Obtectomera RepID=G6D5V2_DANPL
NCBI RefSeq	NP_001037073.1	0.0	81.57%	glucosidase [Bombyx mori]
NCBI nr blastp	gi\|112983036	0.0	81.57%	glucosidase precursor [Bombyx mori]
NCBI nr blastx	gi\|112983036	0.0	81.57%	glucosidase precursor [Bombyx mori]

Group
Gene Ontology	GO:0004553	2.1e-229	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	2.1e-229	carbohydrate metabolic process
	GO:0043169	2e-165	cation binding
	GO:0003824	2e-165	catalytic activity
KEGG pathway	tca:664577	7e-131
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[22-501] IPR001360	2.1e-229	Glycoside hydrolase, family 1
	[23-487] IPR013781	2e-165	Glycoside hydrolase, subgroup, catalytic core
	[23-492] IPR017853	2.8e-158	Glycoside hydrolase, superfamily
Orthology group	MCL24915		Lepidoptera specific

Nucleotide sequence:

>DPOGS215795-TA
ATGGCGATCAAAGAGGCAACTTTTATCGCCCTCCTGGCGTTAGTACATTCGGGACATGCGCAGTACACTAAGTTTCCGGAAGGATTCACCTTTGGAGTAGCGACTGCTGCTCATCAAATAGAAGGGTCATGGAACGTCAGTGGAAAAACTGAAAACGTATGGGACCATCTGTCTCACAATCGGCCATGGATGATAGCTGACGGAACCAATGGCGATGTAGCCTGTGACTCCTACAACCGTTACCAAGAAGATGTAGATGAGCTGGCATACATGGGTGTAGATTTCTACAGACTGTCTCTGTCTTGGGCCAGAATTCTGCCAACTGGACGCATGGATGTCATAAATCCTGATGGTATTAGATACTACAACGCACTCTTTGATGCTTTAGCCGAAAAAAAAATTGAACCACTGGTTACTCTGTTCCATTGGGATTTACCACAATCACTCCAAGACCTAGGTGGATGGGCGAATCCGAAAATGATTGATTACTTCCGCGATTACGCAGACGTATGCTTCAGAGAGTTCGGTGATAAAGTCAAATCCTGGATTACACTTAATGAGCCCTATGAAATTTGTGAAGATGCTTATGGGGATGACAAGAAAGCTCCTGCCATCGATAGCCACGGTGTAGGAAACTACTTGTGCAGCGACACTCTGTTGAAAGCTCACGCCGAAGTTTACCATCTCTACAACGACACCTACAGACCTATACAAAACGGAAGAATAATGATTTCAATAAATTCAATTTGGTACGAACCAAGTGATCCCGAAAACGCGGAACAAGTTGCTCTGGCTGAAGTTGCTAACCAATTTAAATTCGGGTGGTTCGCAAATCCTATTTTCACCGAAGAAGGTGGCTATCCCGTCGTAATGGTAGAAAATATTGCTGAGCAAAGTAAAGCTGAAGGATTAAATAAACCTAGATTAGAACAATTCGATGAGTACTGGATTGAAAGAATTAAGGGTACATCAGACTTCCTTGGTATCAATCACTACACCACGCATTTGATAACCGGCCCGGGAGTGGACTCTCTCGCCAAACACCCGTCTTGGCTAAAAGATATTGGAGCGGTAGTAAGTTTGGACGTGGGTAGAGATTCAGCCTCAGAGTGGCTAAGAGTAGTGCCAACGGGTTTTGCAAACTTATTACGCTGGTGCAAGAGTACGTACAATGATGTTCCAATTTACATCACCGAGAACGGATTTTCTGATCGTGGCGCCATAGAAGATTACGACCGTATTAGATATTACAACGACTACCTCTCCGAAATTTTGAATGTCATTTATGACGATGATGTCAAAGTCCTTGGTTACACTGCATGGACCCTAATGGACAACTTCGAATGGCGAGCTGGATTTTCTGAACGCTTCGGTCTTTACCACGTGGACATAACGGATCCGAATCTCCCAAGAACACCGAAACTCTCTGCGGAATACTACAAGCAATTATGTGAAACGAAGGAAATACCTCAAGATGAACGGTTCAAGGATCCAGCTGTAAGTTGA

Protein sequence:

>DPOGS215795-PA
MAIKEATFIALLALVHSGHAQYTKFPEGFTFGVATAAHQIEGSWNVSGKTENVWDHLSHNRPWMIADGTNGDVACDSYNRYQEDVDELAYMGVDFYRLSLSWARILPTGRMDVINPDGIRYYNALFDALAEKKIEPLVTLFHWDLPQSLQDLGGWANPKMIDYFRDYADVCFREFGDKVKSWITLNEPYEICEDAYGDDKKAPAIDSHGVGNYLCSDTLLKAHAEVYHLYNDTYRPIQNGRIMISINSIWYEPSDPENAEQVALAEVANQFKFGWFANPIFTEEGGYPVVMVENIAEQSKAEGLNKPRLEQFDEYWIERIKGTSDFLGINHYTTHLITGPGVDSLAKHPSWLKDIGAVVSLDVGRDSASEWLRVVPTGFANLLRWCKSTYNDVPIYITENGFSDRGAIEDYDRIRYYNDYLSEILNVIYDDDVKVLGYTAWTLMDNFEWRAGFSERFGLYHVDITDPNLPRTPKLSAEYYKQLCETKEIPQDERFKDPAVS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: