MonarchBase - Protein-coding gene

DPOGS204061
Transcript	DPOGS204061-TA	1674 bp
Protein	DPOGS204061-PA	557 aa
Genomic position	DPSCF300200 - 94882-98724
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL013136	0.0	77.23%
*Bombyx*	BGIBMGA010812-TA	0.0	66.33%
*Drosophila*	CG9701-PA	5e-130	46.77%
EBI UniRef50	UniRef50_O61594	0.0	68.51%	Beta-glucosidase n=5 Tax=Obtectomera RepID=O61594_SPOFR
NCBI RefSeq	XP_557100.2	7e-139	48.95%	AGAP006426-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|2970687	0.0	68.51%	beta-glucosidase precursor [Spodoptera frugiperda]
NCBI nr blastx	gi\|2970687	0.0	66.73%	beta-glucosidase precursor [Spodoptera frugiperda]

Group
Gene Ontology	GO:0004553	6.7e-215	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	6.7e-215	carbohydrate metabolic process
	GO:0043169	2e-164	cation binding
	GO:0003824	2e-164	catalytic activity
KEGG pathway	tca:664577	1e-117
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[72-548] IPR001360	6.7e-215	Glycoside hydrolase, family 1
	[74-538] IPR013781	2e-164	Glycoside hydrolase, subgroup, catalytic core
	[73-551] IPR017853	4.1e-154	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204061-TA
ATGTTGAGGGTGAGGTCGTTGATCGTTGGGTCGGATGGTTTGAGACCTAGAGTAGAAGCAGAATTATCGTCGATTGATTGTTTCGCGTTATCCCTGATTTGCGTGTTTTCATCGTCCCTGTCTTTGTCAGAACTTTCTGCTTTAAGGTCTTCGCTTTATTGGGCGAAGCCAATGGTTGCTTTGGAAATCTTGTTAATCGGCAGCCATGCTCAAGAAAGAAGATTTCCTGAGGACTTCATGTTCGGGGCTGCCACATCAGCATATCAGATAGAAGGAGGATGGAGCGCTGATGACAAAGGAGAGAATATATGGGATCGTTTGACTCACACCAAACCTAACGTAATCAAGGATGTGAGCAATGGTGATGTTGCAGCCGACACATACAATAACTACAAACGTGATGTGGAGATGATGAGGGAGTTGGGGCTAGATGCTTACAGGTTCTCTCTCTCCTGGTCTAGAATACTACCCAATGGCCTGGCCAACAAAGTCAGCGATGCCGGGGTTGAGTTTTACAACAACTATATAGATGAAATGATCAAATACGGTATAAAGCCCATGGTCACTCTGTACCACTGGGACTTGCCACAGAAGTTACAAGATTTGGGAGGATTCATGAATCCATTATTCCCCGAGTGGTTTGAAGATTACGCCCGGGTGGTCTTTGAAAAGTTTGGAGACAGAGTCAAGCACTGGATTACTTTCAATGAACCCAGAGAAATCTGTTTCGAAGGCTATGGTTCAGCAACCAAAGCGCCTATCCTAAATGCAACCGACGTCGGTGTTTATTACTGTGCCAAAAATCTGGTTATGGGTCACGCTAGAGCTTATTACGCATATGTCAATGACTTCAAGCCGAGCCAAGAAGGTGTCTGTGGTATCACAATAAGTGTGAATTGGTTCGGGGCGTTGACAGATTCCGAGGAAGATCAATTTGCTGCCGAAATGAAGAGACAAGCAGAATGGGGGCTCTATGCTGAACCTATTTTCTCTGAAGAGGGTGGGTTTCCTAAGGAATTAGCAGAAATTGTGGCCAAAAAAAGCGCTGAACAGGGTTATCCTCAATCTCGTATGCCAGCATTCTCTGATGAAGAGAAGGATTTCGTAAAGGGCGCTTTTGATTTCTTTGGAGTAAATCATTACTCAGGCAGCTTTGTATCTGCAACTGAATATAAGACTAACCACCCAGTGCCGTCTTTATATGATGATGTTGATGTTGGAAGCTACACTCCGCCGGAGTGGCCAAAATCTGCTTCTTCGTGGTTAGTTCAAGCACCAAACAGTGTTTACAATGCCCTCACTCACCTTCACAAGAAGTACAACGGTCCCATACTCTACATCACGGAGAACGGCTGGTCCTCGTCTCCGGAAGCTGATATCCTTGATGATGATAGGATTAGATACTACCGAGCGGCTTTGAACAGTGTGCTCGATACCTTGGAGGCTGGAGTGGATCTACGAGGGTACATGGCATGGAGTCTGATGGACAACTTTGAGTGGAATGCTGGTTACACAGAACTTCTTGGCCTGTACCGTGTCAACTTCTCGGACCCAGGTCGTGAGAGAACTCCTCGTAAGTCAGCCTTCGTTTACAAACAGATCATCAAGAGTCGGATGATTGATGAAGAATATGAACCTGATACCCTGGACATGACCATTGATGAAGGGAACTGA

Protein sequence:

>DPOGS204061-PA
MLRVRSLIVGSDGLRPRVEAELSSIDCFALSLICVFSSSLSLSELSALRSSLYWAKPMVALEILLIGSHAQERRFPEDFMFGAATSAYQIEGGWSADDKGENIWDRLTHTKPNVIKDVSNGDVAADTYNNYKRDVEMMRELGLDAYRFSLSWSRILPNGLANKVSDAGVEFYNNYIDEMIKYGIKPMVTLYHWDLPQKLQDLGGFMNPLFPEWFEDYARVVFEKFGDRVKHWITFNEPREICFEGYGSATKAPILNATDVGVYYCAKNLVMGHARAYYAYVNDFKPSQEGVCGITISVNWFGALTDSEEDQFAAEMKRQAEWGLYAEPIFSEEGGFPKELAEIVAKKSAEQGYPQSRMPAFSDEEKDFVKGAFDFFGVNHYSGSFVSATEYKTNHPVPSLYDDVDVGSYTPPEWPKSASSWLVQAPNSVYNALTHLHKKYNGPILYITENGWSSSPEADILDDDRIRYYRAALNSVLDTLEAGVDLRGYMAWSLMDNFEWNAGYTELLGLYRVNFSDPGRERTPRKSAFVYKQIIKSRMIDEEYEPDTLDMTIDEGN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: