MonarchBase - Protein-coding gene

DPOGS204060
Transcript	DPOGS204060-TA	1266 bp
Protein	DPOGS204060-PA	421 aa
Genomic position	DPSCF300200 - 102654-104589
RNAseq coverage	23x (Rank: top 78%)

Annotation
*Heliconius*	HMEL013136	0.0	81.84%
*Bombyx*	BGIBMGA010812-TA	1e-180	68.41%
*Drosophila*	CG9701-PA	3e-103	45.54%
EBI UniRef50	UniRef50_O61594	0.0	70.92%	Beta-glucosidase n=5 Tax=Obtectomera RepID=O61594_SPOFR
NCBI RefSeq	XP_001850321.1	6e-113	47.57%	glycoside hydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|364023583	0.0	73.87%	seminal fluid protein CSSFP016 [Chilo suppressalis]
NCBI nr blastx	gi\|364023583	0.0	73.87%	seminal fluid protein CSSFP016 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	5.1e-179	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	5.1e-179	carbohydrate metabolic process
	GO:0043169	2.3e-137	cation binding
	GO:0003824	2.3e-137	catalytic activity
KEGG pathway	tca:664577	1e-95
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[1-412] IPR001360	5.1e-179	Glycoside hydrolase, family 1
	[1-402] IPR013781	2.3e-137	Glycoside hydrolase, subgroup, catalytic core
	[1-415] IPR017853	2.7e-125	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204060-TA
ATGATGAGGGAGTTGGGGCTAGATGCTTACAGGTTCTCTCTCTCCTGGTCTAGAATACTACCCAATGGCCTGGCCAACAAAGTCAGCGATGCCGGGGTTGAGTTTTACAACAACTATATAGATGAAATGATCAAATACGGTATAAAGCCCATGGTCACTCTGTACCACTGGGACTTGCCACAGAAGTTACAAGATTTGGGAGGATTCATGAATCCATTATTCCCCGAGTGGTTTGAAGATTACGCCCGGGTGGTCTTTGAAAAGTTTGGAGACAGAGTCAAGCACTGGATTACTTTCAATGAACCCAGAGAAATCTGTTTCGAAGGCTATGGTTCAGCAACCAAAGCGCCTATCCTAAATGCAACCGACGTCGGTGTTTATTACTGTGCCAAAAATCTGGTTATGGGTCACGCTAGAGCTTATTACGCATATGTCAATGACTTCAAGCCGAGCCAAGAAGGTGTCTGTGGTATCACAATAAGTGTGAATTGGTTCGGGGCGTTGACAGATTCCGAGGAAGATCAATTTGCTGCCGAAATGAAGAGACAAGCAGAATGGGGGCTCTATGCTGAACCTATTTTCTCTGAAGAGGGTGGTTTTCCTAAGGAATTAGCTGAAATTGTGGCCAAAAAAAGCGCTGAACAGGGTTATCCTCGATCTCGTATGCCAGAATTCTCTGATGAAGAGAAGGATTTCGTAAAAGGCACTGCTGACTTTTTAGGAGTAAATCATTACACAGCCGGCTTAGTATCTGCAACTGAATATAAGACTCACCACCCAGTGCCGTCTTTATATGATGATATTGATGTAGGAAGCTACACTCCGCCGGAGTGGCCAAAATCTGCTTCATCTTGGTTAAAATTAGCACCAAACAGTATTTACAATGCCCTCACTCACCTTCACAAGAAGTACAACGGTCCCATATTCTACATCACGGAGAACGGCTGGTCCTCGCCTCCGGAAGCTGATATCCTTGATGATGACAGGATTAGATACTACCGAGCGGCTTTGAACAGTGTGCTCGATACCTTGGAGGCTGGAGTGGATCTACGGGGGTACATGGCATGGAGTCTGATGGACAACTTTGAGTGGATGGAGGGTTACACGGAACGTTTTGGGCTGTACCGCGTTAACTTCTCGGACCCAGGTCGTGAGAGAACTCCTCGTAAGTCAGCCTTCGTTTACAAACAGATCATCAAGAGTCGGATGATTGATGAAGAATATGAACCTGATACCCTGGACATGACCATTGATGAAGGAAACTGA

Protein sequence:

>DPOGS204060-PA
MMRELGLDAYRFSLSWSRILPNGLANKVSDAGVEFYNNYIDEMIKYGIKPMVTLYHWDLPQKLQDLGGFMNPLFPEWFEDYARVVFEKFGDRVKHWITFNEPREICFEGYGSATKAPILNATDVGVYYCAKNLVMGHARAYYAYVNDFKPSQEGVCGITISVNWFGALTDSEEDQFAAEMKRQAEWGLYAEPIFSEEGGFPKELAEIVAKKSAEQGYPRSRMPEFSDEEKDFVKGTADFLGVNHYTAGLVSATEYKTHHPVPSLYDDIDVGSYTPPEWPKSASSWLKLAPNSIYNALTHLHKKYNGPIFYITENGWSSPPEADILDDDRIRYYRAALNSVLDTLEAGVDLRGYMAWSLMDNFEWMEGYTERFGLYRVNFSDPGRERTPRKSAFVYKQIIKSRMIDEEYEPDTLDMTIDEGN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: