MonarchBase - Protein-coding gene

DPOGS210283
Transcript	DPOGS210283-TA	1449 bp
Protein	DPOGS210283-PA	482 aa
Genomic position	DPSCF300216 + 248100-250912
RNAseq coverage	30x (Rank: top 76%)

Annotation
*Heliconius*	HMEL003519	0.0	70.04%
*Bombyx*	BGIBMGA010536-TA	2e-149	53.47%
*Drosophila*	CG9701-PA	3e-123	44.51%
EBI UniRef50	UniRef50_G6DAN3	2e-127	49.23%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_001850321.1	4e-128	45.53%	glycoside hydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|364023585	9e-138	50.42%	seminal fluid protein CSSFP001 [Chilo suppressalis]
NCBI nr blastx	gi\|364023613	7e-139	50.84%	seminal fluid protein CSSFP031 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	5.2e-201	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	5.2e-201	carbohydrate metabolic process
	GO:0043169	9e-153	cation binding
	GO:0003824	9e-153	catalytic activity
KEGG pathway	tca:664577	2e-109
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[2-477] IPR001360	5.2e-201	Glycoside hydrolase, family 1
	[3-465] IPR013781	9e-153	Glycoside hydrolase, subgroup, catalytic core
	[2-479] IPR017853	7e-146	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210283-TA
ATGAGGAAACTACCAAACGGGTTAAAGATAGGGGTTGCTACGGCATCTTATCAAATCGAAGGGGGTTGGAATGCTGGCGATAAAACACCGAGTATTTGGGACACTCATTGTCACAAAGAACCATGCCCCGTAAAAGATAATACCAGTGGAGATGACACTTGCGAATCATTCAAATACTACAAACGTGATCTGGAGATGATAAAATTTTTGGGATTCCACTTCTACAGATTTTCCATATCATGGCCAAGATTACTTCCTGACGGATTTACAAACAGAATCAGCGAGACCGGCCGCGAATACTACAATAATCTGATCAACGGATTACTTGAAAATAATATTGAACCGATAATTACTTTGTATCATTGGGATCTGCCGCAGACACTTCAAGAACTCGGAGGTTGGAGCAATCCTCTCATAGTGGACTGGTTCGGTGACTACGCCGCTGTCGCATACCAACTTTTTGGAGACAGAGTTAAAACCTGGATAACGATCAATGAACCGAAACAAATCGGTGTTTTCGGTTACGGAATGACCAGAATGGCTCCAGCCCTAAATATATCCGGGATAGCAGATTATATAGCTGCTAAAAATATGGTGTTAGCACATGCCCGAGCCTGGCATATATACGATAAACAATTTAGATCTACCCAAAAAGGAACATGCGGCATCACCATAGCAACCGATTTTCGTGTCGGACTATCTGACTCTCGTGATGATGTCGAAGCTGGTCTCGACGCTATGGATTTTGAAGTAGGATTATACAGCCATCCTATATTCACATCAAAGGGTGGTTTTCCTGAACGAGTTATCCAAAGAGTAGCAGAAAAAAGTAAAGAACAAGGTTACACTAGAAGTCGACTGCCAGATTTTAGTGACGAAGAAATTGAGTACGCTAAAGGAACCAGTGATTTTTATGGCTTCAATCATTATTCGACGAAATTTTTCACAAGGGACACTTACACGCCTGGAAAACATCCAATACCCTCGTATGATGATGATATTGGTGCAGATTTTACTTACTTGGACTATGAAAAAGGTGCAGTGCCTCATGTCACAGTAATTCCACACGGAATCAGAAAAGCCTTGAAATGGGTGAAAGAAAACTGTAACAATCCACCAATAATGATAACCGAGAATGGTTTCGCCACTTTTGGCGGTTTGGAAGATATGGATAGAATATTCTATTTTAGGAAATATCTTTACTCGATTTTGGACGCCATTGAAATTGACGGCTGCAATGTTACGTCATATACAGTGTGGAGTTTAATGGACAATTTTGAATGGGATAGTGGATTAAGTGTTAAATTTGGACTATTCGAAGTCGATTTTGAGGATGAAAAGAAGACCAGAACGGCAAGATTGTCGGCTTTGTGGTTTAAAAGACTCATAAAGACAAAATGTCTAGATCTGGAACACATACCGGAAATGGAAGAGAAAATCCACTTTTAA

Protein sequence:

>DPOGS210283-PA
MRKLPNGLKIGVATASYQIEGGWNAGDKTPSIWDTHCHKEPCPVKDNTSGDDTCESFKYYKRDLEMIKFLGFHFYRFSISWPRLLPDGFTNRISETGREYYNNLINGLLENNIEPIITLYHWDLPQTLQELGGWSNPLIVDWFGDYAAVAYQLFGDRVKTWITINEPKQIGVFGYGMTRMAPALNISGIADYIAAKNMVLAHARAWHIYDKQFRSTQKGTCGITIATDFRVGLSDSRDDVEAGLDAMDFEVGLYSHPIFTSKGGFPERVIQRVAEKSKEQGYTRSRLPDFSDEEIEYAKGTSDFYGFNHYSTKFFTRDTYTPGKHPIPSYDDDIGADFTYLDYEKGAVPHVTVIPHGIRKALKWVKENCNNPPIMITENGFATFGGLEDMDRIFYFRKYLYSILDAIEIDGCNVTSYTVWSLMDNFEWDSGLSVKFGLFEVDFEDEKKTRTARLSALWFKRLIKTKCLDLEHIPEMEEKIHF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: