MonarchBase - Protein-coding gene

DPOGS201334
Transcript	DPOGS201334-TA	1533 bp
Protein	DPOGS201334-PA	510 aa
Genomic position	DPSCF300176 + 630843-638131
RNAseq coverage	2x (Rank: top 91%)

Annotation
*Heliconius*	HMEL012399	0.0	67.98%
*Bombyx*	BGIBMGA010536-TA	0.0	59.60%
*Drosophila*	CG9701-PA	3e-149	50.70%
EBI UniRef50	UniRef50_G6DAN3	0.0	84.11%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_001237813.1	2e-160	56.66%	AGAP006424-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|364023585	0.0	64.88%	seminal fluid protein CSSFP001 [Chilo suppressalis]
NCBI nr blastx	gi\|364023613	0.0	62.18%	seminal fluid protein CSSFP031 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	1.3e-244	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	1.3e-244	carbohydrate metabolic process
	GO:0043169	1.3e-176	cation binding
	GO:0003824	1.3e-176	catalytic activity
KEGG pathway	tca:664577	7e-141
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[29-503] IPR001360	1.3e-244	Glycoside hydrolase, family 1
	[30-491] IPR013781	1.3e-176	Glycoside hydrolase, subgroup, catalytic core
	[29-504] IPR017853	5.3e-166	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201334-TA
ATGTTCCGTGCTGTAAGATTAATTTTCCTGGCTTTCGTTTTGACTGTGCTTGTCGGTAGCAATGAAATCTCTCGACATGAAGCCAGAAAAATACCTGACGACTTACTTTTTGGAGCTGCTACGGCATCCTACCAAATAGAAGGAGCTTGGAATGAAGATGGTAAATCTGAAAATATTTGGGATCGATTGACACACCTAAAACCTTGTTATATACACAACTGTGACACGGGAGATATCGCTGCTGATTCCTATCACCAATATAAGCGCGATGTGGAAATGATGCGGGAACTAGGTCTCGACTTTTATAGGTTCTCTCTCTCCTGGACGAGAATATTACCAACGAGTTTTCCAGATCAAATTAATGAAAAAGGAGTACAATATTACAATAATTTGATAAATGAGATGCTCAAATACAACATACAACCCATGGTGACTCTTTATCATTGGGATTTACCTCAGAAGCTGCAAGATCTGGGAGGATGGGCAAATCCCCATATAGTTGATTGGTTTACCGACTATGCCAAAGTAGTTTTCGAGTTATTTGGAGACAGGGTTAAGTACTGGATAACTGTCAATGAACCTAAACATGTTTGTCATCAAACAACCCCACAACTATCACTAGATCCATCTTATAGTGTTTCTTCACATTTTCATTACATGTGTGCCAAAAATCTGCTAGTAGCACATGCTAACGTCTACCATTTGTATAATAATAAATTTCGTGAAGTCCAAGGTGGTCAAGTCGGTATAACAATAAGTTCCGCGTGGGCTGAACCTGAGTCTGAAAATGACATGAAAGCTGCTGAAGATGCCATGCAATTTGAGATGGGTCTTTTTGCAAATCCAATATTTTCGGAGTCTGGAGATTATCCATCAGTCATGAAAGAAAGAATAGCAGCAAAGAGTAAGGAACAAGGATTTCCGAGATCACGATTACCACAATTCACTCCGGAGGAAGTAGATTTAATAAAAGGAAGCTCAGACTTCATTGGATTAAATCATTATACTACTAACATTGTTTATAGAAACGAATCTGTCTATGGAAGTTACAGTTCTCCATCACTTGAAGATGATGTGGAAGTTTTAAGTTATCAAGATAGTTCATGGGACTCAGGTGCTTCATCGTGGTTGAAGCGTGTACCCTGGGGATTTTATAAATTATTAACAAAAATACGAGAGGACTACAACAACCCACCAGTTTTCATCACTGAAAATGGATTCTCATCTCGGGGTGGTCTAATTGACGACGACCGCGTAAAGTATTACAGAACATACATTGATGCTATGCTCGATGCTATTGAAGATGGATCAGATATAAGAGTTTATACAGCGTGGAGTTTGATGGACAATTTCGAATGGATGGAGGGATACAGCGAACGTTTTGGCCTGTACGAGGTGGACTACGAGAGTCCTGAACGCACCCGCACTCCTCGCAAGTCTGCTTACGTGTACAAAGAGATGCTGCGCACACGCACACTGGACTATCATTATGAACCTGACATGAGCTTGGGAATGAATGTCGATGAAAACTAA

Protein sequence:

>DPOGS201334-PA
MFRAVRLIFLAFVLTVLVGSNEISRHEARKIPDDLLFGAATASYQIEGAWNEDGKSENIWDRLTHLKPCYIHNCDTGDIAADSYHQYKRDVEMMRELGLDFYRFSLSWTRILPTSFPDQINEKGVQYYNNLINEMLKYNIQPMVTLYHWDLPQKLQDLGGWANPHIVDWFTDYAKVVFELFGDRVKYWITVNEPKHVCHQTTPQLSLDPSYSVSSHFHYMCAKNLLVAHANVYHLYNNKFREVQGGQVGITISSAWAEPESENDMKAAEDAMQFEMGLFANPIFSESGDYPSVMKERIAAKSKEQGFPRSRLPQFTPEEVDLIKGSSDFIGLNHYTTNIVYRNESVYGSYSSPSLEDDVEVLSYQDSSWDSGASSWLKRVPWGFYKLLTKIREDYNNPPVFITENGFSSRGGLIDDDRVKYYRTYIDAMLDAIEDGSDIRVYTAWSLMDNFEWMEGYSERFGLYEVDYESPERTRTPRKSAYVYKEMLRTRTLDYHYEPDMSLGMNVDEN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: