MonarchBase - Protein-coding gene

DPOGS210278
Transcript	DPOGS210278-TA	1557 bp
Protein	DPOGS210278-PA	518 aa
Genomic position	DPSCF300216 + 174796-177463
RNAseq coverage	124x (Rank: top 57%)

Annotation
*Heliconius*	HMEL016981	0.0	66.67%
*Bombyx*	BGIBMGA014178-TA	0.0	70.00%
*Drosophila*	CG9701-PA	2e-136	47.28%
EBI UniRef50	UniRef50_G6DAN3	6e-160	55.68%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_557100.2	3e-153	50.60%	AGAP006426-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|364023593	0.0	72.94%	seminal fluid protein CSSFP021 [Chilo suppressalis]
NCBI nr blastx	gi\|364023593	0.0	72.94%	seminal fluid protein CSSFP021 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	4e-235	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	4e-235	carbohydrate metabolic process
	GO:0043169	6.7e-170	cation binding
	GO:0003824	6.7e-170	catalytic activity
KEGG pathway	tca:664577	6e-131
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[13-515] IPR001360	4e-235	Glycoside hydrolase, family 1
	[26-489] IPR013781	6.7e-170	Glycoside hydrolase, subgroup, catalytic core
	[25-502] IPR017853	6.4e-161	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210278-TA
ATGAAGCGTTTTCTAGCTTGCTGCATTCTATTACTTATGATAAATGATCCCGTATTATCTAAGAGGTCTATACGCAAGTTCCCTAAGGGATTCAAGTTTGGAGCATCGACGGCTGCCTATCAGATCGAAGGAGGTTGGAATGAAGATGGCAAAGGTATTTCCATTTGGGACGTAGCTACACATATGGAAACTACACCAATCCGCGATGGAAGCAATGGTAATATCGCAGCAGATTCCTACCATTTATATAAAAAGGATGTAGAAATATTGAAAGAACTTGGTGTAGATTTCTATCGTTTTTCCGTATCATGGACCAGAATACTCCCCCAGGGTTTTTCCAATTACATCAATCAAGCTGGCATCAATTATTACAATAATTTAATAAACGAATTGATCCAAAATAATATTGTACCCTTCTTGACAATTTATCACTGGGATTTGCCCCAAGAGCTGCAGAAGTTGGGTGGTTGGACCAACCCTTATATTATTGATGTTTTTGCTGACTATGCCAAAATCCTTTTCGATCACTTCGGTGATAGAGTCAAATTTTGGATAACAATTAACGAACCGAAACAAATATGCTACGAAGGATATGGATCAGATTTGAAAGCTCCACTCGTTAATATGACTGGGATAGCAGAGTATATGTGCGCCAAGAATGTTTTGCTGGCTCATGCTAAAGTTTATCGCATATACGATGAGGAGTATAGAAAGAAGCAGAACGGTAAAATTGGAATATCTATCAGCTGTACGTGGTATGAACCAGCTTCTGATACAATCGATGATCACCAAGCTGCTTTAGACGCGAGACAATTCGATTGGGGTCAATACGCTCATCCGATATTCTCAAAAGAAGGGGACTTTCCGCATGAACTTAAACACAACGTGGCGGCGAAGAGTGCGGAACAGGGATATTCATATTCACGTCTCCCGGAACTGTCGGCTTCTGAAGTTGCATTTATTAGAGGCACGTCTGATTTCTTTGGAATGAACACTTATACAACGAAGATGGCTTATAGGGATGCGTCTGTTGATGGAATGTTCCCCGTGCCATCGTACAGAGATGACATGGGGTCCGTCCTCGTCAAGGATCCCACTTGGCCGCAGGCGCAGTCTTCTTGGTTACAGGAAGTTCCCTGGGGATTTCATAAATTACTCAAAGAGGTCAATAAATTGTACGACAATCCGCCGGTTTATATCACAGAAAACGGCTGGTCAAGTTCCGGTGGTCTACTTGACGAAGATCGGATACAATTCTTGAGAAATTATCTGAACGCATTACTAGACGCTTTAGACGAAGGGTGCAATATAAAAGCATATACAGTATGGAGTCTGATAGATAACTTTGAATGGTTAAACGGATACACAGAAAAATTTGGACTATACGAAGTAGAATTTTCGTCTCCAGATCGTACTAGAACACCCAGGAAATCAGCTTTTATATACAAAGAGATTATACGATCCAGAATTTTGGATCCGAATTTTGAACCTGAAAAATATGTAGAAGAAAGAAAAGATAGTCAAGAAAAAGAAAAGTTTGACAGTGATTTATATTAA

Protein sequence:

>DPOGS210278-PA
MKRFLACCILLLMINDPVLSKRSIRKFPKGFKFGASTAAYQIEGGWNEDGKGISIWDVATHMETTPIRDGSNGNIAADSYHLYKKDVEILKELGVDFYRFSVSWTRILPQGFSNYINQAGINYYNNLINELIQNNIVPFLTIYHWDLPQELQKLGGWTNPYIIDVFADYAKILFDHFGDRVKFWITINEPKQICYEGYGSDLKAPLVNMTGIAEYMCAKNVLLAHAKVYRIYDEEYRKKQNGKIGISISCTWYEPASDTIDDHQAALDARQFDWGQYAHPIFSKEGDFPHELKHNVAAKSAEQGYSYSRLPELSASEVAFIRGTSDFFGMNTYTTKMAYRDASVDGMFPVPSYRDDMGSVLVKDPTWPQAQSSWLQEVPWGFHKLLKEVNKLYDNPPVYITENGWSSSGGLLDEDRIQFLRNYLNALLDALDEGCNIKAYTVWSLIDNFEWLNGYTEKFGLYEVEFSSPDRTRTPRKSAFIYKEIIRSRILDPNFEPEKYVEERKDSQEKEKFDSDLY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: