MonarchBase - Protein-coding gene

DPOGS202008
Transcript	DPOGS202008-TA	1569 bp
Protein	DPOGS202008-PA	522 aa
Genomic position	DPSCF300053 - 1260983-1269511
RNAseq coverage	249x (Rank: top 42%)

Annotation
*Heliconius*	HMEL012825	0.0	72.94%
*Bombyx*	BGIBMGA002450-TA	2e-176	67.55%
*Drosophila*	CG9701-PA	6e-144	48.41%
EBI UniRef50	UniRef50_B2DBM6	0.0	71.07%	Similar to CG9701-PA (Fragment) n=4 Tax=Obtectomera RepID=B2DBM6_9NEOP
NCBI RefSeq	XP_001850321.1	1e-150	49.81%	glycoside hydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|183979247	0.0	71.07%	similar to CG9701-PA [Papilio xuthus]
NCBI nr blastx	gi\|183979247	0.0	73.11%	similar to CG9701-PA [Papilio xuthus]

Group
Gene Ontology	GO:0004553	1.8e-229	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	1.8e-229	carbohydrate metabolic process
	GO:0043169	1.4e-169	cation binding
	GO:0003824	1.4e-169	catalytic activity
KEGG pathway	tca:664577	5e-132
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[39-510] IPR001360	1.8e-229	Glycoside hydrolase, family 1
	[38-504] IPR013781	1.4e-169	Glycoside hydrolase, subgroup, catalytic core
	[38-517] IPR017853	1.2e-160	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202008-TA
ATGCAGAGCAAGAGTAGAGTCACCCATAGTGCTGCCATGTTCGCGCTGTTTAGCCTGATGTTATTAACAAATGGAGTAAACGCGCTTATAAGCAGTAATGGGTTGAGCAACTATTCGTTTCCAGACAATTTTATTTTTGGAGTAGCGACGGCTGCATTTCAAATAGAAGGAGGTTGGAATGAGGGTGGTAAAGGTGAAAGCATGTGGGATACATATTTACACAAACACCCTAAATTCACGGTGGACCAATCGAACGGAGACGTGGCCGCCGATTCATATCACAAATACAAACAAGATTTAATAATGATCAAGTCAATCGAAGTAAAATATTACCGACTTTCAATATCATGGCCAAGAATATTACCACATGGAACTGACAACTACATCAGCAAAGATGGAGTTAGATACTATCGAAAGCTTTTCGAAGAACTAATAAATGCCAATATAACTCCCGTTGTGACACTGTATCATTGGGATATGCCAACAGCTCTAATGGATTTAGGCGGATGGACTAATCCCAAAATGGTGGATTACTTTGAGGACTACGCGAGAGTAGCGTTCACACTGTTCGGAGATATTGTGAAAACGTGGACCACTATGAACGAATTGCATCAACATTGCTTTAACGGCTATGGCGGTAATTTTTTCGTCCCTGCCCTAAAATCACATGGTGTTGGTGCATATTTATGTTCACATTACATGCTGTTGGCGCACGCACGAGCTTATCGGTTGTATGACAAGCAATTTAGACCACATCAGAAAGGAAAAGTTGGTATAACTTTAGACGCATTTTGGGCTGAACCTAAAGATTATAATAAAGAGGAAGATCATGAAGCAGCAGAACGGTATCTTCAGATGCATGTGGGTTTATTCGCTCATCCAATTTATTCAGACGAAGGAGACTATCCTCTTCTCGTTCGAAACAGGATTGATGATATGAGCCGCAATCAAGGTTTTGCCAGATCTCGATTACCATTTTTTACCCCTGAAGAAGTGGCCATGGTTCGAGGTAGTTCAGATTTCTTTGGCATCAATCACTACACCACATACTTAATGTCAAACTCATCTATGGAACCTGAATGGGTTATTCCCTCTGTGGACCATGACACTGGAGTAAAAATTGAACAGAGCAAAGAATGGCCTATACCAGGCGCCGAATGGCTCTCAGTTTATCCCCCCGGATTTCGAAAACTCATTAATTGGATAACCAAGAGTTATGGTAAAAGAGTGCCTATCATTGTAACAGAAAATGGGGTATCGGATTTCGGTGGTAAGAACGATTACTCTCGAGTGTCATATTTTAATAACTATTTGGAACAACTTTTATTGGCGATTCACGAAGACGGTTGTAATGTATCCGGATACTTCGCTTGGACTTTAATGGACGATTTTGAATGGAACGATGGATACAAGGTGAAATTTGGTCTATTTCACGTGGACTTCAACAGCCCGGGTAAAGAAAGGACTCCAAAATTATCAGCGCTCAATTACGGCGAAATAGTTCGCACGAGGCGAGTCAATTTCAACTACATAAAGATGCCATCGTATAAATATAATACTCTATTGTAA

Protein sequence:

>DPOGS202008-PA
MQSKSRVTHSAAMFALFSLMLLTNGVNALISSNGLSNYSFPDNFIFGVATAAFQIEGGWNEGGKGESMWDTYLHKHPKFTVDQSNGDVAADSYHKYKQDLIMIKSIEVKYYRLSISWPRILPHGTDNYISKDGVRYYRKLFEELINANITPVVTLYHWDMPTALMDLGGWTNPKMVDYFEDYARVAFTLFGDIVKTWTTMNELHQHCFNGYGGNFFVPALKSHGVGAYLCSHYMLLAHARAYRLYDKQFRPHQKGKVGITLDAFWAEPKDYNKEEDHEAAERYLQMHVGLFAHPIYSDEGDYPLLVRNRIDDMSRNQGFARSRLPFFTPEEVAMVRGSSDFFGINHYTTYLMSNSSMEPEWVIPSVDHDTGVKIEQSKEWPIPGAEWLSVYPPGFRKLINWITKSYGKRVPIIVTENGVSDFGGKNDYSRVSYFNNYLEQLLLAIHEDGCNVSGYFAWTLMDDFEWNDGYKVKFGLFHVDFNSPGKERTPKLSALNYGEIVRTRRVNFNYIKMPSYKYNTLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: