MonarchBase - Protein-coding gene

DPOGS201328
Transcript	DPOGS201328-TA	1413 bp
Protein	DPOGS201328-PA	470 aa
Genomic position	DPSCF300176 + 587779-591146
RNAseq coverage	51x (Rank: top 70%)

Annotation
*Heliconius*	HMEL012399	3e-162	56.83%
*Bombyx*	BGIBMGA010537-TA	2e-158	56.48%
*Drosophila*	CG9701-PA	5e-111	44.74%
EBI UniRef50	UniRef50_G6DAN3	9e-139	56.76%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_001237813.1	5e-127	47.38%	AGAP006424-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|364023585	8e-152	55.09%	seminal fluid protein CSSFP001 [Chilo suppressalis]
NCBI nr blastx	gi\|364023585	8e-153	56.74%	seminal fluid protein CSSFP001 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	8.2e-192	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	8.2e-192	carbohydrate metabolic process
	GO:0043169	2.9e-143	cation binding
	GO:0003824	2.9e-143	catalytic activity
KEGG pathway	nvi:100116664	5e-107
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[29-460] IPR001360	8.2e-192	Glycoside hydrolase, family 1
	[28-460] IPR013781	2.9e-143	Glycoside hydrolase, subgroup, catalytic core
	[28-461] IPR017853	1.7e-135	Glycoside hydrolase, superfamily
Orthology group

Nucleotide sequence:

>DPOGS201328-TA
ATGAATGAATGCTGTGGAATAATTTTATTTGTCTTATCGTTGGCCATTGGAGTACAGTCTTCAAATTTACAATGTTACGAAACAGAATTTCCAGAAGGGTTCTTATTCAGCGCATCATCGTCTGCTTATCAGATAGAAGGTGCTTGGAACAAAGATGGTCGAACTGACAGCATTTGGGATGATTTAGTACACCAACGTCCCTACCTCGTCAGAGACAACGCGACCGGAGACATTGCTGATAATTCTTATTACATTTATAAAAGGGATATAGAAATTTTGAGAGAGATAGGACTACAAGTATATAGGTTCTCTATATCATGGAATAGAATTTTACCTACTGGTTTTCCCAACAAAATTAATTATGAAGGTGTTGCATATTACGATAATTTAATTAACGAATTATTGAAATACAACATTATCCCGGTGGTTACCATTTACCACTTTGATTTGCCTCAAAGACTCCAGGAATTGGGTGGCTGGGTTAATCCTTATGTCGTTGATTGGTTGGGAGACTACGCAAGGGTTGTTTTCAATTTATTCGGTGATAGAGTTAAATATTGGATAACAGTGAATGAACCACAGCAGATTTGCTACTACGGCTATGGTGATGTAATGAATGCACCAGCATTAAATTATAAAGGAATTGCTGAATACTATTGTGCGAAAAATGTACTATTAGCACATGCAAGGGCATACCACATTTACGACGAAGAGTTTCGAGACTTTCAGCAAGGCATTATATTTATAGCTATAAGTGCTGAATGGTACGAACCTGCTTCGTCGGACAAGAATGATATTTTGGCCGCTTACGACTCGAACATGTTTACATATGGACAATACGCTCATCCAATTTTCTCTGAGACTGGTGATTTTCCCCAAAAGATGAAGGATCGCATTGCAGAAAGAAGTGTCATGCAAGGTTTCGTTAGGTCCCGACTACCACAGCTTTCGGAACAGGAAATTGATTATATACGTGGCAGTTCTGACGTGTTCGGTTTAAATCACTATTCTACTTTCTATGCAAGCAGAAATCAATCTGTTTACACAAATTATGAATCCCCATCATTTTTTGACGATATGGCAGCATACACGTTTCAGCCGCCTGAATGGAGATTGAGCCCAGATGCTGGTGTTGCGACTGTTCCTTGGGGTTTCTACAAATTGCTGCAATTCATCAAGAGAGAGTACAATAATCCTCCCGTTTTCGTAACCGAGAACGGTTTTGGCGATAATGGCGGTTTAAAAGATAACGATCGTGTTACACATTTGAAGGGTTACTTATGTGCTCTTCTGAAAGCTATCAATCACGGCTCAGATATTATAGGATATTCTGTTTGGAGTCTCCTGGATTCGTTTGAATGGATGTGTGGATACAATAACAATATGAAGAAAAATTCCGGTGCGGATTGTTGA

Protein sequence:

>DPOGS201328-PA
MNECCGIILFVLSLAIGVQSSNLQCYETEFPEGFLFSASSSAYQIEGAWNKDGRTDSIWDDLVHQRPYLVRDNATGDIADNSYYIYKRDIEILREIGLQVYRFSISWNRILPTGFPNKINYEGVAYYDNLINELLKYNIIPVVTIYHFDLPQRLQELGGWVNPYVVDWLGDYARVVFNLFGDRVKYWITVNEPQQICYYGYGDVMNAPALNYKGIAEYYCAKNVLLAHARAYHIYDEEFRDFQQGIIFIAISAEWYEPASSDKNDILAAYDSNMFTYGQYAHPIFSETGDFPQKMKDRIAERSVMQGFVRSRLPQLSEQEIDYIRGSSDVFGLNHYSTFYASRNQSVYTNYESPSFFDDMAAYTFQPPEWRLSPDAGVATVPWGFYKLLQFIKREYNNPPVFVTENGFGDNGGLKDNDRVTHLKGYLCALLKAINHGSDIIGYSVWSLLDSFEWMCGYNNNMKKNSGADC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: