MonarchBase - Protein-coding gene

DPOGS210178
Transcript	DPOGS210178-TA	1308 bp
Protein	DPOGS210178-PA	435 aa
Genomic position	DPSCF300393 + 77847-81649
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL014468	7e-108	49.27%
*Bombyx*	BGIBMGA014144-TA	1e-105	48.56%
*Drosophila*	CG9701-PA	3e-75	38.12%
EBI UniRef50	UniRef50_D9HQ54	4e-87	59.68%	Seminal fluid protein HACP047 (Fragment) n=1 Tax=Heliconius erato RepID=D9HQ54_9NEOP
NCBI RefSeq	XP_970224.1	7e-82	41.28%	PREDICTED: similar to beta-glucosidase [Tribolium castaneum]
NCBI nr blastp	gi\|299930653	1e-86	59.68%	seminal fluid protein HACP047 [Heliconius erato]
NCBI nr blastx	gi\|364023613	6e-93	43.80%	seminal fluid protein CSSFP031 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	5e-133	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	5e-133	carbohydrate metabolic process
	GO:0043169	4.6e-108	cation binding
	GO:0003824	4.6e-108	catalytic activity
KEGG pathway	tca:664577	8e-74
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[23-401] IPR001360	5e-133	Glycoside hydrolase, family 1
	[23-400] IPR013781	4.6e-108	Glycoside hydrolase, subgroup, catalytic core
	[23-400] IPR017853	3.3e-98	Glycoside hydrolase, superfamily
Orthology group	MCL34826		Lepidoptera specific

Nucleotide sequence:

>DPOGS210178-TA
ATGTACTATAATCCGTGTATGATCTGCTCTGTTATTTGTAAAATATATACGTCTATACGTCTATCATCAGGTAAGGGTCCCAGCGTTTGGGACGATTACGTCCACGAGAATCGTGTGAAAATTAAGGATAATTCAAACGGAGATGTCGCGGCTGATTCCTACCATTTGTGGAAAGAAGACATAAAGATAACAAAGGAATTGGGTCTGCACTTTTATCGTTTCTCAATAAACTGGCCAAGGATTCTGCCAACTGGTTTTTCAAATAAAATAAACAAAGCTGGTGTGAAATATTACAATGAACTTATAGATGGTCTTGTGAGTGCTGGTGTTGAACCTGTCGTCACTCTCTATCATTGGGAGACGCCTATTATAATCCACAAACTTGGTGGGTGGACAAATCCTTTGATAGTGAAATGGTTTGCACATTACGCCAGAATCGTGTTTTCCCTTTTCGGTGACAGAGTTAAAACCTGGATAACAATAAATGAAGCGAACGTTCAATGTGATTATTTTTACAACTCTGGAATATTCATTACTGCTAAGGAAGATGTCTTTGCACCATTTCTGTGCAATAAACACATTTTAATGGCGCATGCGCATGCGTACAGGATATATGAAAAAGAGTTTAAACCTAAGTATGGAGGGAGTGTATCTTTGGCTAATAATTTTCTGTGGCTGGACCCATACATCTCGAATCACGAAGAACTTGCTGAGCTCGGCAGAGAACACGCGATTGGGAGATATTCCCATCCAATCTATTCCAAAAAGGGTGGTTGGCCTCCCCTACTAGAAAAAGTCCTACTGGAGTATAGTTTGAAACAAGGATACAAGGAATCCAGATTACCAACATTTACGAAACAAGAGAAGGAATTTGTAAGAGGCACGGCTGATTTTTACGGCGTGAACTATTATACGTCTAATTTGATCAGGCCAATTAAACCCGGCGAAGATCCCGGATATTTCTTCATAACAGGAGTACCGGAACTGAACGCCATTTTGGTACATCCGAATAACACTTGGTATGGGGCTCTAGATATATTACCGGTGTATCCGCTAGGTCTACGCCGCTCATTGTCTTGGTTGAAGAAAAGCTACGGTGATATCGATATTCTTATAACAGAATGTGGATTCTCAACCGCAGGATACGATCTCAAAGATTACAAAAGAACTAACTTCTACAGAGACCACTTAGAACAGGCGATAGTAAATTTGGTCTGTACGAAGTTAACTTTGAAGATCCTAAAAGAAGAAGGACTCCGAGAAACTCAGCACATTACTATTCGTGTGTGGCGAAAAATAGATCATTAA

Protein sequence:

>DPOGS210178-PA
MYYNPCMICSVICKIYTSIRLSSGKGPSVWDDYVHENRVKIKDNSNGDVAADSYHLWKEDIKITKELGLHFYRFSINWPRILPTGFSNKINKAGVKYYNELIDGLVSAGVEPVVTLYHWETPIIIHKLGGWTNPLIVKWFAHYARIVFSLFGDRVKTWITINEANVQCDYFYNSGIFITAKEDVFAPFLCNKHILMAHAHAYRIYEKEFKPKYGGSVSLANNFLWLDPYISNHEELAELGREHAIGRYSHPIYSKKGGWPPLLEKVLLEYSLKQGYKESRLPTFTKQEKEFVRGTADFYGVNYYTSNLIRPIKPGEDPGYFFITGVPELNAILVHPNNTWYGALDILPVYPLGLRRSLSWLKKSYGDIDILITECGFSTAGYDLKDYKRTNFYRDHLEQAIVNLVCTKLTLKILKEEGLRETQHITIRVWRKIDH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: