MonarchBase - Protein-coding gene

DPOGS201926
Transcript	DPOGS201926-TA	1590 bp
Protein	DPOGS201926-PA	529 aa
Genomic position	DPSCF300112 + 14971-27595
RNAseq coverage	389x (Rank: top 31%)

Annotation
*Heliconius*	HMEL007316	0.0	77.97%
*Bombyx*	BGIBMGA002660-TA	0.0	76.38%
*Drosophila*	CG9701-PA	1e-139	51.05%
EBI UniRef50	UniRef50_Q16ET6	1e-148	49.61%	Glycoside hydrolases n=9 Tax=Neoptera RepID=Q16ET6_AEDAE
NCBI RefSeq	XP_001850321.1	2e-152	53.38%	glycoside hydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|364023609	0.0	78.80%	seminal fluid protein CSSFP029 [Chilo suppressalis]
NCBI nr blastx	gi\|364023609	0.0	79.01%	seminal fluid protein CSSFP029 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	1.7e-243	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	1.7e-243	carbohydrate metabolic process
	GO:0043169	3.6e-173	cation binding
	GO:0003824	3.6e-173	catalytic activity
KEGG pathway	tca:664577	6e-136
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[31-503] IPR001360	1.7e-243	Glycoside hydrolase, family 1
	[30-495] IPR013781	3.6e-173	Glycoside hydrolase, subgroup, catalytic core
	[30-507] IPR017853	6e-162	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201926-TA
ATGTATAAATATATTTTTTATTTTTCTTTATTTTTATGCCATGGGCAAGCGGAAGTATTAAATTTAGCTGGAGGCGCAAAGTCTAACTACACTTTTCCGAAGGATTTTCTTTTTGGTGTCTCAACAGCGGCAATACAAATTGAAGGAGCATGGAATGAAGATGGGAAGACGGAAAGCATATGGGATCACTTAGTGCGTGTAAATCCTAACTTCACTAAAGACGGATCTACCCCTGACGTAGCAGCAGATTCCTATCATTTATACAAGAGAGATGCTGAAATGGTCCACGAACTTGGAGTGAATATGTATAGGTTTTCAATATCCTGGCCAAGGATACTACCAACTGGTTTAGCCAATCAAGTTAATCCTCTCGGAATTGAGTACTATAAAAATCTCATAAGCGAGTTGGAAAGGTACAATATTACTCCTATGGTCACCATTTACCATTGGGATCTACCTCAGAAATTACAGGATATTGGGGGTTGGACGAACGCGCATATCATAGATTATTATACGGACTACGCGAATGTATTGTTTGAAAATTTCGCGGATAAAGTTAAATATTGGATAACATTCAACGAGCCAATGCAAACCTGCCTGGAAGGTTACGGCAACACGTACCGAGCGCCTGCACTGAACCGACACGGTATAGCTGAATATCTGTGCACACACAATTTGTTAAAAGCGCACGCAAGCGTTTACCATTTGTTCAATAAGCAGTATCGTCCACTGTATGGAGGGAAAATGGGTATGTCACTGGACTCTAATTGGGCAGAACCCAAAACAGATACACCAAGAGACAAGAAAGCTGCGGAGTTGTACCTTAAAACTCATCTTGGATGGTATGCACATCCTGTATATTCGGAAACTGGAAATTATCCAGAAGAGCTTATCAAACTTGTTGATGAAAAAAGTAAGAAACAGAACTACACCCACTCTCGACTTCCCAAGTTTACTCCTGAGGAAATAGCCTATATACGAGGAACTGCAGACTTCTTCGGTTTAAACCATTACACCACGTATCTTTTGAGCATGGCTGACAGTGAAGTTGGTGAGGTGCCATCACATGCAAACGATGTTGGTATTGTTAGGGTTCAAGATCCCAAGTGGCCGTCGAAGTCCTCTTCCTCTTGGCTAAAGGTGGTGCCATTTGGATTTCGTCGCCTCTTAAATTGGATAACTAAAACGTACAATAACGTGCCAATAATCGTTACGGAGAACGGATATGCTGACTTTAGTGGAGTGAAAGATGAAGCAAGAGTTTCTTACTATTGCCACTATTTAAATTCTCTCCTCCATTCAATACACGAAGATAAGACAAACGTTCAAGGGTATTTCGCTTGGAGTCTGATGGATAATTGGGAATGGGACGACGGCTATGCGTCCCGCTTCGGTCTTTACTTGGTCGATTTCAATAGTCCCAACAAGACGAGAACTGCTAAGGAATCGGCGAAATTGTACACGAGCGTAATATCCTCTCGAGGCCTGCCCGCCGACTACGACCCAGAAGATTTCACCGCCTTTTCCAGTGCTTCTCTTCTCGTTCCAACTCTACTCTCACTCTTACCCTTTTATAGGCTACTTACATGA

Protein sequence:

>DPOGS201926-PA
MYKYIFYFSLFLCHGQAEVLNLAGGAKSNYTFPKDFLFGVSTAAIQIEGAWNEDGKTESIWDHLVRVNPNFTKDGSTPDVAADSYHLYKRDAEMVHELGVNMYRFSISWPRILPTGLANQVNPLGIEYYKNLISELERYNITPMVTIYHWDLPQKLQDIGGWTNAHIIDYYTDYANVLFENFADKVKYWITFNEPMQTCLEGYGNTYRAPALNRHGIAEYLCTHNLLKAHASVYHLFNKQYRPLYGGKMGMSLDSNWAEPKTDTPRDKKAAELYLKTHLGWYAHPVYSETGNYPEELIKLVDEKSKKQNYTHSRLPKFTPEEIAYIRGTADFFGLNHYTTYLLSMADSEVGEVPSHANDVGIVRVQDPKWPSKSSSSWLKVVPFGFRRLLNWITKTYNNVPIIVTENGYADFSGVKDEARVSYYCHYLNSLLHSIHEDKTNVQGYFAWSLMDNWEWDDGYASRFGLYLVDFNSPNKTRTAKESAKLYTSVISSRGLPADYDPEDFTAFSSASLLVPTLLSLLPFYRLLT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: