MonarchBase - Protein-coding gene

DPOGS201337
Transcript	DPOGS201337-TA	1527 bp
Protein	DPOGS201337-PA	508 aa
Genomic position	DPSCF300176 + 657434-660459
RNAseq coverage	22x (Rank: top 78%)

Annotation
*Heliconius*	HMEL012399	0.0	66.21%
*Bombyx*	BGIBMGA010536-TA	0.0	61.65%
*Drosophila*	CG9701-PA	1e-140	48.97%
EBI UniRef50	UniRef50_G6DAN3	0.0	76.65%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_001850321.1	6e-147	51.25%	glycoside hydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|364023585	0.0	65.08%	seminal fluid protein CSSFP001 [Chilo suppressalis]
NCBI nr blastx	gi\|364023585	0.0	65.62%	seminal fluid protein CSSFP001 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	2.6e-238	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	2.6e-238	carbohydrate metabolic process
	GO:0043169	5.4e-175	cation binding
	GO:0003824	5.4e-175	catalytic activity
KEGG pathway	tca:664577	6e-134
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[29-501] IPR001360	2.6e-238	Glycoside hydrolase, family 1
	[30-487] IPR013781	5.4e-175	Glycoside hydrolase, subgroup, catalytic core
	[29-502] IPR017853	4.5e-164	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201337-TA
ATGTTCGGAGCGGTGAGATTGGCTTTTCTGGCCTCAGTTTTAGCTGGACATGCTGATAGCACAAAAATCTTTCGACACGAATCAAGGAAATTCCCTGACCACTTACTGTTTGGTGCTGCTACCGCGGCGTACCAAATAGAAGGGGCTTGGAATGAAGACGGTAAATCTGAAAGTATATGGGACCGCGTCACACACATGGTACCTTGTGTTATAGCTAATTGTGACACAGGCGACGTGGCCGATGATTCTTATCACCAATATAAGCGTGATGTGGAAATGATGCGGGAGCTAGGTCTCGACTTTTACAGGTTCTCTCTCTCCTGGACGAGAATATTACCAACGAGTTTTCCAGACCACATTAATGAAAAAGGAGTACAATATTATAATAATTTGATAAATGAGATGCTCAAATACAACATACAACCCATGGTGACTATTTATCATTGGGATTTACCTCAGAAGCTGCAAGATCTGGGAGGATGGACCAATCCCCATATCGTTGATTGGTTTACCGATTACTCCAGAGTAGTGTTCCAGTTATTTGGAGATAGGGTTAAGTATTGGGTAACTATTAATGAACCTCGAGAAGTTTGTGGTCAGGGATACGGAATGCAAACTATGGCTCCACTTCTAAATTATTCTGGATATGCTGATTACATATGTGCCAAAAACATACTTTTAGCTCATGCAAATGCCTATCATTTGTATAATGATGAATTTCGTGAAGCCCAGGGTGGTCAGATAGGTATAAGTCTCAGTGCTCATTGGTACGAACCTGAGTCAGAAAACGAAGTTGAATCCGCAGAAGTCTTTCGACAATTTGAGGTGGGTATTTATGCCAATCCAATATTTTCAAAATTGGGCGATTTCCCGTCCGTCGTTAAGGAAAAAGTAGCGGCAAGGAGTCAGATGCAAGGCTTTCCACGATCGCGACTACCAGAATTAACTCCTGAGGAAATTGAATTCGTTAAAGGAAGTTCCGACTTCTTTGGTTTAAACCATTATACTACATTTTTAACTTATGTATCAAAATTTCCAATACAATATCCTACATTTTATTATGCTGATATCGAAGTCTTACCTTATCAACCCGATGAATGGAATTCAAGTTATTCGAAATGGATGAAGGTAGTACCCTGGGGATTTTATAAGGTGCTAACTAAAATACGAGAGGAATATAATAATCCACCGGTTTTTATTACTGAAAATGGTTACGCATCTCCTCGTGGTCTCATAGACGACGACCGCATCGACTTTTATAGAAAATATATTAATGCTATGCTCGATGCTATAGAAGATGGAAGTGACGTTAGGGCTTACACTGCATGGAGTTTGATGGATAATTTGGAATGGATGAGTGGATACACTGAACGTTTCGGACTGTACGAGGTGGACTACGAGAGTCCTGAACGCATCCGCACTCCTCGCAAGTCTGCTTACGTGTACAAGGAGATGCTGCGCATCCGAGTACTGGACTATCATTATGAACCTGATATGAGCTTGGGAATGAATGTCGATGATAATTAA

Protein sequence:

>DPOGS201337-PA
MFGAVRLAFLASVLAGHADSTKIFRHESRKFPDHLLFGAATAAYQIEGAWNEDGKSESIWDRVTHMVPCVIANCDTGDVADDSYHQYKRDVEMMRELGLDFYRFSLSWTRILPTSFPDHINEKGVQYYNNLINEMLKYNIQPMVTIYHWDLPQKLQDLGGWTNPHIVDWFTDYSRVVFQLFGDRVKYWVTINEPREVCGQGYGMQTMAPLLNYSGYADYICAKNILLAHANAYHLYNDEFREAQGGQIGISLSAHWYEPESENEVESAEVFRQFEVGIYANPIFSKLGDFPSVVKEKVAARSQMQGFPRSRLPELTPEEIEFVKGSSDFFGLNHYTTFLTYVSKFPIQYPTFYYADIEVLPYQPDEWNSSYSKWMKVVPWGFYKVLTKIREEYNNPPVFITENGYASPRGLIDDDRIDFYRKYINAMLDAIEDGSDVRAYTAWSLMDNLEWMSGYTERFGLYEVDYESPERIRTPRKSAYVYKEMLRIRVLDYHYEPDMSLGMNVDDN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: