MonarchBase - Protein-coding gene

DPOGS201333
Transcript	DPOGS201333-TA	1272 bp
Protein	DPOGS201333-PA	423 aa
Genomic position	DPSCF300176 + 625198-629843
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL012399	2e-130	57.11%
*Bombyx*	BGIBMGA010811-TA	9e-132	50.67%
*Drosophila*	CG9701-PA	4e-61	49.79%
EBI UniRef50	UniRef50_G6DAN3	0.0	100.00%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_001183226.1	3e-90	43.40%	PREDICTED: similar to lactase-phlorizin hydrolase [Strongylocentrotus purpuratus]
NCBI nr blastp	gi\|115710020	6e-89	43.40%	PREDICTED: similar to lactase-phlorizin hydrolase [Strongylocentrotus purpuratus]
NCBI nr blastx	gi\|115710020	5e-90	43.40%	PREDICTED: similar to lactase-phlorizin hydrolase [Strongylocentrotus purpuratus]

Group
Gene Ontology	GO:0004553	4.9e-179	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	4.9e-179	carbohydrate metabolic process
	GO:0043169	7.6e-72	cation binding
	GO:0003824	7.6e-72	catalytic activity
KEGG pathway	ate:Athe_0458	1e-63
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[29-416] IPR001360	4.9e-179	Glycoside hydrolase, family 1
	[29-417] IPR017853	3.6e-133	Glycoside hydrolase, superfamily
	[30-189] IPR013781	7.6e-72	Glycoside hydrolase, subgroup, catalytic core
Orthology group

Nucleotide sequence:

>DPOGS201333-TA
ATGTTCGGCGCTGTGAGATTAGTATTCCTGGCATTTATATTGGCTGTACTTGCAAATAGCAAAAAAATCTCTCGACATGAAGCGAGAAAAATACCCGACCACTTACTTTTCGGAGCTGCTACGGCATCGTACCAAATAGAAGGCACTTGGAATGAAGACGGAAAATCTGAAAATATATGGGATCGCGTATCACACAGGGAACCTTGTGTTGTCGACAACTGCGACACAGGTGACCTTGCCGATGATTCGTATCATCAATATAAGCGTGATGTGGAAATGATGCGGGAACTAGGTCTCGACTTCTATAGGTTCTCTCTCTCCTGGACGAGAATATTACCAACGAGTTTTCCAGACCAAATAAATGAAAAAGGAGTACAATATTATAATAATTTGATAAATGAGATGCTCAAATACAACATACAACCCATGGTGACTCTTTATCACTGGGATTTACCTCAGAAGTTGCAAGATCTGGGAGGATGGACCAATCCCCATATCGTTGATTGGTTTACCGATTACTCCAGAGTAGTGTTCCAGTTATTTGGAGATAGGGTTAAGTATTGGTGGGGACTGTATGCAAATCCAATATTTTCCGAATTTGGGGACTATCCAGCAGTCATGAAAGATAGAATAGCAGCAAAGAGTAAGAAACAAGGATTTCCAAGATCGCGATTACCACAATTCACTCCTGAAGAAATAGATTTAATTAAAGGAAGTTCGGATTTCATTGGATTAAATCATTATACTACTAACATTGTTTATAGGAACGAATCTGTTTATGGATATTATAGTTCGCCATCTTTTTATGATGATATTGAAGTAATAAGTTATCAAGATAGTTCCTGGGAGTCAGCTGCTTCCAACTGGTTAAAGAGTGTACCCTGGGGATTCTATAAGTTATTAACAAAAATACGAGAGGACTACAACAACCCGCCAGTTTTCATCACTGAGAATGGATTCTCAACCCGAGGTGGTCTAATTGACGACGACCGCGTAAAGTATTACAGAACATACATAGATGCTATGCTCGATGCTATTGAAGATGGATCAGATATAAGAGTTTATGCAGCGTGGAGTTTGATGGACAATTTCGAATGGATGAGGGGATACAGCGAACGTTTCGGACTGTACGAGGTGGACTACGAGAGTCCTGACCGCACCCGAACTCCTCGCAAGTCTGCTTACGTATACAAAGAGATGCTGCGCACACGAACACTGGACTATCATTATGAACCTGATATGAGCTTGGGAATGAATGTCGATGATAATTAA

Protein sequence:

>DPOGS201333-PA
MFGAVRLVFLAFILAVLANSKKISRHEARKIPDHLLFGAATASYQIEGTWNEDGKSENIWDRVSHREPCVVDNCDTGDLADDSYHQYKRDVEMMRELGLDFYRFSLSWTRILPTSFPDQINEKGVQYYNNLINEMLKYNIQPMVTLYHWDLPQKLQDLGGWTNPHIVDWFTDYSRVVFQLFGDRVKYWWGLYANPIFSEFGDYPAVMKDRIAAKSKKQGFPRSRLPQFTPEEIDLIKGSSDFIGLNHYTTNIVYRNESVYGYYSSPSFYDDIEVISYQDSSWESAASNWLKSVPWGFYKLLTKIREDYNNPPVFITENGFSTRGGLIDDDRVKYYRTYIDAMLDAIEDGSDIRVYAAWSLMDNFEWMRGYSERFGLYEVDYESPDRTRTPRKSAYVYKEMLRTRTLDYHYEPDMSLGMNVDDN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: