MonarchBase - Protein-coding gene

DPOGS200695
Transcript	DPOGS200695-TA	1653 bp
Protein	DPOGS200695-PA	550 aa
Genomic position	DPSCF300571 + 9569-18492
RNAseq coverage	23x (Rank: top 78%)

Annotation
*Heliconius*	HMEL014472	7e-129	49.37%
*Bombyx*	BGIBMGA014144-TA	1e-127	48.74%
*Drosophila*	CG9701-PA	1e-88	38.40%
EBI UniRef50	UniRef50_Q16ET6	7e-94	39.28%	Glycoside hydrolases n=9 Tax=Neoptera RepID=Q16ET6_AEDAE
NCBI RefSeq	XP_557100.2	1e-101	41.86%	AGAP006426-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|118788042	2e-100	41.86%	AGAP006426-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|291231358	2e-86	39.20%	PREDICTED: cytosolic beta-glucosidase-like [Saccoglossus kowalevskii]

Group
Gene Ontology	GO:0004553	2.7e-159	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	2.7e-159	carbohydrate metabolic process
	GO:0043169	3.3e-73	cation binding
	GO:0003824	3.3e-73	catalytic activity
KEGG pathway	cfa:483898	3e-83
	K01229 (LCT)	maps->	Galactose metabolism
InterPro domain	[120-535] IPR001360	2.7e-159	Glycoside hydrolase, family 1
	[130-542] IPR017853	5.5e-120	Glycoside hydrolase, superfamily
	[284-537] IPR013781	3.3e-73	Glycoside hydrolase, subgroup, catalytic core
Orthology group	MCL16206		Patchy

Nucleotide sequence:

>DPOGS200695-TA
ATGTTGAAGACGGCGTCCAGGCCCATCACGCCGGTGCCCCCTACACCCAGCGCTGCCTGCGACGAGGCCAGGCGTGCACATAGCACGCTCTCTGCCAAGTCGATGGCCTTCGCGAGGATCAGATTCCTGCACGAGCATGCACTGTTAGGAGTTGGGTTTTGTAGAAGATTTCCACCCGGGTTCAAATTTGGTGCAGCCACAGCTGCTTACCAGGTCGAGGGCGCCTGGAACGTCAGCGACAAATCCGCAAGTATCTGGGACACGTTCGTGCACACTAGACCAGAGATTATAGCAGATAGATCCAACGGGGACGTCGCCTGTGACAGCTACAACCAATGGATGAGAGACGTGGAAATAGCTTCGGAGTTGGGATTAGATTTCTACAGAAGATTTCCACCCGGGTTCAAATTTGGTGCAGCCACAGCTGCTTACCAGGTCGAGGGCGCCTGGAACGTCAGCGACAAATCCGCAAGTATCTGGGACACGTTCGTGCACACTAGACCAGAGATTATAGCAGATAGATCCAACGGGGACGTCGCCTGTGACAGCTACAACCAATGGATGAATGACGTGGAAATAGCTTCGGAGTTGGGATTAGATTTCTACAGATTTTCTCTCTCCTGGCCAAGAATTTTGCCATATGGTTTTGCAAATAAGATAAGTGAAGACGGAGTAAAATTTTACACAAATCTCATCGATGCTTTATTGGAGAGAGGAATTGAGCCTGTCGTAACAATTTATCACTGGGATTTGCCACAAAATTTACAAGATCTTGAATTCATCTCTCATGATCCGTCTATAGCGGCTTATACAGATTCCGTCAAAGTCAAAAATAAGTTGTTCATCATGTACAGAACTAAACGAGCAGGCAAGGTGTCCCTCACCAACCAAATCATGTGGTTTGAGGGAGCTGATGAAAATGACGGAGAAGCGGCTGAACTGGCTCTACAGTTAATGGGAGGAATGTACTCACACCCAATCTTCTCTAAGAAAGGCGGTTGGCCTAAGAAAGTAGAAAATCTAATAGCAGAAAAGAGTAAAAAAGAGGGTTACCCACAATCCAGATTGCCAGAATTTACAAAGGAAGAAAAAGAATTAATAAAAGGAACATATGACTTCTTCGGCTTGAACTACTATACGTCACGAATTGCTCGCCGTGCCCGAGGAGAAGTTGTTGGTCCTTGGCCTCTCAAAGGTGGACCAGACATTGATGTAAAAACATCAGTGCGTCCAGAATGGCCGCAGGCTGGCACCAGCTGGTTCTATGTACACCCGCAAGGTTTACGGAAACTAATTTCTTGGGTGAAAGAACAGTATGGGGACATAGAAATCTTCATAGCAGAGAACGGCTTTGCCACCCATGGCCAGGATTTAGACGATCAAGTCCGCGTGGATTACTATAAGAGCCATTTAGAACAGGTTCACCTCGCAATTGAAGAAGATAAGGCCAATGTCGTAGCATACACAGCTTGGACGATGATAGACAACTTTGAATGGAGCGATGGCTATCGTTCCAAATTCGGTTTGTACGAGGTGGACTTCAGCGACCCAGCCCGCGCCCGGCGCCCGAGAGCCTCCGCACACTACTACAAAGAGATTGTGAAAGCGAAATCATTAGATGTAGATAGTCATGTATTAAATGATGAATTATAG

Protein sequence:

>DPOGS200695-PA
MLKTASRPITPVPPTPSAACDEARRAHSTLSAKSMAFARIRFLHEHALLGVGFCRRFPPGFKFGAATAAYQVEGAWNVSDKSASIWDTFVHTRPEIIADRSNGDVACDSYNQWMRDVEIASELGLDFYRRFPPGFKFGAATAAYQVEGAWNVSDKSASIWDTFVHTRPEIIADRSNGDVACDSYNQWMNDVEIASELGLDFYRFSLSWPRILPYGFANKISEDGVKFYTNLIDALLERGIEPVVTIYHWDLPQNLQDLEFISHDPSIAAYTDSVKVKNKLFIMYRTKRAGKVSLTNQIMWFEGADENDGEAAELALQLMGGMYSHPIFSKKGGWPKKVENLIAEKSKKEGYPQSRLPEFTKEEKELIKGTYDFFGLNYYTSRIARRARGEVVGPWPLKGGPDIDVKTSVRPEWPQAGTSWFYVHPQGLRKLISWVKEQYGDIEIFIAENGFATHGQDLDDQVRVDYYKSHLEQVHLAIEEDKANVVAYTAWTMIDNFEWSDGYRSKFGLYEVDFSDPARARRPRASAHYYKEIVKAKSLDVDSHVLNDEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: