MonarchBase - Protein-coding gene

DPOGS204829
Transcript	DPOGS204829-TA	3504 bp
Protein	DPOGS204829-PA	1167 aa
Genomic position	DPSCF300221 + 327377-332913
RNAseq coverage	35x (Rank: top 74%)

Annotation
*Heliconius*	HMEL014392	0.0	52.24%
*Bombyx*	BGIBMGA001568-TA	2e-107	55.29%
*Drosophila*	CG14476-PE	2e-12	24.28%
EBI UniRef50	UniRef50_E3X5T8	9e-49	25.59%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3X5T8_ANODA
NCBI RefSeq	XP_968946.1	3e-62	27.76%	PREDICTED: similar to neutral alpha-glucosidase ab [Tribolium castaneum]
NCBI nr blastp	gi\|91076606	7e-61	27.76%	PREDICTED: similar to neutral alpha-glucosidase ab [Tribolium castaneum]
NCBI nr blastx	gi\|91076606	1e-60	27.76%	PREDICTED: similar to neutral alpha-glucosidase ab [Tribolium castaneum]

Group
Gene Ontology	GO:0004553	9.6e-40	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	9.6e-40	carbohydrate metabolic process
	GO:0030246	8.2e-05	carbohydrate binding
	GO:0003824	8.2e-05	catalytic activity
KEGG pathway	gga:416462	5e-22
	K12316 (GAA)	maps->	Starch and sucrose metabolism
			Galactose metabolism
			Lysosome
InterPro domain	[584-1046] IPR000322	9.6e-40	Glycoside hydrolase, family 31
	[591-958] IPR017853	2e-10	Glycoside hydrolase, superfamily
Orthology group	MCL18463		Insect specific

Nucleotide sequence:

>DPOGS204829-TA
ATGATTCCCCACGCCAAAACTATGGAGGAAGCTTTGGACTCTGAAATAAGATATCAGAACCTTAAAATTATTAACCATATAACATGGTACGACCGAATTCTATTAAATCGACCAATAAAAGTCGTACTTGCTTTATTTTTGGCAGCGGTCGTCAGTCCCTTGTTGTTATACAGATACTCTTTCTTCGTCAGTATAAACCTGCCACCATCTGACGGGTTTTCTATAGGATCATGTTTAATTCCTCGATCGACAAGACTTCCCTGTGGTAATGGATCCAGCTTACAAGAGCATTGTCACAGCCAGTGCTGCTTTGATCTCAATCTCCATGTCTGCTATCATCGTCTACCCTCAAGGTTTTCCTATATAATGAATCAGCCTTGGAATGAAAATATAACATTGTCGCCTCGGATAGCCACAGAGCCTTACGCTTTTCAGAACAGTATACCTGCAGTCAGACTGTCCGTTGATGAAGTAACAGCCACACATATGACTCTCACGTTTTATAATTCGAGAAATATATCTCTTAATGGAAGGAGACTCCAAAACAAGGAGTATTCGTATACAGTCACGTCGCCGGAGTTGAATATCGTCGTGAGAGCATCAAATAGAACAATTTTTAACACAGCAAGTGGACCCTTCATAGCATCGGATAATATTTGGGAGATGTCCTTTATATTAACCAACGAAATGATGTACGGATTGGGCGAAATACCGTTAAAAAAGAACAATACAAAAGTGATATACAGTCACAAAGGTGGATTTAGTTCCGTGCCACTGATATTCGCTAAGCTTAACAACTCCTATCACGGATTACTATTCGATGCTAATGATCCCACAGAAATCTTCATCTCATTGGAAAATCACGTCGTTGTTCGGAGTATCACGAACTTCGGTTTAAAGTTTCACTTGTTTTCTGGACCGGAGCCGAAAGACATCATGAAAGACGTTATGGCCATAACTGGGAAATACAAAAAGTTGGAATATTGGATGCTGGGCGTTCATATTTGCAGTGAAGTTCAAGGTTTGGAGTTGAATGCATTTTTAAAAAATGCAACAGCTGAAAGGATGCCATTTGATAGTCACTGTGGTGTCCAACCTATTGTGTTTACTAGTGATCAATGTAACAGCAATGACATAAATAACATCGACGCTATCAATGCTGGTTCTAAATTGCTCGAAACCGCTCAGAAAAAATTCGTACCTCACGTTTCCCCTTACCCTTGGAATGAAAATATAACATTGTCGCCTCGGATAGCCACAGAGCCTTACGCTTTTCAGAACAGTATACCTGCAGTCAGACTGTCCGTTGATGAAGTAACAGCCACACATATGACTCTCACGTTTTATAATTCGAGAAATATATCTCTTAATGGAAGGAGACTCCAAAACAAGGAGTATTCGTATACAGTCACGTCGCCGGAGTTGAATATCGTCGTGAGAGCATCAAATAGAACAATTTTTAACACAGCAAGTGGACCCTTCATAGCATCGGATAATATTTGGGAGATGTCCTTTATATTAACCAACGAAATGATGTACGGATTGGGCGAAATACCGTTAAAAAAGAACAATACAAAAGTGATATACAGTCACAAAGGTGGATTTAGTTCCGTGCCACTGATATTCGCTAAGCTTAACAACTCCTATCACGGATTACTATTCGATGCTAATGATCCCACAGAAATCTTCATCTCATTGGAAAATCACGTCGTTGTTCGGAGTATCACGAACTTCGGTTTAAAGTTTCACTTGTTTTCTGGACCGGAGCCGAAAGACATCATGAAAGACGTTATGGCCATAACTGGGAAATACAATAAGTTGGAATATTGGATGCTGGGCGTTCATATTTGCAGTGAAGTTCAAGGTTTGGAGTTGAATGCATTTTTAAAAAATGCAACAGCTGAAAGGATGCCATTTGATAGTCACTGTGGTGTCCAACCTATTGTGTTTACTAGTGATCAATGTAACAGCAATGACATAAATAACATCGACGCTATCAATGCTGGTTCTAAATTGCTCGAAACCGCTCAGAAAAAATTCGTACCTCACGTTTCCCCTTACATTCGTTATGAAATAAAAAATGACACAGATATTCAAAACACGACCACATTTACTGAATATAACGTAAGCTGTGAAATTATGCCGCATTTTGATAAATTAATGTATCGAACTCCAAATGCTCATGAGGTGTACACCGGGGAAATCAATGATTTTGCAGTCATATATCCTAACTACGAGGACGCTCCACCAGAATTTCTAGAGAGTTTATGGGCTTATAACAAAAAAATTGATGGTATTGTGCTCGAAAACAATTTTCCCTTAGACGAAAAAGAGAAAGATCTGGAAGAAATGTCTTTATACCTGCCTTATTTTAGTCAGCACTTTAAAAATGCGTTTAACTATACGCCACCATGGAACTTAACACTGGCTGATTATAACCAAAGCTACCTCTTCCAACATAACAGATATGGCAACAATTTTGTAGATGCTTTCATAAAAAGGTCCAACGATATTCCTGTCTGGTCGAGCAGTCTCTGGCTAAATTCTGGGACTAATATAAACAGACAAAGTATTAATGCTTCCTGGCTTAATCTTAATAATGAACTGGTAAACGCAGCTCTAGGAGGGGTATCTGGGCATTGGCTATGGTCATCGCCGATATGTGGGGATACAGAATATTTTAATCCGGAAACCCAAACGAACCTTTGCATTAAATGGTACCTAGCAGCAGTTTACTTACCAATTGTGAAAATACATTCCAAAGTGATCCCAAGACATCCTACTGCTTTCGTGGGTACTCATAAGACTTTGGCTATAGAGGCAATAGGTAGAAGATACAGTCTGTTGCCATATTATTACACTGTGCTCCAAGAAGGACCTTTACTGAGACCTATGTTCTATCAATATCCGGCATCACAAGCAATACGAGATTTAAGCTCTCAGTTTAATGTTGGTGATAGTCTTCTCATAGCTCCCAATTTACTGCCTCTTCAAAGTCATGTTCAAATTCGGAAACCTCCGGGCTCCTGGTATGAACTGTGGAGTGGCACCAAATTGCAAGGTCAGGAAGGTGACCTACTTACATTATCTACCACGGATGCTGACCTCATGACTTTTATCAAGGGAGGTTCTGTGATATTAATACAGAAGAAAACAGAGTTGTCCGCTTCTGATACATTGCTTACTGAATTTAACGCAATAATTGCTTTGGAATGTATCGAGGAAAACGTGTGCTCGGCGTCAGGGAAACAATTTGTCACTGACGGTCTAACATTGGTGTTCGAGGCTAATGCTCAAAATATGACGATATCTGCTATTGGTAACGATTTCATGCCTATGTGCGATTTCAACTCTGGCACATGGGGCTACGACATCAAACTCTATAGTATCTATGGTTTACCAGATGAGATTAACAATATGGATAATCAGAGGCAAGTGAGTCAATTCACAGATTTGTGCAATTTAGAATACGGCGACAACATCGTTATAAAATTTCTCACTTAA

Protein sequence:

>DPOGS204829-PA
MIPHAKTMEEALDSEIRYQNLKIINHITWYDRILLNRPIKVVLALFLAAVVSPLLLYRYSFFVSINLPPSDGFSIGSCLIPRSTRLPCGNGSSLQEHCHSQCCFDLNLHVCYHRLPSRFSYIMNQPWNENITLSPRIATEPYAFQNSIPAVRLSVDEVTATHMTLTFYNSRNISLNGRRLQNKEYSYTVTSPELNIVVRASNRTIFNTASGPFIASDNIWEMSFILTNEMMYGLGEIPLKKNNTKVIYSHKGGFSSVPLIFAKLNNSYHGLLFDANDPTEIFISLENHVVVRSITNFGLKFHLFSGPEPKDIMKDVMAITGKYKKLEYWMLGVHICSEVQGLELNAFLKNATAERMPFDSHCGVQPIVFTSDQCNSNDINNIDAINAGSKLLETAQKKFVPHVSPYPWNENITLSPRIATEPYAFQNSIPAVRLSVDEVTATHMTLTFYNSRNISLNGRRLQNKEYSYTVTSPELNIVVRASNRTIFNTASGPFIASDNIWEMSFILTNEMMYGLGEIPLKKNNTKVIYSHKGGFSSVPLIFAKLNNSYHGLLFDANDPTEIFISLENHVVVRSITNFGLKFHLFSGPEPKDIMKDVMAITGKYNKLEYWMLGVHICSEVQGLELNAFLKNATAERMPFDSHCGVQPIVFTSDQCNSNDINNIDAINAGSKLLETAQKKFVPHVSPYIRYEIKNDTDIQNTTTFTEYNVSCEIMPHFDKLMYRTPNAHEVYTGEINDFAVIYPNYEDAPPEFLESLWAYNKKIDGIVLENNFPLDEKEKDLEEMSLYLPYFSQHFKNAFNYTPPWNLTLADYNQSYLFQHNRYGNNFVDAFIKRSNDIPVWSSSLWLNSGTNINRQSINASWLNLNNELVNAALGGVSGHWLWSSPICGDTEYFNPETQTNLCIKWYLAAVYLPIVKIHSKVIPRHPTAFVGTHKTLAIEAIGRRYSLLPYYYTVLQEGPLLRPMFYQYPASQAIRDLSSQFNVGDSLLIAPNLLPLQSHVQIRKPPGSWYELWSGTKLQGQEGDLLTLSTTDADLMTFIKGGSVILIQKKTELSASDTLLTEFNAIIALECIEENVCSASGKQFVTDGLTLVFEANAQNMTISAIGNDFMPMCDFNSGTWGYDIKLYSIYGLPDEINNMDNQRQVSQFTDLCNLEYGDNIVIKFLT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: