MonarchBase - Protein-coding gene

DPOGS214663
Transcript	DPOGS214663-TA	2481 bp
Protein	DPOGS214663-PA	826 aa
Genomic position	DPSCF300321 - 41089-50981
RNAseq coverage	26x (Rank: top 77%)

Annotation
*Heliconius*	HMEL011894	0.0	73.44%
*Bombyx*	BGIBMGA001876-TA	0.0	79.63%
*Drosophila*	Amy-p-PA	2e-171	59.47%
EBI UniRef50	UniRef50_P81641	9e-170	59.47%	Alpha-amylase B n=313 Tax=Mandibulata RepID=AMYB_DROME
NCBI RefSeq	NP_001166624.1	0.0	71.03%	alpha-amylase [Bombyx mori]
NCBI nr blastp	gi\|33151028	0.0	77.15%	alpha-amylase 2 [Diatraea saccharalis]
NCBI nr blastx	gi\|219523022	0.0	80.00%	alpha-amylase [Ephestia kuehniella]

Group
Gene Ontology	GO:0043169	3.3e-114	cation binding
	GO:0005975	3.3e-114	carbohydrate metabolic process
	GO:0003824	3.3e-114	catalytic activity
KEGG pathway	dan:Dana_GF18843	2e-173
	K01176 (E3.2.1.1, amyA, malS)	maps->	Starch and sucrose metabolism
InterPro domain	[19-528] IPR015902	1.8e-191	Alpha amylase
	[33-417] IPR013781	3.3e-114	Glycoside hydrolase, subgroup, catalytic core
	[32-420] IPR017853	7.8e-105	Glycoside hydrolase, superfamily
	[42-415] IPR006589	1.9e-96	Glycosyl hydrolase, family 13, subfamily, catalytic domain
	[424-512] IPR006048	2.1e-49	Alpha-amylase, C-terminal all beta
	[727-814] IPR013780	9.2e-40	Glycosyl hydrolase, family 13, all-beta
	[89-106] IPR006046	2.1e-33	Glycoside hydrolase, family 13
	[67-361] IPR006047	1.4e-22	Glycosyl hydrolase, family 13, catalytic domain
Orthology group	MCL10115		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214663-TA
ATGCACTTGGACACAACACTGGCACAGATAGCCTCATTGCAGGCTGGGTTAACAATTCTAGTTGTATTAGCTTTGGCAACCGGACTAAATGCTTATAAGAATCCACACTATGCGCCGAATAGATCTGTGAACGTTCATTTGTTTGAATGGAAATGGGATGACATAGCGGCTGAATGTGAACGGTTCTTAGGACCTAAAGGGTTCGGAGGTATTCAGGTATCACCGCCCAATGAGAACGTCGTTCTTCGTAACAACAATCGTCCCTGGTGGGAGCGGTATCAGTCCATGTCATATAAGCTGGTGACCAGATCTGGCAATGAACAGCAGTTTACCAACATGGTCAGACGGTGTAACGCGGCTGGAGTTAGGATTTACGTGGATGCTGTCATCAACCACATGACAGGAGAGCCAGTGGAGAATGTAGGGACAGGGGGAAGCACTGCTGTGTTCCGGGATTTTTACTACCCAGCTGTGCCTTACACCAGGGATCACTTCAACTGGCCAACGTGCGGTATTAATGGGGAAGACTATATGAACAATGCGTGGAGGGTCCGCAACTGTGAGCTGGTCGGTCTGAAGGATTTGGATCAGAGCAACGAACATGTCAGACAAATGATAGTCAATTATATGAACAAACTCATAAGCCTCGGTGTCGCTGGATTCAGAATCGACGCAGCGAAGCACATGTGGCCGGAAGACTTGAGAGTCATTTTCAGCAGACTCCGAAATCTGAACACTGAGCACGGTTTCGCCCCGAACTCCCGACCATACATATACCAGGAGGTTATCGACTATGGCGGTGAGGCCGTCAGCAGGGACGAATACACACCCATAGGGGCTGTCACAGAATTCAAAGCTGGCTTGGAACTTAGTAACGCCTTCAGAGGAAGCAACCAACTGAGATGGCTTTCCTCGTGGGGCCCACAATGGGGTTTGCTAGCTAGCGGTGACGCTTTGACATTTATAGACAACCATGATAACGAGAGAGGTCACGGAGGCGGTGGGGGGATATTGACGTACAAGGAGCCCAGAGCATACAAGGCGGCTATAGCGTTCCTCCTGGCGCATCCTTACGGGGAACCACAGATAATGAGCAGTTTTCAATTCCTGGACTCCGAAATTGGACCACCGATGGACTTTAACCAGAATATTATATCACCCTCTATCAATTCCGATGGATCTTGCGGCAACGGCTGGGTCTGTCAGCACCGTTGGAGACAGATCTACGCGATGGTAGGATTCAGGAACGCGGCTGGCAACAGTGGCATCAACGATTGGTGGGACAACGGCTCTAATCAGATCGCGTTCTGCCGCGGAAATAAGGCTTTCATCGCATTTAACAATGACAACTGGACTTTAAATCAAAATTTGCAGACCTGTCTGCCCGCGGGTACTTACTGCGACGTCATCTCGGGAGACAAAGTGAACAACTCCTGTCGCGGTAAGACTGTGAACGTGGACGGTAACGGTCGCGCTAACATTATACTTGGCAACAATGAGTACGACATCATGATGGCTATACATGTTGGTCCGGAGGCTACAGTGAAACGTTTTGAAATAATCATTTTCGTCACCAGAATCGACGCAGCGAAGCACATGTGGCCGGAAGACTTGAGAGTCATTTTCAGCAGACTCCGAAATCTGAACACTGAGCACGGTTTCGCCCCGAACTCCCGACCATACATATACCAGGAGGTTATCGACTATGGCGGTGAGGCCGTCAGCAGGGACGAATACACACCCATAGGGGCTGTCACAGAATTCAAAGCTGGCTTGGAACTTAGTAACGCCTTCAGGGGAAACAACCAACTGAGATGGCTTTCCTCGTGGGGCCCACAATGGGGTTTGCTAGCTAGCGGTGACGCTTTGACATTTATAGACAACCATGATAACGAGAGAGGTCACGGAGGCGGTGGGGGGATATTGACGTACAAGGAGCCCAGAGCATACAAGGCGGCTATAGCGTTCCTCCTGGCGCATCCTTACGGGGAACCACAGATAATGAGCAGTTTTCAATTCCTGGACTCCGAAATTGGACCACCGATGGACTTTAACCAGAATATTATATCACCCTCTATCAATTCCGATGGATCTTGCGGCAACGGCTGGGTCTGTCAGCACCGTTGGAGACAGATCTACGCGATGGTAGGATTCAGGAACGCGGCTGGCAACAGTGGCATCAACGATTGGTGGGACAACGGCTCTAATCAGATCGCGTTCTGCCGCGGAAATAAGGCTTTCATCGCATTTAACAATGACAACTGGACTTTAAATCAAAATTTGCAGACCTGTCTGCCCGCGGGTACTTACTGCGACGTCATCTCGGGAGACAAAGTGAACAACTCCTGTCGCGGTAAGACTGTGAACGTGGACGGTAACGGTCGCGCTAACATTATACTTGGCAACAATGAGTACGACATCATGATGGCTATACATGTTGGTCCGGAGGTTAAATATCAGGCAGACCTGAATCACAACTGA

Protein sequence:

>DPOGS214663-PA
MHLDTTLAQIASLQAGLTILVVLALATGLNAYKNPHYAPNRSVNVHLFEWKWDDIAAECERFLGPKGFGGIQVSPPNENVVLRNNNRPWWERYQSMSYKLVTRSGNEQQFTNMVRRCNAAGVRIYVDAVINHMTGEPVENVGTGGSTAVFRDFYYPAVPYTRDHFNWPTCGINGEDYMNNAWRVRNCELVGLKDLDQSNEHVRQMIVNYMNKLISLGVAGFRIDAAKHMWPEDLRVIFSRLRNLNTEHGFAPNSRPYIYQEVIDYGGEAVSRDEYTPIGAVTEFKAGLELSNAFRGSNQLRWLSSWGPQWGLLASGDALTFIDNHDNERGHGGGGGILTYKEPRAYKAAIAFLLAHPYGEPQIMSSFQFLDSEIGPPMDFNQNIISPSINSDGSCGNGWVCQHRWRQIYAMVGFRNAAGNSGINDWWDNGSNQIAFCRGNKAFIAFNNDNWTLNQNLQTCLPAGTYCDVISGDKVNNSCRGKTVNVDGNGRANIILGNNEYDIMMAIHVGPEATVKRFEIIIFVTRIDAAKHMWPEDLRVIFSRLRNLNTEHGFAPNSRPYIYQEVIDYGGEAVSRDEYTPIGAVTEFKAGLELSNAFRGNNQLRWLSSWGPQWGLLASGDALTFIDNHDNERGHGGGGGILTYKEPRAYKAAIAFLLAHPYGEPQIMSSFQFLDSEIGPPMDFNQNIISPSINSDGSCGNGWVCQHRWRQIYAMVGFRNAAGNSGINDWWDNGSNQIAFCRGNKAFIAFNNDNWTLNQNLQTCLPAGTYCDVISGDKVNNSCRGKTVNVDGNGRANIILGNNEYDIMMAIHVGPEVKYQADLNHN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: