MonarchBase - Protein-coding gene

DPOGS210044
Transcript	DPOGS210044-TA	1737 bp
Protein	DPOGS210044-PA	578 aa
Genomic position	DPSCF300017 - 1220821-1224267
RNAseq coverage	4570x (Rank: top 3%)

Annotation
*Heliconius*	HMEL013861	5e-167	49.22%
*Bombyx*	BGIBMGA003057-TA	3e-173	49.30%
*Drosophila*	Mal-B2-PD	6e-156	51.09%
EBI UniRef50	UniRef50_D8KY55	7e-171	49.30%	Alpha amylase n=3 Tax=Obtectomera RepID=D8KY55_BOMMO
NCBI RefSeq	NP_001182391.1	1e-171	49.30%	alpha amylase [Bombyx mori]
NCBI nr blastp	gi\|306518660	2e-170	49.30%	alpha amylase precursor [Bombyx mori]
NCBI nr blastx	gi\|306518660	1e-170	50.36%	alpha amylase precursor [Bombyx mori]

Group
Gene Ontology	GO:0043169	6.6e-131	cation binding
	GO:0005975	6.6e-131	carbohydrate metabolic process
	GO:0003824	6.6e-131	catalytic activity
KEGG pathway	dme:Dmel_CG14935	5e-154
	K01187 (E3.2.1.20, malZ)	maps->	Starch and sucrose metabolism
			Galactose metabolism
InterPro domain	[3-541] IPR015902	1.8e-165	Alpha amylase
	[30-430] IPR006589	6.6e-131	Glycosyl hydrolase, family 13, subfamily, catalytic domain
	[18-483] IPR017853	1e-121	Glycoside hydrolase, superfamily
	[196-483] IPR013781	2.1e-105	Glycoside hydrolase, subgroup, catalytic core
	[45-401] IPR006047	2.5e-89	Glycosyl hydrolase, family 13, catalytic domain
Orthology group	MCL10053		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210044-TA
ATGCGTTTCCTGATCCTCTCTCTCGCTGTCTTCACGTCAGCGGTTGCCGCTTCTGATACGGAGTGGTGGAAGACCGCCTTGATCTACCAAATCTATCCGCGATCCTTCAAGGACAGTAATGGCGACGGCATCGGCGATCTTAATGGTATCACGGAGAAGCTGGTTTATCTGAATCAGACGGGAGTTGACGCGATCTGGCTCTCACCGATCTACCTCTCGCCGATGTATGACTTTGGGTACGACATTACGGACTACAGGAAAATAGCCCCCGAATACGGTACTATGGACGATTTCAAGACGCTCATGACAGAAGCACGGAGACTTGGTATCCGTGTAATAATGGACTTGGTCCCCAACCACACGGGCAATGAGAGCGAATGGTTTCAGAAGTCCATCCGACGCGAGCCAGGATACGAGGATTACTATATATGGGCGGACGGCATCAAGACCGAAGGATCCAACGACACTAAGCCACCGAGCAATTGGGTAAGCACTTTCCGGAAGAGTGCGTGGGAATACAATTCTGTGCGCGGTCAATACTACCTCCACAAATTTGTAATCGGACAACCAGATCTTAATTATCGCAGTACAAGAGTTCAACAGGAAATGAAGGATGTCCAGAAATTTTGGCTCGATTTGGGAGTATCCGGTTTCCGTGTGGACGCAATCAATCATCTGTACGAATCTAATCCCGCTAATTTCGGTGGTCGCTACCCAGACGAGCCTTTATCAGGAAACCCCAACACCAATCCCGACGACTACGAGTACCTGAACCACATTCATACCGAAAACCTGAACGAAACCTATGAAGTGGTTTACGACTGGAGAGATCTTCTCGACGAGTACATAGAACTGCAGGGGGAATACAAGATCATGATGACGGAGGCTTACGCGGACTTGGACAGCATGATGCGGTACTACGGCACCAGCACCAGGAACGGATCTATTCCCTTCAACTTCAGCTTTTTGGGAGACATCACCAAGGATTCCGACGCGAGACATATTAAGACTGTCATCGATAAATGGATGACGTACATGCCGAGTGGAAGAACTGCCAACTGGGTGAACGGTAACCACGATCAAAGCAGGATGGCTAATCGTCAGGGGGTCGACAGAGTTGATGCTATGAACATGATAGCACTGTTGTTACCTGGTGTTGCCATCACATACCAGGGTGAGGAAATAGGAATGACAGATGGAGAGGTCAGCTGGGAAGAGACGAAGGACCCGCAGGCTTGTAACACTGACGACCCCGTGAACTACTGGAAGAAGTCGAGAGACCCCAACCGTACGCCCTTCCACTGGGATAACAGCACTAATGCTGGATTCTCTACCGGAAAGACTTGGCTACCGGTTGCTAGTAACTACCACAAAGTAAACTTGGCTGAACAAATCAACAACACCAAAAGTCACTACCAGTTCTACAAGGATCTCGCAGCAATAAGAAAGATGGCAGCTGTGAAATATGGAGATGTAGACACAAGAGCTCTGTCAGAAACGGTATTAGTCGTCACAAGGTTACTACCGGGCGAGCAGGGAGTATTGGGCATTGTGAACTTATCAGATGAGGACCAATATGTTGATCTGACCTCGCTGCGTTTAATACCGAGAGTGATTAAAGTTAGGGCTGTTGGAGCCAATTGTGATAATGTGAAGGGGACTCTTCTTATCAAGAACAAAATACCAGTAAATGCTCACTGCGCCTTAGTTCTACAAACTATCCGACACTGCTGTTGA

Protein sequence:

>DPOGS210044-PA
MRFLILSLAVFTSAVAASDTEWWKTALIYQIYPRSFKDSNGDGIGDLNGITEKLVYLNQTGVDAIWLSPIYLSPMYDFGYDITDYRKIAPEYGTMDDFKTLMTEARRLGIRVIMDLVPNHTGNESEWFQKSIRREPGYEDYYIWADGIKTEGSNDTKPPSNWVSTFRKSAWEYNSVRGQYYLHKFVIGQPDLNYRSTRVQQEMKDVQKFWLDLGVSGFRVDAINHLYESNPANFGGRYPDEPLSGNPNTNPDDYEYLNHIHTENLNETYEVVYDWRDLLDEYIELQGEYKIMMTEAYADLDSMMRYYGTSTRNGSIPFNFSFLGDITKDSDARHIKTVIDKWMTYMPSGRTANWVNGNHDQSRMANRQGVDRVDAMNMIALLLPGVAITYQGEEIGMTDGEVSWEETKDPQACNTDDPVNYWKKSRDPNRTPFHWDNSTNAGFSTGKTWLPVASNYHKVNLAEQINNTKSHYQFYKDLAAIRKMAAVKYGDVDTRALSETVLVVTRLLPGEQGVLGIVNLSDEDQYVDLTSLRLIPRVIKVRAVGANCDNVKGTLLIKNKIPVNAHCALVLQTIRHCC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: