MonarchBase - Protein-coding gene

DPOGS201894
Transcript	DPOGS201894-TA	1617 bp
Protein	DPOGS201894-PA	538 aa
Genomic position	DPSCF300191 + 431666-434217
RNAseq coverage	804x (Rank: top 16%)

Annotation
*Heliconius*	HMEL014743	2e-92	62.55%
*Bombyx*	BGIBMGA006067-TA	4e-172	54.92%
*Drosophila*	Mal-A4-PA	1e-47	26.08%
EBI UniRef50	UniRef50_O16098	1e-44	28.19%	Maltase 1 n=30 Tax=cellular organisms RepID=MAL1_DROVI
NCBI RefSeq	XP_002049664.1	3e-51	29.16%	GJ21717 [Drosophila virilis]
NCBI nr blastp	gi\|195430356	6e-49	27.96%	GK21507 [Drosophila willistoni]
NCBI nr blastx	gi\|338974500	4e-40	27.04%	maltodextrin glucosidase [Bradyrhizobiaceae bacterium SG-6C]

Group
Gene Ontology	GO:0043169	6.2e-42	cation binding
	GO:0005975	6.2e-42	carbohydrate metabolic process
	GO:0003824	6.2e-42	catalytic activity
KEGG pathway	dme:Dmel_CG8693	8e-46
	K01187 (E3.2.1.20, malZ)	maps->	Starch and sucrose metabolism
			Galactose metabolism
InterPro domain	[181-420] IPR013781	6.2e-42	Glycoside hydrolase, subgroup, catalytic core
	[19-464] IPR015902	1.6e-40	Alpha amylase
	[18-420] IPR017853	2.3e-38	Glycoside hydrolase, superfamily
	[42-346] IPR006047	1.2e-20	Glycosyl hydrolase, family 13, catalytic domain
	[27-370] IPR006589	2.5e-07	Glycosyl hydrolase, family 13, subfamily, catalytic domain
Orthology group	MCL25201		Lepidoptera specific

Nucleotide sequence:

>DPOGS201894-TA
ATGTTGGTGGTAGCGTTAGTTTTCTTTTCACTGGGAGCCTCGCTCGCCGACCCCTGGTGGAGCAAGGCTATCTACTACAGATTACTAGTGGACTCATTTAAGGACCTCGACGGAAACGGCCTTGGAGATTTAGAAGGAGCTACAAAACAGCTAAGTTACGTACGCGCTATCGGAGCTGATGCTGTAATCTTATCTCCCATCTCCGAGAAAAGCTTGGACTGTAATTCACCCGGGACCATCGATTTTGTTAACATTGAAACAAGATATGGTACTATCGATAACTTTAATGCACTGCTGGCTAAAGCAAATAAATTAGAGCTCAAAGTTTTGATAACATTACAACTACAAACTATAAGTTCAAACTCAATTTTATTTAATTCAAGCGCCGAAAGAAAGACTGGCTTTGAAGATGGAATTGTATGGATCAGTGGAGCAGCTGAGGAAGCACCGGCCAGTCGAGCGTTTAGAAACTGGACGTGGCATGAATACAGAGGAGCTTATTATGCAACTGTTAACAAAGAGGCGATATTAAATATTTGCTCTGAAAGTGTCGTTGCGATGCTATCTGAAGCTATGTGCGAGTGGTTGAAGAGGGGAGCCGCTGGAGTTCTGCTTAATCCTGACTTTTTAATGAATTACGAATGTGGTCAAAAACTTGTCAAAAGGATAGCGAAAGAGGCCGTGGCCTGCTCGGGGAATCAACATTATGATCTGCCGGTTATTTTAGTAGAATCCTCTCTGGAGGCGGAAGTCGCTACTAAATATTACGCTGAGGGCGGTGTAGGTGCCAATAGCGTAATAAGTTATGCCTTTTCTACAAAAGCCAAACGGCCGGCTGTTGGCTTGGCGCTCGACCTGCACGCAGCGCTGTTGTATTCACCACAAGATACGACCCCCGCTTGGCTCACCAGCACATCCGACGGAAACCGGATAGCAACTCGTTATGGCAGCGAAATGGTTGATGCTATAATACTATTAACTTTGATTCTTCCTGGCTCTGTTATCATTCAACAAGGAGATGAGCTAGGAGTTGCAGACACCATACTTGATTGGACAAATACTACCAATTGTTGGCCAATGAATTACATACCTTCGGCTGCTCCTTTTCCATGGGATAATAGCCCTAAAGCTAATTTTACTACGGGAGAACCCTGGATGCCGCTGCCTCCAAATTACAGGTATAAGAACGCAAAATCTGAATATGGTAATGAATTGAGCCATGTTAGTGTAATGAAGATAGCATCTGCAATGAGAAAATCTGCAGCTATTGGGCCACACGTTGAGATAAAAGTATTAAAAGATGCGCTAGCGATATTGCGGTGGGGTGGGGGCGGATCACTTTTAGTCGTATCTAATCTTGGTACCGGGTCGACTGAGGCTCAGCTTTCCGAGATTCCTGGACTACCAGCTGAAATGACGGTAGCATCAAGTTCTGGAGGATCTAGTTTATCTCTCGGCAACCATATCACAGTAGGAAAGACGTTAAAATTGTCGCATGGGGAAACCGTGCTCCTGGTTGGACCTCCGAGACACTGTGGGGGACCGGGACCAGTGGATAAAATTACGAGCAAACTCTCTGAGGGATGGCAGAAAATCAACAAGTACTTCAACCTCTGA

Protein sequence:

>DPOGS201894-PA
MLVVALVFFSLGASLADPWWSKAIYYRLLVDSFKDLDGNGLGDLEGATKQLSYVRAIGADAVILSPISEKSLDCNSPGTIDFVNIETRYGTIDNFNALLAKANKLELKVLITLQLQTISSNSILFNSSAERKTGFEDGIVWISGAAEEAPASRAFRNWTWHEYRGAYYATVNKEAILNICSESVVAMLSEAMCEWLKRGAAGVLLNPDFLMNYECGQKLVKRIAKEAVACSGNQHYDLPVILVESSLEAEVATKYYAEGGVGANSVISYAFSTKAKRPAVGLALDLHAALLYSPQDTTPAWLTSTSDGNRIATRYGSEMVDAIILLTLILPGSVIIQQGDELGVADTILDWTNTTNCWPMNYIPSAAPFPWDNSPKANFTTGEPWMPLPPNYRYKNAKSEYGNELSHVSVMKIASAMRKSAAIGPHVEIKVLKDALAILRWGGGGSLLVVSNLGTGSTEAQLSEIPGLPAEMTVASSSGGSSLSLGNHITVGKTLKLSHGETVLLVGPPRHCGGPGPVDKITSKLSEGWQKINKYFNL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: