MonarchBase - Protein-coding gene

DPOGS214061
Transcript	DPOGS214061-TA	1878 bp
Protein	DPOGS214061-PA	625 aa
Genomic position	DPSCF300171 - 33599-36652
RNAseq coverage	277x (Rank: top 39%)

Annotation
*Heliconius*	HMEL008272	0.0	72.56%
*Bombyx*	BGIBMGA010398-TA	3e-37	69.31%
*Drosophila*	Mal-A6-PC	1e-17	35.43%
EBI UniRef50	UniRef50_Q5TND7	2e-108	36.28%	AGAP009127-PA n=4 Tax=Culicidae RepID=Q5TND7_ANOGA
NCBI RefSeq	XP_553055.2	3e-109	36.28%	AGAP009127-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158299870	6e-108	36.28%	AGAP009127-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158299870	4e-109	36.60%	AGAP009127-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0043169	2.4e-39	cation binding
	GO:0005975	2.4e-39	carbohydrate metabolic process
	GO:0003824	2.4e-39	catalytic activity
KEGG pathway	sha:SH0072	2e-19
	K01182 (E3.2.1.10)	maps->	Starch and sucrose metabolism
InterPro domain	[28-624] IPR015902	9.9e-64	Alpha amylase
	[180-532] IPR013781	2.4e-39	Glycoside hydrolase, subgroup, catalytic core
	[179-533] IPR017853	2.2e-36	Glycoside hydrolase, superfamily
	[206-278] IPR006047	1.6e-18	Glycosyl hydrolase, family 13, catalytic domain
	[191-485] IPR006589	2.7e-08	Glycosyl hydrolase, family 13, subfamily, catalytic domain
Orthology group	MCL16308		Insect specific

Nucleotide sequence:

>DPOGS214061-TA
ATGGATAATTTAGCTGAAAATAGTACAAAAAAGGGGGGTACTGATCTTGAAACTCTAGATTATCTCCGCGGTGTGAAATCTTCAACGTGTCTACTTCTTCCCATGACTCCGAGCCCTACCCAGTTGGATTTTAAACATCCACTCTCCGAAGAAATGACTGAAGGTGCTTTTTTGACACTGAATGATGATCCAAAAATAGTTGATCTTCAATGCTCTCCTGATCCTTGTAGTGGAGATTCAAGTTCATCAGCAGATTCTAACTCGGTAGTCCAAGATCCTGTCAGTGCTCAACTTATCAATAACATAAGCATGTTGGACTATCAGACTTTGAGTAAAAATGGCGACATTATTGGACAGCCTGAAATCTGTAAACTAAACGGAAGCTTAAATGTGAGCAATAGGAAACTACCACATTTTGTTAACTGGAATTGGTGCATTATAAGGAAGGTTCTACTATGGTTTGTTGTTTCCGGACTTGTTGCATGCACTGGTACTATTATAGCTATGGTTATCAATATACCAAAAGAATGTAACCCAGATCTACCCTGGTATCAAGGTAAGGTATTTTATGAAATATTCCCTGCCAGTTTCAAGGACTCAAACAATGATGGCATGGGTGACTTGAAGGGACTTATCAAGAAGTTGGATTACATAAAAGATTTAGGCGGCTCATCTATCCGTTTGAATTATATATTTGAGGCGCAAAATTATCCTGAAAATTATTATAACACTACATCCCTCCTACAAATTGACCGCAGTTTAGGAGTTCTGAAGGACTTTCAAGAGCTGGTGACCGAGGCCCATAAAAGAAACATGGGAGTTATCTTGGATATACCAGTTTTGAGCATGGCTGAAACTCTTAATAAGTATGATGAAAATGATACCTTTGTATTTTCAATAGACCCTCAAGAAAGTAATTTTGACGCAACGTCTGCAGCGATTGCATATTGGTCTCGTGCACAAAATGTCGACGGATTTTATTTGAAGAATCTGGAGAAATTTGTTGATGATGTTAATTTCGGAAAATCGCTTCAGGTTTGGAAACAAATATTGGGTTACGGGAAAATATTTATAGCCAGTGAAGAAGCGTTAAATATGGCAAAAGATACAAGTCTAACAGTGCTTTTGAGTAGGATTGACCTTATTGATGTTCATTTGGATTTACAAAAAGGTATTGATGGTCTTAAGAAACATATTGAAGGCTTAGTACCCGGTATCCTATGGGACAAGCCTCATTATCCTTGGATTCAATGGAACATTGGAAATGTTAATAGTGAAAGGATATCTAGTAAACACCAAAATAACACATTAGTTTTAACTGCACTTGAGTTGGTTCTCCCGGGCACTGTCAGTATTTTTTACGGTGATGAAGTAAGTCTTGGAGGTCTTTCAGAAAATGAAATGGAAGGAGATTTTCATGAACATGAGCACATTCACAACTTAATACCGATGTCTTTCAATGGCGAAGACAAAGTTGATAATAACAGTCCCGCGTCTATCTTGCCTTGGAATTCTAAATCCGTATTAGAACCGCAGTATCAAAACTTGAACGTTGTGAGATCTTTGATACGTTTAAGATCAACCACACCAACCATATACTTAAAATCAATCTACAAAGAGGGTAGGATACAAAGAAGTATGGAAATACGTGAAACTGAAGGTAACCTCATTGTTATTGAGCGTTGGTTTCCACGCAGAAATACATGTGTATTCGTAGGCAATCTGGGTAACAAGCCGATTACTACTGATTTGTCATCCATGTTCTACGGTGGAATTGTAATAGGAAGCACAAATATGTCCTTAGTGGGTGAAGCTTTGTATTTGGAAAAAGTCACGTTTGAGCCCTTTTCAGCTATTATATTAAAATTGGAGAAATAG

Protein sequence:

>DPOGS214061-PA
MDNLAENSTKKGGTDLETLDYLRGVKSSTCLLLPMTPSPTQLDFKHPLSEEMTEGAFLTLNDDPKIVDLQCSPDPCSGDSSSSADSNSVVQDPVSAQLINNISMLDYQTLSKNGDIIGQPEICKLNGSLNVSNRKLPHFVNWNWCIIRKVLLWFVVSGLVACTGTIIAMVINIPKECNPDLPWYQGKVFYEIFPASFKDSNNDGMGDLKGLIKKLDYIKDLGGSSIRLNYIFEAQNYPENYYNTTSLLQIDRSLGVLKDFQELVTEAHKRNMGVILDIPVLSMAETLNKYDENDTFVFSIDPQESNFDATSAAIAYWSRAQNVDGFYLKNLEKFVDDVNFGKSLQVWKQILGYGKIFIASEEALNMAKDTSLTVLLSRIDLIDVHLDLQKGIDGLKKHIEGLVPGILWDKPHYPWIQWNIGNVNSERISSKHQNNTLVLTALELVLPGTVSIFYGDEVSLGGLSENEMEGDFHEHEHIHNLIPMSFNGEDKVDNNSPASILPWNSKSVLEPQYQNLNVVRSLIRLRSTTPTIYLKSIYKEGRIQRSMEIRETEGNLIVIERWFPRRNTCVFVGNLGNKPITTDLSSMFYGGIVIGSTNMSLVGEALYLEKVTFEPFSAIILKLEK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: