MonarchBase - Protein-coding gene

DPOGS214167
Transcript	DPOGS214167-TA	1617 bp
Protein	DPOGS214167-PA	538 aa
Genomic position	DPSCF300014 - 259321-265648
RNAseq coverage	10805x (Rank: top 1%)

Annotation
*Heliconius*	HMEL006811	85.66%
*Bombyx*	BGIBMGA006213-TA	86.69%
*Drosophila*	serp-PB	79.70%
EBI UniRef50	UniRef50_Q86P23	79.70%	RE22242p n=16 Tax=Arthropoda RepID=Q86P23_DROME
NCBI RefSeq	XP_320597.3	84.66%	AGAP011936-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|283826817	86.74%	chitin deacetylase 1 [Helicoverpa armigera]
NCBI nr blastx	gi\|283826817	86.74%	chitin deacetylase 1 [Helicoverpa armigera]

Group
Gene Ontology	GO:0005975	1.4e-36	carbohydrate metabolic process
	GO:0003824	1.4e-36	catalytic activity
	GO:0016810	3e-15	hydrolase activity, acting on carbon-nitrogen (but not peptide) bonds
	GO:0005515	7.4e-10	protein binding
	GO:0008061	2.5e-08	chitin binding
	GO:0006030	2.5e-08	chitin metabolic process
	GO:0005576	2.5e-08	extracellular region
KEGG pathway
InterPro domain	[167-476] IPR011330	1.4e-36	Glycoside hydrolase/deacetylase, beta/alpha-barrel
	[397-471] IPR002509	3e-15	Polysaccharide deacetylase
	[112-155] IPR002172	7.4e-10	Low-density lipoprotein (LDL) receptor class A repeat
	[60-101] IPR002557	2.5e-08	Chitin binding domain
Orthology group	MCL10267		Insect specific

Nucleotide sequence:

>DPOGS214167-TA
ATGGCGCGCTACGCCCGTGTCGCTCCTCTGCTCGCGTGTTTCTTTTTCGCCTGCGCGGCCGCTAATAACGGTGCCCACCGTTGGCGTCGTCAGGCAGATGCCAAGAGTGAGGACCAGAATAGTGAGATATGCAAGGACAAGGACGCTAGCGAATGGTTCCGGCTGGAGATCGGCGAGGGCGACGCCTGCCGCAGCGTCATCCAGTGCACCGCCTCGGGCATTGAAGGTATTAAGTGCCCACCCGGTTTATATTTCGATATTGAAAAACAAACCTGTGACTGGAAAGATGCCGTAAGAAACTGTAAAGTAAAGAGCAAAGAACGCAAAGTAAAACCTCTTCTTTATACTGAGGAACCACTTTGCCAAGACGGCCTACTTGCCTGTGGGGATGGCATTTGTATAGAACATGGCCTTTTCTGTAATGGCGAATTAGATTGTAACGATGGATCAGACGAAAACTCTTGCGACATCAACAATGACCCCAACAGTGCTCCTCCTTGCGACACATCTCAGTGTACATCACCTGACTGTTTCTGCTCTGAAGACGGAACCGTAATCCCCGGTGATCTGCCCGTAAAGAACGTACCTCAAATGATAACCATTACTTTTGATGACGCTATTAACAACAACAACATTGATTTGTACAAAGAAATTTTCAATGGCAAACGTAAAAATCCTAACGGTTGCGACATTAAGGCGACATACTTTATTTCACACAAATATACTAACTATTCAGCTGTTCAGGAAACTCACAGAAAGGGTCACGAAATCGCCGTACACTCTATCACCCACAATGATGATGAACGCTTCTGGAGCAATGCTAGCGTTGATGATTGGGGTAAGGAAATGGCTGGTATGAGAGTTATTATAGAAAAGTTTGCAAACATAACCGACAACAGCGTAGTTGGAGTTCGTGCACCTTACCTACGAGTTGGAGGCAACCGTCAATTCACCATGATGGAGGAACAGGCCTTCTTATACGACAGCACCATCACCGCTCCTTTATCCAATCCTCCTCTATGGCCTTACACTTTGTACTACCGCATGCCCCATCGCTGCCACGGTAATTTACAAAATTGTCCCACTAGAAGTCACGCTGTTTGGGAAATGGTAATGAATGAGCTCGACCGTCGTGAAGACCCAAGTAATGACGAATACTTACCAGGATGTGCTATGGTTGATTCTTGCTCGAACATTCTTAGTGGTGATCAATTTTACAACTTCCTTAACCATAACTTCGACCGGCATTACGATCAAAACAGAGCTCCATTAGGTCTTTACTTCCATGCTGCTTGGTTGAAAAATAACCCTGAATTCTTGGAAGCATTTTTATACTGGATTGACGAAATCCTTCAGACTCACGATGATGTATACTTTGTAACAATGACTCAAGTAATCCAATGGATTCAAAACCCACGTTCTGTTTCTGAAGCAAAGAACTTCGACCCATGGCTAGAGAAGTGTTCCGTAGAAGGTATCCCAGCATGCTGGGTGCCTCACTCTTGCAAACTTAACTCTAAGGAACTCCAAGGTGAGACCATTAATCTTCAGACATGTCTCAGATGCCCAGCCAATTACCCATGGCTCAATGATCCAACGGGTGAAGGTCATTATTAA

Protein sequence:

>DPOGS214167-PA
MARYARVAPLLACFFFACAAANNGAHRWRRQADAKSEDQNSEICKDKDASEWFRLEIGEGDACRSVIQCTASGIEGIKCPPGLYFDIEKQTCDWKDAVRNCKVKSKERKVKPLLYTEEPLCQDGLLACGDGICIEHGLFCNGELDCNDGSDENSCDINNDPNSAPPCDTSQCTSPDCFCSEDGTVIPGDLPVKNVPQMITITFDDAINNNNIDLYKEIFNGKRKNPNGCDIKATYFISHKYTNYSAVQETHRKGHEIAVHSITHNDDERFWSNASVDDWGKEMAGMRVIIEKFANITDNSVVGVRAPYLRVGGNRQFTMMEEQAFLYDSTITAPLSNPPLWPYTLYYRMPHRCHGNLQNCPTRSHAVWEMVMNELDRREDPSNDEYLPGCAMVDSCSNILSGDQFYNFLNHNFDRHYDQNRAPLGLYFHAAWLKNNPEFLEAFLYWIDEILQTHDDVYFVTMTQVIQWIQNPRSVSEAKNFDPWLEKCSVEGIPACWVPHSCKLNSKELQGETINLQTCLRCPANYPWLNDPTGEGHY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: