MonarchBase - Protein-coding gene

DPOGS200835
Transcript	DPOGS200835-TA	5313 bp
Protein	DPOGS200835-PA	1770 aa
Genomic position	DPSCF300071 - 300732-351663
RNAseq coverage	628x (Rank: top 20%)

Annotation
*Heliconius*	HMEL012642	0.0	71.78%
*Bombyx*	BGIBMGA009891-TA	8e-120	55.18%
*Drosophila*	Cht6-PC	0.0	53.71%
EBI UniRef50	UniRef50_B0WYC9	0.0	56.68%	Brain chitinase and chia n=3 Tax=Coelomata RepID=B0WYC9_CULQU
NCBI RefSeq	XP_001862401.1	0.0	56.68%	brain chitinase and chia [Culex quinquefasciatus]
NCBI nr blastp	gi\|170052833	0.0	56.68%	brain chitinase and chia [Culex quinquefasciatus]
NCBI nr blastx	gi\|157132639	0.0	38.84%	brain chitinase and chia [Aedes aegypti]

Group
Gene Ontology	GO:0006032	5.3e-143	chitin catabolic process
	GO:0004568	5.3e-143	chitinase activity
	GO:0003824	1.2e-110	catalytic activity
	GO:0043169	1.2e-110	cation binding
	GO:0005975	1.2e-110	carbohydrate metabolic process
	GO:0004553	3.1e-107	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0006030	2.2e-16	chitin metabolic process
	GO:0008061	2.2e-16	chitin binding
	GO:0005576	2.2e-16	extracellular region
KEGG pathway	dme:Dmel_CG2989	0.0
	K01183 (E3.2.1.14)	maps->	Amino sugar and nucleotide sugar metabolism
InterPro domain	[37-415] IPR011583	5.3e-143	Chitinase II
	[394-435] IPR013781	1.2e-110	Glycoside hydrolase, subgroup, catalytic core
	[38-415] IPR001223	3.1e-107	Glycoside hydrolase, family 18, catalytic domain
	[37-442] IPR017853	2.3e-102	Glycoside hydrolase, superfamily
	[510-589] IPR002557	2.2e-16	Chitin binding domain
Orthology group	MCL19578		Patchy

Nucleotide sequence:

>DPOGS200835-TA
ATGGGAAATATTGACAGAAGAAAGAACTTTATAAAAATGGAACTCGCGACATGGTTGTTTTTGTTAATCGCTGTCGTCGCACTGGCCACACCGGCTCAATCAGCGTCTCCGCGGGTGGTTTGCTACTACACAAACTGGTCTGTGTATCGTCCGGGGACCGCTAAGTTCAACCCCCAGAATATCAACCCCTACCTTTGTACTCACCTGGTCTACGCGTTCGGAGGCTTCACCAAGGACAACACCCTGAAACCTTTTGATAAATATCAGGATATAGAAAAAGGTGGATACGCCAAGTTTAACGGCCTGAAGACGTACAATAAAAACCTCAAGACGTTGCTGGCTATCGGAGGCTGGAACGAGGGATCCTCGCGTTTCTCCCCCATGGTCGCCGCCAAAGATCGGCGAAGGGAGTTCGCGAGGAATGCCATAAAGTTTTTAAGACAAAATCAGTTCGATGGATTGGATCTTGACTGGGAGTACCCCGCCTCCAGAGAGGGAGGGAAACCCAAGGATAGAGAAAACTACGTCAAGTTCGTGAAGGAACTGCGCCAGGAGTTTGAGAAGGAATCGGAAAAGACCAGCAAACCCAGGCTGCTGCTCACGATGGCTGTCCCCGCGGGCATCGAATACATCGAGAAGGGATTTGACATTAAGACTTTGACACGTTACTTGGACTGGATGAACCTTCTCACATACGACTACCACTCCGCGTTCGAGCCGGCGGTGAACCACCACGCTCCACTCTACCCTCTAGAAGAACCCAATGAATACAGCGTTGACAACGAGCTGAATATAGACTACACGATCAAATTCTATCTTGAAAATGGTGCGGACCCGGAGAAGTTGGTGCTGGGTATACCAACGTATGGTCGTTCCTATACTCTGTTCAACGCTGATGCTGTGGAAATAGGCTCACCCGCTGATGGACCCGGGGAACAAGGAGTGGCGACGAGAGAGAAGGGATACTTGGCCTATTATGAGATCTGTGAAGCGCAAATATCCAAGACAAAGAAGCGCGCCATCGCGTCGGACGAGGACTCTGAAGAAGAATCAGAAGAAGAAGATGAAGAAGAAGAAGAAGAGAAATGGACGATCATGTATCCCAACCCTAACGCTATGGGCCCTGTAGCATTCAAAGGGAACCAGTGGGTTGGTTACGATGACGTGGAGATCGTCAAAAAGAAAGCACATTATGTTGTCGAAAACGGGCTCGGAGGTATCATGTTCTGGTCTATAGACAACGATGATTTCCGCGGCGTGTGCAACGGCAAACCCTACCCGCTTATTGAAGCGGCCAAGGAGGCTTACCTCACTAAATTAGAATCTTCCAAAAACTCGGTTAGCAGTCCGAAAGAAAGTTCGAAACCATCGAGGGGTGGGAACCGCAGACGAAACCGTCCGAAGACGACACCCACCACCACCACCACCACCACTACTACCACTCCCAAACCCCCGAAAAGCAACAAGCGGAAGTCCACTAGCTCGGTGAGCACCACACCAGCCTGGAACATTATCACACCTGAACCCCCCACCACTCCCGATCCCGGATCTGACTTCAAATGTACCGACGAGGGTTTCTTCCCCCACCCGCGTGATTGTAAGAAGTATTTCTGGTGCCTGGACTCCGGACCCTCGGACCTTGGGATCGTTGCGCACGCCTTCACCTGCCCCTCCGGTCTATATTTCAACAAGGCCGCCGATTCCTGTGATTTTGCAAGAAATGTGCTCTGCAAGAAATCATCGTCTACCACAAAAGCTGTCACCAAAACCACAACAACAAAAACAACTCCAACAACCACAACAACAACGACCACGACCACCAGACGACCCATCAGACTGACTTCAAGGAGCTCTTTGCTGTTCAGGACTTCAACTACTACAACTACAACCACACCAGAACCTGAGCTCAGTGAAGAAGACGAGGAAGAAGCCGATGACGCCAGTGACGTGGAAGCTGAAGACCCCAAGGTCATCAAGGAACTTATTGACCTCATAAAGAAAGTTGGCGGCGTCGAACAGCTGGAAAAGCAGCTTAAGCTGTCGGAGTCGTCAGGATCTACGGATGGAGTCGCCACAACCACGCCGACATCGTTCAACACTAAGCTGTATCAAAAAGTACTGGAGAGAGCTCGGGGAAAAAACAAAGTTTCTAACCCACCAAATCTTAGGTTCGTCGGAAATAGCATTACTGAAAGCAGTGTGCAAAACAGCCGTCGGGGACCACAGAACGAGGGACTCGAACCAGCTGTTGATAAAGATCGCTTGTTGAGGAGAGATAGGCCACAGTATGTCACCATCAACCGGGCAAGGTCATCCACTACACCAGAATCTCTAGAAAGTGAAGAGGCCGAGGACGAATCGGAGGAAATTCAGGAGACAGTTCAGGAACAGCGATCAGAGGTACCCGCAGCAAGAGTGGCGACGACTCCTAAACCTCTCCAATACGTTAACATCAGACGGACGAGACCGACTACTGCTGCCACAGAGACTCCTGATGACTCCAGGAATGCTCTGTTTGAACGCGAATCGTCCGAGTCAGAGGAGCGTCTAACCGCTGTTGAGGATGCACAGCGCGTGGACCGCGGGGACTCCCGGCGCGACACTCCAGAATACGTCACTATAAGACGCGGCAGACCGACCACTGAGGCCACCACACTACCATATCACAGCGCTGAAGAAGAAGATAAATCGCAGGAAGTTGCTTTAGTGAAAGAGATCACGTCTCAGTCTTCGTCACCACAATATAACTCTATAGTCAGATTTCGATCTACTACACAGTCACCAGCCGAGGAGTTGACTAACCCAGCTCCGACTACAGTCCTTTCTGTTCAGATATCTTCATTATTGAATTCCCCAAGTTCCGATGAAACCGCAAGCCCTCGAACAGATAGTACGACCGCTCATGTAACCGAAGCTTCTGAACCCGAAGTAACGACGGCATCCACTACGGTTGTGACAACCACAACCACACCAGTAACGACCACGACGACTACGACGCCCTTACCTCCAAGCACGACCACACGCCGCAACTTATTAAGACGACGGGGCTCCACAACACCGACCACGCCAACCACGGCCGCGGCAGTTTCGACTACGCAGGCTGCAAAGGAACGCCGAACGTTCCCGCGTCGCACGAAAGCCACCGCGCCGCCGGAAACAACAGGAGAGGTAATAAATTCACAGACTACAACCAGCAAATATCCGAGACGAGGCGAGAACAAATTCAAGATACAAAAAACGGAAAAAGTCGAGAAATCGCGGGAAAGTAACTCGACAGAGAGTCAGCCATCTTTGAACGGCACCGCGGCGAGCAATGACAGGCCCAACCGCAACTTTGTTCGCAGACGCTTTGGAGGGGCTAACACTTCTACGACCCAATCGTCTACTATACAATTATCATCATCTGTAACAAGACGTCCGTTCCGTGTGGCTAACCGTCGCAGACTATTTTCTACCACAACCACCACAACAACAACCTCCCCCAGCACCACAGAGCTGGAGAGTGACGAATCTTTACAGGATATAGGAGACACAGATGCGATCGAAGACCCGTCTCTCCAACCTCAACCCCGAGCGAGGAAAGTCTCTAACGGCCCGCGGAGACGACCATTAGTCCAACTGAAGAACGAAAACGAAGATCAAAACTCTTCCCCCACTAACGAAGACGAGAAGACGAGACAGAGCAAGAAATACAGCGCCAGCTTCAAACAAAACCAGCTCGAGGAAATACTGAAGATACGAGCTAGCGCTGAAGAAATCGACGTAACTACGGAAGGGAGATCCACTCTTGATGATACAAGTGCTGAAACAGCAGTAGCTCTAGCAGCCCACCAGCTCCTATCAGCACCGATACCGATCATCCCCGACTACGATGACGAATCGAAACCAGCGCGGTCTTCTCAAACTATCGTAGACTATAAATTTACAAGCCCAGAGTACAACGACCTCACTAAAACACAAACGTACACAGAAGACTATCAGAGAACTCCATCTTACACTTCGACTGGACAAAGATTTGAGTCAACGACCCCTTACACTCTTCGAACCGAAGGAAATGTTCGATCGACGACAGGATCAGTTAACTCTGAGACTAATATTCCATCTGGGTTCACTACACCTGGCGCATTCACAGGCAGGTTCACGAGCTCAACTACCGGAAATACAATCAACCCGACCTTCTCTGGTATAACTCTCAGCCTCGGTTCCGAAGGCTCTGGCGAGTCGACAGCTCGTTACACCTCAAAGTTCCCCAAAGAATCGAGCCCTACAGCTTACACGATCAGCAACTATGAGACCAGAACCCTGAGGCCCGGTTTATCGACCAACATCGTCAATCCAACTTCGTTAAATTGGAGGGAATCTACAGCTAGAATATACGCGAGCCTGGATCGGAGTGTGCAACCGACATATTCGACTGAATTCACAACAAAAATTTCGAGGCCAGCAGGATTTTCACCCAATTCAGTTAAGATAGATGAAATAGAAAACGATAAGACGACAGAGAAGTATACGGGTTTCATCGAGAGGGGTCCATCTACTGCTAGATACGAGGGTTCTAGCGAAAAGATTTCGGTCCCGGTCGCCGTGGGGTACTCGTCTGGTAGCCAGGGCTTGCAAGAGCCTTCGTATTTCACCAGAGAATACTTATTGGAATCGCCGGTCACTAGAACATACGACGATGAATACCAATATTTGTCCCCGGCGACGACGCCACAACCAACAACCAAGAAACCGCTCAGAAGGAAAACTATCTATCGTAGAATATCATCTACAGCTGCACCAAGCTCACAGATCACTCAAAGCCTGTCATCAATCCGCACGTCACCCACCACATTGACGACACCCACACAACCGATAACACAGACAACGGTCAAACCACGTCGAACCAGCAGGAAACCGTTTCAGAGGATAGCGGTGAAAAAAGGTCCCCTTCAGAAACAACCAGTACAGCCAGAGATCAAGGACTCGGTTCCGAAGGAAGTCCAGAAAACTCTAGTTCTAAAGATCAATAACAACGCCGTCAAGTCGTCGAGGCCACTTTCAGACTACGATTACTACGATGACAGTCACGAAGGTGTGAAATATGAAGATGGATCCAAAGTACTTCTGCACGGAAAAGGCGACATCGAATGTTTGGACATCGGAAACTTCGCGCATCCATCGTCATGTAAGAAGTTCATATCGTGCGCGCGGATGGAGAGCGGCGCGTTAGTGGGCTGGGAGTATATTTGTCCAAAGGGACTGTCCTTCGACCCCGTAGGAGGCATTTGTAATTGGTCCGCCGGGTTAGGTTGTACTGAAAAGGACGCGTGA

Protein sequence:

>DPOGS200835-PA
MGNIDRRKNFIKMELATWLFLLIAVVALATPAQSASPRVVCYYTNWSVYRPGTAKFNPQNINPYLCTHLVYAFGGFTKDNTLKPFDKYQDIEKGGYAKFNGLKTYNKNLKTLLAIGGWNEGSSRFSPMVAAKDRRREFARNAIKFLRQNQFDGLDLDWEYPASREGGKPKDRENYVKFVKELRQEFEKESEKTSKPRLLLTMAVPAGIEYIEKGFDIKTLTRYLDWMNLLTYDYHSAFEPAVNHHAPLYPLEEPNEYSVDNELNIDYTIKFYLENGADPEKLVLGIPTYGRSYTLFNADAVEIGSPADGPGEQGVATREKGYLAYYEICEAQISKTKKRAIASDEDSEEESEEEDEEEEEEKWTIMYPNPNAMGPVAFKGNQWVGYDDVEIVKKKAHYVVENGLGGIMFWSIDNDDFRGVCNGKPYPLIEAAKEAYLTKLESSKNSVSSPKESSKPSRGGNRRRNRPKTTPTTTTTTTTTTPKPPKSNKRKSTSSVSTTPAWNIITPEPPTTPDPGSDFKCTDEGFFPHPRDCKKYFWCLDSGPSDLGIVAHAFTCPSGLYFNKAADSCDFARNVLCKKSSSTTKAVTKTTTTKTTPTTTTTTTTTTRRPIRLTSRSSLLFRTSTTTTTTTPEPELSEEDEEEADDASDVEAEDPKVIKELIDLIKKVGGVEQLEKQLKLSESSGSTDGVATTTPTSFNTKLYQKVLERARGKNKVSNPPNLRFVGNSITESSVQNSRRGPQNEGLEPAVDKDRLLRRDRPQYVTINRARSSTTPESLESEEAEDESEEIQETVQEQRSEVPAARVATTPKPLQYVNIRRTRPTTAATETPDDSRNALFERESSESEERLTAVEDAQRVDRGDSRRDTPEYVTIRRGRPTTEATTLPYHSAEEEDKSQEVALVKEITSQSSSPQYNSIVRFRSTTQSPAEELTNPAPTTVLSVQISSLLNSPSSDETASPRTDSTTAHVTEASEPEVTTASTTVVTTTTTPVTTTTTTTPLPPSTTTRRNLLRRRGSTTPTTPTTAAAVSTTQAAKERRTFPRRTKATAPPETTGEVINSQTTTSKYPRRGENKFKIQKTEKVEKSRESNSTESQPSLNGTAASNDRPNRNFVRRRFGGANTSTTQSSTIQLSSSVTRRPFRVANRRRLFSTTTTTTTTSPSTTELESDESLQDIGDTDAIEDPSLQPQPRARKVSNGPRRRPLVQLKNENEDQNSSPTNEDEKTRQSKKYSASFKQNQLEEILKIRASAEEIDVTTEGRSTLDDTSAETAVALAAHQLLSAPIPIIPDYDDESKPARSSQTIVDYKFTSPEYNDLTKTQTYTEDYQRTPSYTSTGQRFESTTPYTLRTEGNVRSTTGSVNSETNIPSGFTTPGAFTGRFTSSTTGNTINPTFSGITLSLGSEGSGESTARYTSKFPKESSPTAYTISNYETRTLRPGLSTNIVNPTSLNWRESTARIYASLDRSVQPTYSTEFTTKISRPAGFSPNSVKIDEIENDKTTEKYTGFIERGPSTARYEGSSEKISVPVAVGYSSGSQGLQEPSYFTREYLLESPVTRTYDDEYQYLSPATTPQPTTKKPLRRKTIYRRISSTAAPSSQITQSLSSIRTSPTTLTTPTQPITQTTVKPRRTSRKPFQRIAVKKGPLQKQPVQPEIKDSVPKEVQKTLVLKINNNAVKSSRPLSDYDYYDDSHEGVKYEDGSKVLLHGKGDIECLDIGNFAHPSSCKKFISCARMESGALVGWEYICPKGLSFDPVGGICNWSAGLGCTEKDA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: