MonarchBase - Protein-coding gene

DPOGS200442
Transcript	DPOGS200442-TA	1185 bp
Protein	DPOGS200442-PA	394 aa
Genomic position	DPSCF300236 + 456030-458555
RNAseq coverage	550x (Rank: top 23%)

Annotation
*Heliconius*	HMEL011599	0.0	81.47%
*Bombyx*	BGIBMGA008900-TA	0.0	76.14%
*Drosophila*	CG8460-PA	1e-82	40.41%
EBI UniRef50	UniRef50_E0VQE2	7e-92	46.21%	Spore germination protein yaaH, putative n=1 Tax=Pediculus humanus corporis RepID=E0VQE2_PEDHC
NCBI RefSeq	XP_001869617.1	3e-95	45.25%	chitinase domain-containing protein 1 [Culex quinquefasciatus]
NCBI nr blastp	gi\|170070544	5e-94	45.25%	chitinase domain-containing protein 1 [Culex quinquefasciatus]
NCBI nr blastx	gi\|170070544	4e-93	45.25%	chitinase domain-containing protein 1 [Culex quinquefasciatus]

Group
Gene Ontology	GO:0043169	2.5e-20	cation binding
	GO:0005975	2.5e-20	carbohydrate metabolic process
	GO:0003824	2.5e-20	catalytic activity
	GO:0004553	8.4e-17	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0006032	2.2e-06	chitin catabolic process
	GO:0004568	2.2e-06	chitinase activity
KEGG pathway
InterPro domain	[77-393] IPR017853	6.5e-32	Glycoside hydrolase, superfamily
	[366-385] IPR013781	2.5e-20	Glycoside hydrolase, subgroup, catalytic core
	[73-385] IPR001223	8.4e-17	Glycoside hydrolase, family 18, catalytic domain
	[77-386] IPR011583	2.2e-06	Chitinase II
Orthology group	MCL12115		Single-copy universal gene

Nucleotide sequence:

>DPOGS200442-TA
ATGAAATATTTGACTATAGTTTTACAAGTCCTGTGTATTTCAAGTTTATCCCTTGCAACATTGTCACCTCCCTCCGATAAAAAATCACAAAAGGAAGTAAAACCGCAAGAAGGTTCTAGGAAAAATAATGTTTTGGATCGAAAATTGGTAGCTGAGACTCCGTACGTGAAAGATATACTTAAATATCATGCAACTTATCATCAGGACGTACATGTAAAAAATTTTAATAATCTGGTGTTAGGCTTTGTTACACCGTGGAACAATAAAGGTTATGATGTAGCCAAGAGATGGGCGTCAAAATTTAATTACATTTCCCCTGTATGGCTGCAAGTTAAAAGGCAAAGCTCCAACATATACATCATTTCTGGTCTTCACGACGTGGACAATGCATGGATGAAGGCGGTCAAACAGAAAGGAACTGACACTGGCTTAAGAATTGTACCGAGATTATTGTTTGAAAACTGGCAGCCATCAGATTTGAAGGCGTTTTTCATTGAACCATCATCATACAGTGAACAGAAAGCGTTGATTGAAGAAATCAAGAAAGTCTGTAAGCAATGGGGTTTTGACGGGATCGTGTTAGAAATGCTTTCTCAAATCGGAAAGTACATCGACAAATCAGTGAAGTTTATACAACACTTCGGTCTTGAGATGAGCGAGAACGGCTACCACCTTATTCTCGTGTATCCACCATTTAGAGGTTATCCAAGCGATGACTTCTTTGTTCAAGCCTTCAATGAAATCCATCCTTATGTAGATGCTGTCTCCGTCATGACATATGATTTTTCAAATCCTCAAAAACCGGGTCCGAACGCACCATTCTATTGGCTGAGATTGTGCATTGAAAAACTAATAGGCGATGATGAAAATCCGACAAAGAGATCAAAAATATTACTCGGTTTAAATTTCTATGGTAACTCGTATACCGCGAACGGTGGCGGTCCCATTGTTGGCACGGAGTATATTGAATTGTTGAAAAATGCGAAACCGAACCAGCTTATATCTTACAACAATAATACTGCTGAGAATTATCTTGAAGTCAGGACATTACAAGGTACAAAGAAGATTTTCTTCCCCACATTGTACTCAATCCATAAAAGACTGGAGCTCGCTAGGGAATACCGAACTGGTGTTGCCATTTGGGAACTCGGTCAGGGATTGGACTATTTCTATGACCTATTTTAA

Protein sequence:

>DPOGS200442-PA
MKYLTIVLQVLCISSLSLATLSPPSDKKSQKEVKPQEGSRKNNVLDRKLVAETPYVKDILKYHATYHQDVHVKNFNNLVLGFVTPWNNKGYDVAKRWASKFNYISPVWLQVKRQSSNIYIISGLHDVDNAWMKAVKQKGTDTGLRIVPRLLFENWQPSDLKAFFIEPSSYSEQKALIEEIKKVCKQWGFDGIVLEMLSQIGKYIDKSVKFIQHFGLEMSENGYHLILVYPPFRGYPSDDFFVQAFNEIHPYVDAVSVMTYDFSNPQKPGPNAPFYWLRLCIEKLIGDDENPTKRSKILLGLNFYGNSYTANGGGPIVGTEYIELLKNAKPNQLISYNNNTAENYLEVRTLQGTKKIFFPTLYSIHKRLELAREYRTGVAIWELGQGLDYFYDLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: