MonarchBase - Protein-coding gene

DPOGS211395
Transcript	DPOGS211395-TA	4755 bp
Protein	DPOGS211395-PA	187 aa
Genomic position	DPSCF300115 - 491908-507733
RNAseq coverage	1030x (Rank: top 12%)

Annotation
*Heliconius*	HMEL017092	4e-45	48.85%
*Bombyx*	BGIBMGA004683-TA	3e-45	52.60%
*Drosophila*	alpha-Est2-PA	3e-30	42.77%
EBI UniRef50	UniRef50_D5G3F4	1e-42	47.49%	Carboxyl/choline esterase CCE017a n=4 Tax=Obtectomera RepID=D5G3F4_HELAM
NCBI RefSeq	NP_001165227.1	4e-39	51.28%	alpha-esterase 48 isoform s1 [Bombyx mori]
NCBI nr blastp	gi\|338832739	1e-47	57.59%	carboxylesterase [Melitaea cinxia]
NCBI nr blastx	gi\|189236467	0.0	49.61%	PREDICTED: similar to Sec24B protein, putative [Tribolium castaneum]

Group
KEGG pathway	api:100163376	9e-29
	K03927 (PNBA)	maps->	Drug metabolism - other enzymes
InterPro domain	[26-187] IPR002018	7.5e-49	Carboxylesterase, type B
Orthology group

Nucleotide sequence:

>DPOGS211395-TA
ATGAATTATTATAATAAGTATATTAATACAGGGCTAAAAATAATTGACTGTTTAAGTCTTAACACGAGAAATCTCGCTACTTACTCAAGTAACATGCATTCACCCATTTTGGATCTGAAGGAAGGAAAGGTCCGGGGAAGAATAAGAAAACTTGATAATGGCAAGGAGTTTTATAGCTTCAAAGGAATCCCATACGCACAGCCACCAGTGGGAAGCCTTCGATTCAAGGTAGTATATGGATCTGATGAATTAGTGAAAGCCCCGCTTCCTCCCAAACCCTGGTCGCATGTCCTAGATGCTGCAGAACACGGAGCTACTTGCCCACAATGGGATATGGTGGCTTTGAAATTTAGAAAAGGGGAAGAGAACTGTTTATTCATTAATGTTTACACTCCCACCTTACAAACTGACTCCAAATTACCTGTGATGGTGTATATCCACGAGGGAGGCTTTCAATCAGGATCTGGAAATGAAAGAATGTATGGCCCAAATTTTCTGATAAGGCATGATGTTATTCTTGTTTTGTTTAATTGTAGATTGGATCTATTGGGATTTTTGTCTTGACAGCCCTGAAGTTCCTGGCAACGCAGGTATGAAAGATATGGTAGCAGTCCTGAGATGGGTTCAAAATAACACTAAACAGATAATTTAATCATTATTGGAGTAAGTGGTGGAGCAGTTTCCGTGACTTGTCTTATGATATCTCCGATGGCTCAAGGCTTGTTTCATAAAGCTATTGCACAAAGTGGATCATGTCTTGCCGATTATGCAATAGATGTTAATCCTGTACAGAGAGCTTTTCGAGTTGGAAAGGTCCTTGGGAAGGATACGACAGATCCTTATGAGTTACTCACATATTTACAAAGCTTGCCTGCAGAAAAACTTCTGTATTTGACGTTAAAAACTGCAACTAAGAGAGAAAAACTTGGTGGTCTACCCATTGTTTTTACTCCCGTCGTAGAAAAGAGGTTTGGTGATAATGAAGTATTTTTGCCGGAAGACCCGTTAGATATAATGTTATCTGGAAAATATAATCCTGTTCCTCTTATAACCGGATATACTTCATCAGAAGGAGCAGTAACATTAAACGACGTGATACCAAAGCTGGACTTTATCAATAATTGTCCGTCCCTGTTGGTGCCTAAAGACATTTATATAAAAATTACAGAAGACAAGGCTTTGGAATTTGGTGAAAGAATCAAGCAATTCTATTGGGGTGACAGGGATTTAACAGCAGATGATGTTGAAATAATTGCTGATTTGCAGTCAGATATTCATTTTGTGATGGCAACATACAGGACAGCAGATTATTTTTCAAAATACTATTGCGAAGCCATGTCTCACATACCGAATCCGTATAACAATGCTCCCGGGACCTACAACTCAAATCCTGCTATGTTTCAACAATTCAATCAAACGCTGACGAGCCAACTGCCTCCGAAACAAGACACGAAACCAATCATTCCTACAAGCATTCAAGGGTTCAACCACCAAACGAATCCATATAATGACGAAAGTGCCAGCAGTTCGCCAGCTTTTAATAATACTGGAATGATGCCCCTTCCAACAAGCTTACAGTCATCCCCCATGAGGCCCGTTAAGCCAGTGCCAAGTCAACAGCAGGCTCAAAGCATTCAGAACATTCCACTGAGCTCATCCAGCCCACATTCAATGACCAACACTAACCAATCAAACTCTCCATATCATCCTCAATACCATCAAATCAATAATAATGCCCCACCTCTAATTCCTTCTAGTCTAAACAACCAGCCAAACATGAATGGTCCAATGAGTGCCCCAAATGCACTCCCTAATCAATATCCAGCAGCATCCAATTCATTCAGTCCAGCTCCTATGAATCGCCCTCCGACAATTAATACTTTCAGTACAAATCAAAGTTATAGAACAAATCACACATCCCAAACTTCATCTCCTCATGCTGTAAACCATCAGCCTAACGTTCCATTTAATGGACCATCTGGTCCCAGAAATAGTCCTCTAACTACAGGACAGCAAGTTAATTCCCTCACATCTAGTATGGCAAAGTTACCGCCTATTTCTGGACCACCTGGGCCACCGAGAAGTCAAAACAGTTTAATTAATGGACCGATGCAAGGCCAAGCTCCGCTTAATAACATGGGACCCCCAAAAAATATGTCCCATGGGCCGTCTTCTCTACCCATAGGTCAACCGGGAGTCCCATTACGACCTACGGGACAAACAAACCAACAGCCACCCCTTATTAATAGTTCCCAACCAAACTTCATCACTGGACCACCTAGCGGCCCTCAAAGTATGCCAATCGGGCCAGGACAAGCTCCTCCTATGGTACAACAGCCTAGACCTGGGCCAGCAAGCGGCCCATCTTCCATGACGAGTAGATATCCACAGATGCCTTACACGAATCTTAGCCCACAGCAACAAATGCAAGTCCAACAGAACATTGCTAAACAGTTTCCCACACATAACTTGTACGACGTGAACCAGCAAGGAGGACAGCTCAGTGTGACTAAGCAGGGCTTCAACCAGCTTTGGGGTCATCAGATGGTGGACTTGATGCAGTGTAAGCACATTCTGCCAGAATATCCCGAAGATCCACCGGAAATAAGGCTCGGACAACAGTTTGCTGAGGCCAATAACTGCAGCCCAGAAATATTCCGTTGCACTGTCAACCGTATCCCGGAGACGAATTCTTTATTGCAGAAGTCTAGACTGCCTCTCGGTATCCTGATCCATCCGTTCAAAGACCTCAATCATCTCCCCGTAATACAATGTACTACTATAGTCCGCTGCCGGGCGTGTCGCACCTACATCAACCCCTTCGTTCACTTCGTCGACTCCAAGAGATGGAAATGCAACCTTTGCTACCGGGTCAATGAATTGCCCGAGGAGTTCCAGTATGACCCCGTGAGCAAGTCCTACGGCGACCCGTCCCGGAGGCCGGAGGTGAAGTCGGCGACGATAGAGTTCATCGCGCCCAGCGAGTACATGCTGCGACCGCCGCAGCCGGCCGTCTACCTGTTCCTGTTCGACGTCTCGCAGAACGCCAGGGAGTCGGGATACCTGCAGGTGGTGTGTGATACTCTGAAGTCTAACCTGGAACAGCTGCCGGGGGACGCCCGCACTCAAGTCGGCTTCATCTGTTACGACGAGCACATTCACTACTACCTCATGAGTGACGGACTCTCCAAACCAAGGGAAATGACCGTTTTGGACGTTGAAGAGGTGTTCCTCCCGTCGCCGGAGTCGCTGCTGGTGAACCTACTGGAGCATCGTGCGATCGTCGTGGAGCTGCTGTCGGTGCTGCCCCGCCGGTACAGCTCGCCCACCGCCCCCGCCAGCGCCCTCGGCCCGGCGCTCCAGGCCGCTTACAAGCTCATGGCCCCGACCGGAGGCAGGGTGACCGTGTTCCAAACGTGTCTGCCTAACGTGGGCCCCGGCGCATTAGAGTCCAGGGAGGACCCCAACGCCCGCTCGGCCCAGGACGTGCGTCACCTGTCCCCGGCCACGGACTTCTACAAGCGGCTGGCGTTAGACTGTTCGGGCGTGCAGGTGGCCGTGGATCTGTTCCTGCTCAGCTCGCAGTACTGCGACCTCGCTACCATCAGCGGTATGAGTAAGTTCAGCGCGGGTACGGTGCACCACATCCCGCTGTTCCGCGCCAGTCGGCAATGGCAGGCGGAGCTGCTGACGCGCATGCTGTGTCGCTACCTCACCCGCAAGATAGGCTTCGAGGCCGTCATGAGGGTCCGCTGCACGAGAGGGATATCCATCCACACGTTCCACGGCAACTTCTTCGTGCGCTCCACGGACCTGTTGTCTCTGGCCAACGTGTCTCCGGACGCTGGGTTCGCTATGCAGCTCAGCATCGACGAGTCGCTGACGGAGCTGCAGCACGTGTGCTTCCAGGCCGCTCTGCTGTACACCAGCAGCAAGGGTGAGCGTCGTATCCGCGTGCACACGCTGTCGCTCCCGGTGGCCAGTACGCTGCCGGATGTGTTGCACTCCGCGGACCAGCACGCCGTCATCGGTCTACTCGCTAAGATGGCCGTGGACCGCTGCGTGTCGGCGTCCATGTCGGAAGCGAAGGAGGCTCTGATGAACGCCGCAGTGGATATGTTGAGCGCCCACCGCCTCGCCCACAGTTTGCCCACGGGTGACCAGAGCGCCTCCCTGCACGCGCCCTGGTGCGAGTCTGATGACGGCGAACTGATACTGGCGCTGCTTAAACGGAAAGCATTCCGCACGGGCACGTCGACTCGCCTGGACGAGCGCGTCTCCGACATGCTGTTCCTGAAGACCGCGCCGCTGGCGAGTCTCCTGCGGGCCGTGCACCCCGACCTGTACGAGCTGCACACGCTCTCCAGCCAGCACCAGCCGCCGCGGCTCCAGCTGTCCGCCGAGAGACTGAGCCTGGACGGCGCGTACCTCCTGGACGAGGGGGAGACCATGGTGATATACGTGTGTCGGGGGGTCAGCGCCGCCTGGCTGTCCGAGGCGCTGGGGGTCAACTCGTTCGCGGAGCTGCCGGCCGAGGGTCGCGACCTGCCGCACATAGACACCGGCCTCAACGACCTGCTGCACGGGTTCATCGACCGCCTCAACGAGGACCGCCCTTACGCCGCCGGCCTGCTACTGCTCAGAGACGACTCGCCGTCCCGCCAACTGTTCACGGAGCGCCTGGTGGAGGACCGCGTGGAATCCGCCTTCTCCTACTACGAGTTCCTGCAACACCTCAAGAGCCAAGTGAAATGA

Protein sequence:

>DPOGS211395-PA
MNYYNKYINTGLKIIDCLSLNTRNLATYSSNMHSPILDLKEGKVRGRIRKLDNGKEFYSFKGIPYAQPPVGSLRFKVVYGSDELVKAPLPPKPWSHVLDAAEHGATCPQWDMVALKFRKGEENCLFINVYTPTLQTDSKLPVMVYIHEGGFQSGSGNERMYGPNFLIRHDVILVLFNCRLDLLGFLS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: