MonarchBase - Protein-coding gene

DPOGS210548
Transcript	DPOGS210548-TA	2175 bp
Protein	DPOGS210548-PA	724 aa
Genomic position	DPSCF300304 - 11003-17544
RNAseq coverage	138x (Rank: top 55%)

Annotation
*Heliconius*	HMEL003474	0.0	71.28%
*Bombyx*	BGIBMGA013468-TA	0.0	69.05%
*Drosophila*	Cha-PA	4e-144	47.35%
EBI UniRef50	UniRef50_P07668	7e-142	47.35%	Choline O-acetyltransferase n=19 Tax=Neoptera RepID=CLAT_DROME
NCBI RefSeq	XP_975503.1	4e-154	51.15%	PREDICTED: similar to choline o-acyltransferase [Tribolium castaneum]
NCBI nr blastp	gi\|91077002	8e-153	51.15%	PREDICTED: similar to choline o-acyltransferase [Tribolium castaneum]
NCBI nr blastx	gi\|91077002	6e-149	51.07%	PREDICTED: similar to choline o-acyltransferase [Tribolium castaneum]

Group
Gene Ontology	GO:0008415	2.4e-221	acyltransferase activity
KEGG pathway	tca:664403	1e-153
	K00623 (CHAT)	maps->	Glycerophospholipid metabolism
InterPro domain	[175-723] IPR000542	2.4e-221	Acyltransferase ChoActase/COT/CPT
Orthology group	MCL12999		Single-copy universal gene

Nucleotide sequence:

>DPOGS210548-TA
ATGAACACCGACGACTTCTTCTCCCTTAGGAGACCCGCCTCGAACTATAATTATCATGAGAATCAATACCAACGGAACTCTAAAGCTCAATTGGAAAAACCAGTCACCGAAAAGCCACGACAATATGTTATCCGTCCGATGTTTGATCACATCGACGGTTTTAATTTAAGAGATAAGTACTTCAGACCTAAACCGCTGTTAGTAAATAATGATGATTTCTATAGAGAAAAATTTCAGCTGCACCATCAGAGCGACGCTATAACATTGAGACAAAAGATTAACTACGTCAGAGATATGATGCCATCTCCTGTACCCAAGGACAATGATAGACATGTCATCGAAAGGCCCTCTTATCTACCTCCAAAAACAAAACCAAAATTTCTAAGAGACCGTATAGATTCTATAAGAAATTATCTATTTAATACGGATGTTATTGAAAAAACACAATTTCCCATTAGTAAAGTCCTCAGAGATTCCACGGACTTCATGCGTTATGAAGATCCATTGTATTATTATAGAAAAAGCGAGTGGTGGTTGGATGATATGTATCTCAAGATCCGTCTCCCGGTTCCTATTAACTCCAACCCAGGAATGGTGTTTCCTCGGAAGCAGTTCGCCAAAATAGATGAGGTCGCTGATCTAGCCGCGCTCTATGTGGACGATCTCTTGGACTATAAAGAAATGCTCGACAGAGGTGAGCTACCACAAGAAAGAGCGACCAGCAGGGAGAAAGGCCAACCTCTATGTATGGAACAGTTCTACCGTCTACTGGGAGTGTGCCGTATTCCCGAAGTGGGCAAAGATCGCCTCGAGCTGCCACCTAGACCTGACGATCCGTCTGAATGTGAGGAGCTGATCATTGTTGCTTGCCGAAACTATTTCTATCCAATACCAGTGAAAGCAGCAGACCGCGGGCGGCTGACTCCTGGCGAAATTCAAGCTCAGATCCTACATGCCATGGTGGACGCGGCCGGCGCCCCGCCAGCTCCAAGAGTTGGACTCCTCACAGCTATGAACAGGGATCGGTGGGCAAGGGCGAGAGAACAACTAGTTAAAGAAGAGGCGAATCGTGCAAACTTGGAGCTGATATCTCGTTCTCTGTGCGTGTTGTGTGTGGATGAGGCGGGCGGTGATCGCTCCGACTTGGACGAGAACACCAACGCTCTGCTGAGGGCGATGCACGGTGCCGGAACCAACTATCACTCCGCCAACAGATGGTTTGATAAGACTGTGCAGCTGATAATATCGTCGGATGGCACTGTAGGTATGTGCTACGAACATAGCCCGGCAGAGGGCGTTGCAGTTATACGTCTAGCAGAACGTGCGCTAGCTAGGGCTGACGTGGCACCACGACCCGCACCGCCGCCCGCGCTTCTACCTGCCCCTGTCGCAATGAAGTGGAAATTGACTGGAGATCTAATGAGAACCATAGAACAAGCTGGGAGGGACTTTGACCGGGCCATATTGGACCTTGACCTAAAGGTCTACACGTACCGTGGATATGGCCGTGAGTTCATGAAGAGCTGCCGCACTAGCCCCGACGTCTATATTCAGCTGGCATTGCAGTATGCTTATTACAAGATGTATGGTTACTTGGTGTCGACTTATGAATCAGCGTCGCTCCGTCGCTTCCACAACGGCCGGGTCGACAATATTCGCAGTGCGCACTCCGCAGCATTATCCTGGGCCGCCGCCATGTCGTCCACCGATATGACCCAAGAGGACGAGGGAAGGAAGGTCTCTTTTAACTTGTATGGAGAAAAAAAGAAGCTCGAATTGTTTGAAGAAGCGACTCGTAAGCAGACGGCTATAATGGAAGCGAATATCCAAGGTCGCGGTATTGACAATCACCTGCTGGGTCTGCGCGAGGCGGCGCGGGAGACGCTGGGACACCTGCCCGACATGTTTACTGACAACACCTACAATAGAATGATAGAGTTCAAGCTGTCCACCAGTCAGGTGGCCACAACCACCGAGGGTACGTTCATGGGCTACGGCGCGGTTGTTCCTGACGGCTATGGCTGCAGCTACAATCCCAAGCGTGACTCCGTCATTTTCTGCATCTCTTCTTTCGCCTCCTCCAGTGTCACTAACACTGAAGCCTTCCGTCAAGCTCTCGAAGAAGCCCTCGACGCCATGAAACTCATGTTCCAGAACAAGAAAGCTGAAGGTTGA

Protein sequence:

>DPOGS210548-PA
MNTDDFFSLRRPASNYNYHENQYQRNSKAQLEKPVTEKPRQYVIRPMFDHIDGFNLRDKYFRPKPLLVNNDDFYREKFQLHHQSDAITLRQKINYVRDMMPSPVPKDNDRHVIERPSYLPPKTKPKFLRDRIDSIRNYLFNTDVIEKTQFPISKVLRDSTDFMRYEDPLYYYRKSEWWLDDMYLKIRLPVPINSNPGMVFPRKQFAKIDEVADLAALYVDDLLDYKEMLDRGELPQERATSREKGQPLCMEQFYRLLGVCRIPEVGKDRLELPPRPDDPSECEELIIVACRNYFYPIPVKAADRGRLTPGEIQAQILHAMVDAAGAPPAPRVGLLTAMNRDRWARAREQLVKEEANRANLELISRSLCVLCVDEAGGDRSDLDENTNALLRAMHGAGTNYHSANRWFDKTVQLIISSDGTVGMCYEHSPAEGVAVIRLAERALARADVAPRPAPPPALLPAPVAMKWKLTGDLMRTIEQAGRDFDRAILDLDLKVYTYRGYGREFMKSCRTSPDVYIQLALQYAYYKMYGYLVSTYESASLRRFHNGRVDNIRSAHSAALSWAAAMSSTDMTQEDEGRKVSFNLYGEKKKLELFEEATRKQTAIMEANIQGRGIDNHLLGLREAARETLGHLPDMFTDNTYNRMIEFKLSTSQVATTTEGTFMGYGAVVPDGYGCSYNPKRDSVIFCISSFASSSVTNTEAFRQALEEALDAMKLMFQNKKAEG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: