MonarchBase - Protein-coding gene

DPOGS210547
Transcript	DPOGS210547-TA	1707 bp
Protein	DPOGS210547-PA	568 aa
Genomic position	DPSCF300304 - 24249-27949
RNAseq coverage	16x (Rank: top 81%)

Annotation
*Heliconius*			%
*Bombyx*			%
*Drosophila*			%
EBI UniRef50			%
NCBI RefSeq	XP_392463.2	6e-07	36.67%	PREDICTED: similar to Choline O-acetyltransferase (CHOACTase) (Choline acetylase) (Acetyl-CoA) (ChAT), partial [Apis mellifera]
NCBI nr blastp	gi\|296220123	6e-07	40.00%	PREDICTED: LOW QUALITY PROTEIN: choline O-acetyltransferase-like [Callithrix jacchus]
NCBI nr blastx	gi\|354465860	2e-06	41.98%	PREDICTED: choline O-acetyltransferase-like [Cricetulus griseus]

Group
Gene Ontology	GO:0008415	6.4e-16	acyltransferase activity
KEGG pathway	rno:290567	1e-06
	K00623 (CHAT)	maps->	Glycerophospholipid metabolism
InterPro domain	[36-94] IPR000542	6.4e-16	Acyltransferase ChoActase/COT/CPT
Orthology group	MCL22666		Insect specific

Nucleotide sequence:

>DPOGS210547-TA
ATGGGAAGCATATTACTTGTCAACTCAACAGGAATGTTAGAAAAGTCCAAGGAACCGTATTTACTAGAAGCGAAACCAGTTACGAAACAATACGTCCAAGTGGCAAAGCTGCCCGTGCCCGAGCTTCAAGCTACCCTCGACTCGTACTTGGACTTCGCGGCCGTCATAGTGAACCATCATCAGCTTCAGAAGACGCAGGAGATCGTAAAGAAGTTCGCCGAGGATCTGGGACCCAAGATGCAGAACGTACTTTTGGATCGACAGAAAGAAATGATTAACTGGTGTCGCGGCTTAGTCGAGTTTCATAAACCAAACGCCAGTGACAACACGCTACTGTTGAAGGTGCTGCAGACCATAGACGCCCCGACTTCAGACACATACTTATTTGACGTGACTTTGAAATTATTACAAAGTGTGTGTGCGTGTATGCATGAGACATTACATAAGAAACAGGAGATATTCATCGATGACACTAACTCTATGCACTTAGCAGATGAAAAGCAAGGAAACGATATAAATCTGTACAAAGAGATATACAATAATACGTGTATTAACTTACGACATGAAATAGTTAACAAAATCAGAAGACATGAACTAGAAAATAACTATGAGAACAAACAAAGACAAGATAATGACTCAGCTCCGAATAGAAATATGATGTCTATTGATGATAACGCGAAGGATTCAATGAAGAAAATTATATTCGATACATTTATAAGAAATAACGATCACCACAAATACAGAATAGAAAAACACAATTTATTTAATAAAGACCTGTCATTGAAAAATAAAGTGGAGCACAGGGTTATTATAATAATAACATTGTATCCTCAAGAGAACAAAACTAAATTTGATATTAAACAAAGCAACATCACTGAAAAAGAAATCAACGACACTCTCGCGAACGACTCGCCGATAGATATAGACATATTAAGTGGCATTTATATTAAACGAAACAGCGTGAAATCAAAAGTAACGAATGTCAGAAAGTGCGACCTGTTTTCTATATACCTTTTTCTCATCAAGAGCATGAAAAGAAATGATGTTAAAGTGTTCAAACTTTTAAGAAGAAAAGGAACGATTAAAATATACATAGACACGACAACTTCTAAACAATTTAAAGATTTCCCTAATCCGTGCTGCGAGAACAGCACCTTGTTGAAAGCGTGTAAGAATGAAATTATATTTGAAAATAATGCTTCAGAAAATAAATATCGAACATCGACCGATAAACACATAGAAGGACATTTAAATGAAATCGTTTCTAAAATAAAATTACTCGTGAAACAATATGGAAAAAAAATATATCAAAATGGCAATCAAATCGCCAATACCACAAAGCCTTTACTTACCACAGAACATCCTGATGACGAAACTGCTGGTGGTCATTTTGAAAAGCAAAATATTAGTGAGCAAATATTTGACACGAGATCGCCATTGTATAATGAAATAACATCGGACCATATTTTTTCACGAACGGCCAATAGTCAGGACAACCTTACATCTACAAATATGATAACTGAAGCATCTTTAGGTAACGTTGGATATGATGTTAAGGACATCGAAAGTCGAATAACGCTCAACGATCAGTCTTACTTCAAACTGAGAGTTATTCGAACAACTTGTACGTTACCGCTTTATTTGAAGAAGAAACAGAAAATGTGCAGTACTTTTCCAAAAGTAAACATCCTTTTACCCAGAGTTTAA

Protein sequence:

>DPOGS210547-PA
MGSILLVNSTGMLEKSKEPYLLEAKPVTKQYVQVAKLPVPELQATLDSYLDFAAVIVNHHQLQKTQEIVKKFAEDLGPKMQNVLLDRQKEMINWCRGLVEFHKPNASDNTLLLKVLQTIDAPTSDTYLFDVTLKLLQSVCACMHETLHKKQEIFIDDTNSMHLADEKQGNDINLYKEIYNNTCINLRHEIVNKIRRHELENNYENKQRQDNDSAPNRNMMSIDDNAKDSMKKIIFDTFIRNNDHHKYRIEKHNLFNKDLSLKNKVEHRVIIIITLYPQENKTKFDIKQSNITEKEINDTLANDSPIDIDILSGIYIKRNSVKSKVTNVRKCDLFSIYLFLIKSMKRNDVKVFKLLRRKGTIKIYIDTTTSKQFKDFPNPCCENSTLLKACKNEIIFENNASENKYRTSTDKHIEGHLNEIVSKIKLLVKQYGKKIYQNGNQIANTTKPLLTTEHPDDETAGGHFEKQNISEQIFDTRSPLYNEITSDHIFSRTANSQDNLTSTNMITEASLGNVGYDVKDIESRITLNDQSYFKLRVIRTTCTLPLYLKKKQKMCSTFPKVNILLPRV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: