MonarchBase - Protein-coding gene

DPOGS214428
Transcript	DPOGS214428-TA	1131 bp
Protein	DPOGS214428-PA	376 aa
Genomic position	DPSCF300069 + 532441-539568
RNAseq coverage	103x (Rank: top 60%)

Annotation
*Heliconius*	HMEL020222	3e-51	65.99%
*Bombyx*	BGIBMGA011234-TA	3e-61	56.19%
*Drosophila*	CG15766-PA	1e-08	26.24%
EBI UniRef50	UniRef50_UPI000206345B	2e-27	32.72%	UPI000206345B related cluster n=1 Tax=unknown RepID=UPI000206345B
NCBI RefSeq	XP_001602094.1	5e-28	38.12%	PREDICTED: similar to predicted acetyltransferase [Nasonia vitripennis]
NCBI nr blastp	gi\|328776397	7e-27	32.72%	PREDICTED: hypothetical protein LOC724126 [Apis mellifera]
NCBI nr blastx	gi\|170028884	1e-28	33.16%	conserved hypothetical protein [Culex quinquefasciatus]

Group
Gene Ontology	GO:0008152	6.8e-05	metabolic process
	GO:0008080	6.8e-05	N-acetyltransferase activity
KEGG pathway
InterPro domain	[165-368] IPR016181	2e-10	Acyl-CoA N-acyltransferase
Orthology group	MCL10783		Insect specific

Nucleotide sequence:

>DPOGS214428-TA
ATGAAGTGGAAAAGACCAGAAACTGTCCCTCTGGGGAGAGTGTGGAGTCGCTTTGAAGGAAAACAGAGAAATGGCAAGCCCGCAGAAATGTATCAGATAGTAGACATGAGCGAGTCCGTGAGGAGGCAGTGCCTCGACATGATGCAGGAGACATTCCTCCGAGACGAGCCGCTCTCACTGGCGTTAAATATAAAAACAGACGCGGAATCTGTCACATCGATACGTAACAATTGGGAGGAGATGCTCTCACAGAACATTTCCATCGCTTGTTTCACTGAAGAAGAGGGGCGTACCAAGGAGCTGGTGGGATTCAACATACTTATAGTGAAGACCAAGGAAGACGGTCACGAAGAGTTTGAAAATGTAAGTGGACGAGACCAGAAACTGTCCCTCTGGGGAGAGTTTGGAGTCGCTTTGAAGGAAAACAGAGAAATGGCAAGCCCGCAGAAATGTGAGACTTTTTCGACATACATATATATAGACATAATACTAAGGTATCAGATAGTAGACATGAGCGAGTCCGTGAGGAGGCAGTGCCTCGACATGATGCAGGAGACATTCCTCCGAGACGAGCCGCTCTCACTGGCGTTAAATATAAAAACAGACGCGGAATCTGTCACATCGATACGTAACAATTGGGAGGAGATGCTCTCACAGAACATTTCCATCGCTTGTTTCACTGAAGAAGAGGGGCGTACCAAGGAGCTGGTGGGATTCAACATACTTATAGTGAAGACCAAGGAAGACGGTCACGAAGAGTTTGAAAATGTCAAAGGTGAAAAATGGGAGAAGCTTCTGAAGACCCTCATCACGGCCGAGGAGCTGGTGGATATTTTCAGTCATTATGACGTTGATACTTACCTGTCCTCGAGCGGACTGACAGTGTCGCCAGCCCACCGAGGACAGAACATCGGGGCGAGGATGATACAAGTCAGAGAGGACATGTGTAAAGCGTTCGGTATCAAGGCGGTGTCCACCGTGTTCACGGCCACCTCATCACAGGTCCTGGCAGCGAAATGTGGATACGAGGTCCTCGCCGCGCTGCCCTACACCCACATGCTGCAGTACGGGATTGACCTGACTATGAGTGAGACCCCCCTCGCTAAAGTCATGGGAAAGAAATACTATTGA

Protein sequence:

>DPOGS214428-PA
MKWKRPETVPLGRVWSRFEGKQRNGKPAEMYQIVDMSESVRRQCLDMMQETFLRDEPLSLALNIKTDAESVTSIRNNWEEMLSQNISIACFTEEEGRTKELVGFNILIVKTKEDGHEEFENVSGRDQKLSLWGEFGVALKENREMASPQKCETFSTYIYIDIILRYQIVDMSESVRRQCLDMMQETFLRDEPLSLALNIKTDAESVTSIRNNWEEMLSQNISIACFTEEEGRTKELVGFNILIVKTKEDGHEEFENVKGEKWEKLLKTLITAEELVDIFSHYDVDTYLSSSGLTVSPAHRGQNIGARMIQVREDMCKAFGIKAVSTVFTATSSQVLAAKCGYEVLAALPYTHMLQYGIDLTMSETPLAKVMGKKYY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: