MonarchBase - Protein-coding gene

DPOGS210502
Transcript	DPOGS210502-TA	948 bp
Protein	DPOGS210502-PA	315 aa
Genomic position	DPSCF300186 - 31533-36226
RNAseq coverage	732x (Rank: top 18%)

Annotation
*Heliconius*	HMEL004628	3e-64	90.70%
*Bombyx*	BGIBMGA012588-TA	1e-118	68.67%
*Drosophila*	Taz-PA	1e-82	52.11%
EBI UniRef50	UniRef50_D6WPU9	6e-84	54.96%	Putative uncharacterized protein n=7 Tax=Coelomata RepID=D6WPU9_TRICA
NCBI RefSeq	XP_623345.2	2e-91	58.30%	PREDICTED: similar to tafazzin CG8766-PA, isoform A isoform 2 [Apis mellifera]
NCBI nr blastp	gi\|340715597	4e-88	54.36%	PREDICTED: tafazzin homolog [Bombus terrestris]
NCBI nr blastx	gi\|345497532	3e-87	58.78%	PREDICTED: tafazzin homolog [Nasonia vitripennis]

Group
Gene Ontology	GO:0008415	4.3e-27	acyltransferase activity
	GO:0008152	4.3e-27	metabolic process
KEGG pathway	ame:550948	9e-90
	K13511 (TAZ)	maps->	Glycerophospholipid metabolism
InterPro domain	[1-252] IPR000872	9.8e-117	Tafazzin
	[45-188] IPR002123	4.3e-27	Phospholipid/glycerol acyltransferase
Orthology group	MCL12556		Single-copy universal gene

Nucleotide sequence:

>DPOGS210502-TA
ATGGCGTACGATATCGGGTGGATCATCCCGCGGCTGCGGAACCCCGGCGTCCTGTGGAACTGCGCCAGCTCCATAACCGTGGCTGTGGTCGGTCTGTTCAGCAAGATCATCGTAGATTTCCTGAACAAGACGACGGTGTACAACCGGGAGGCGCTCCAGCGAGCCGTCCGACGGCCGCGGGACGTGCCCCTTCTCACTGTCTCCAACCACCATTCGTGTTTCGACGATCCCGGCCTCTGGGGTGTGTTGGACGTCGGCACGTTGACGCGTTACTCCCGCATGCGCTGGTCGCTGGCGGCTCACGACATCTGCTTCACAAACGCGCTACACTCCGCCTTCTTCGCGCTCGGCAAGTGTGTCCCCGTTGTGAGAGGGGCCGGAGTCTATCAGACGGCGATGGACTTCTGCGTGGACCGTCTGTGCGGCGGAGAGTGGGTGCACATCTTTCCCGAGGGTCGCGTGAACGTAGACAAACAACGTATCCGGTTCAAGTGGGGAGTGGGCCGACTGGTGATGGACAGCGCTGCCGCGGGCCGCGCGCCGCTCGTGTTGCCCGTGTGGCACGAGGGCATGGACCGCGTGCTGCCCAACGTCGAGCCCTATCGCTTGCGCTTCCGGAACCACCTGTACCTCGCCGTCGGGGAGCCGCTGCCACTCAGCCCGCTGCTCGACAAGCTCCGCAGCGCGAACGCGTCCGAGGAGGAGACACGGCGTGTCATCACGGAGCGGATCCAGGAGGAGCTGATGAAACTCCGCGACCACACGCACGCGCTCATCCGTCGCACGTGTCCCCCGGGCGCGGACCGGCTTCTGGAGCCGCCCGTCCCCGACCCCGGCAGCTCGGCCGCGCCCCGGGCCCCGGCCGCGCCTCTACACAACGGCAAAGAGCACACGCACGGCGAGGCCCCCGCCCGTCGGCCCGCCCTAACCAAGGAGAAGGAACTCTAA

Protein sequence:

>DPOGS210502-PA
MAYDIGWIIPRLRNPGVLWNCASSITVAVVGLFSKIIVDFLNKTTVYNREALQRAVRRPRDVPLLTVSNHHSCFDDPGLWGVLDVGTLTRYSRMRWSLAAHDICFTNALHSAFFALGKCVPVVRGAGVYQTAMDFCVDRLCGGEWVHIFPEGRVNVDKQRIRFKWGVGRLVMDSAAAGRAPLVLPVWHEGMDRVLPNVEPYRLRFRNHLYLAVGEPLPLSPLLDKLRSANASEEETRRVITERIQEELMKLRDHTHALIRRTCPPGADRLLEPPVPDPGSSAAPRAPAAPLHNGKEHTHGEAPARRPALTKEKEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: