MonarchBase - Protein-coding gene

DPOGS204385
Transcript	DPOGS204385-TA	2148 bp
Protein	DPOGS204385-PA	715 aa
Genomic position	DPSCF300002 - 1651413-1668677
RNAseq coverage	74x (Rank: top 65%)

Annotation
*Heliconius*	HMEL013080	3e-150	56.47%
*Bombyx*	BGIBMGA007617-TA	2e-110	35.43%
*Drosophila*	CG32645-PB	2e-128	32.77%
EBI UniRef50	UniRef50_UPI0002060E61	7e-180	45.71%	UPI0002060E61 related cluster n=1 Tax=unknown RepID=UPI0002060E61
NCBI RefSeq	XP_001946627.1	0.0	45.85%	PREDICTED: similar to CG32645 CG32645-PB [Acyrthosiphon pisum]
NCBI nr blastp	gi\|328702827	3e-179	45.71%	PREDICTED: nose resistant to fluoxetine protein 6-like [Acyrthosiphon pisum]
NCBI nr blastx	gi\|270000892	0.0	46.35%	hypothetical protein TcasGA2_TC011151 [Tribolium castaneum]

Group
Gene Ontology	GO:0016747	6e-16	transferase activity, transferring acyl groups other than amino-acyl groups
KEGG pathway	dme:Dmel_CG33337	9e-31
	K00680 (E2.3.1.-)	maps->	Benzoate degradation via CoA ligation
			Limonene and pinene degradation
			Ethylbenzene degradation
			Tyrosine metabolism
			1- and 2-Methylnaphthalene degradation
InterPro domain	[308-693] IPR002656	6e-16	Acyltransferase 3
	[55-181] IPR006621	1e-07	Nose resistant-to-fluoxetine protein, N-terminal
Orthology group	MCL16668		Insect specific

Nucleotide sequence:

>DPOGS204385-TA
ATGTATAAAATTAATTTATTTGTGACATTGTTTGTGTGTGTGAGTTACGTAAGTGGGAAAGTGAACTCTACGGAGGATGGGACAAGCTCTCGTATGGCTTGGATGAAGAGTTTATTGGACCATCATGACTGGATTAACGTACTGAATGGAAGCCATAATGTGTCCGAAAAGTGTGAATCGGATTTGAGGCAGTACTTGACGGCGTTGAATGATGGACTGCTGTGGGCTTCCAAAATTTATGATGCATCAGGCCAGTATAGTCCAAACATGCTATTTGGGAACGAATTCTGGCTCGGATCAATAAACGCATGTCGTGATTTGCAACACAAAGAGTACTATGCGCAAACGCCGCCTTTCCCTTGTACCTTCTATGTTGCCAAAATTAATCTCACCGTCGACGGAGATCACATACCACAGACAAGGCCGATGCTTGTCGGTCAGTGCGTGCCGGCGTCTTGCGATAAAGATGATTTGAAATCTGTATTGGATGCTGCGGAGACGACAATCGTTGAAAGGGCCGTAGCCAATGGCTTCGTCGCTTCCTTCACTACCCTCTACGTCCGACCTGTCCCTGGCACTTATGATGTTTTAAAAGATTTTAAATTTCATATATTAACGACCGTTATTTTGACGGTGTCAGTGTGGATGTTGGTAGCTTCTGCCTACGAAGGTTACTTGGAGAGAAAATACCGCAATAAAGAACCGAAGGATCTAGAAGTAGCCAACAACAATCACAAACCAACTGCGAATAACAATAACACACCACAAGCGTCTGCAAAAAATGTGGACAACGATATCAAAGAAAAAGACATAAGAAGGGATGTTTGCGGAGTATGGTCTGAAATTCTGCTGTCATTTTCAATACTCTCTAATGGGCGAGCCATTCTGAGCACACAAAAGCCGAGCGACGGAGCACTAACTTGCTTACACGGCATGAGATTCCTTTCCGTGTTGTGGGTCATCATGGTGCACACATATTTGACAGTTTTCTACATAGCAGATAACAAGACTATGAGAGTGGTCACTGAAAGGAATTTTCTTTATCAATCAGTCGGTAATGCATCCTACTGTGTGGACACATTTTTCTTTATCAGCGGTCTGCTCGTCACTGTGCTTTTTTTGAGAACAGAGGAGAATTTACTTGACAAGCCGGAGGTTAGGGTTTACAGCAAACGAGAAGTCTTCGGTATGACGAAGTCTTTTCTCGTCCTCCTATCATACCGCGTGGTGAGGCTGACGCCGGCGTATGCGTTCGTCATCGGTTTGAACGAGCTGGCGCTTCGGTACACCTACGACCACACGGTGTTCGAGCCGGCTATCTTCGACCACATCAACTGCAACCATTACTGGTGGCGTAACTTGCTCTACATAAATAATTTATTTCCTCAAAAAGACATGTGCATGGTCTGGTCCTGGTACATGGCTAATGACACGCAATTTTATGCTGTCGGTATAATACTGCTGTTGATATCCATCAAGCATACGAGATTCGCGATGGTGTCCCTGATCCTGGTGTTGGTTAGTTCCTGGGCAACCACCATCTACGTGTCAGTGTGGCACCAGTACAAAGCTCGCATTCAAGAGCCGTTTGAAATGTTTGATCCACTTTATGACAAACCGTGGTCCCGCATCGGACCTTATTTGGTTGGAATGATCGTAGGGTGGTATTTACATAAAACTAAATGTCAAATAAAAATGCCATATTGGCTGGTAGCGGTTGGCTGGCCGGCCTCCCTCATTATTATTGCCAGCCTCATCTTTGGTATGGTGGACGGATACTTTGAAGTCTGGCCAACCGCCTTTTACGTCAGTGTTGGTCATACAGGGTGGGGCGTGGCTCTCGCATGGATTTCAATAGCGTGTTGCTGTGGTTACGGAGGACTTATCAAATCAGGGCTGTCCTACCGTGGACTGTTACCACTCAGCCGACTCACGTACTGCGCGTACCTCGTGCATCCAACCATCATGATGTATACCTCCTTCTTGCTAGACGGGCCTCTGCATCTGGAAAACTCTATGGTGCTCGTCATATACTCGGGGTACGCCGTCATGGCATTCCTGGCTTCGTTCGCTATTTCACTGGCATTTGAGGCGCCCGCAGTGAGACTGTTGAAGATTATCACTGGAGGAAGCAAGAGCGAAAAATAG

Protein sequence:

>DPOGS204385-PA
MYKINLFVTLFVCVSYVSGKVNSTEDGTSSRMAWMKSLLDHHDWINVLNGSHNVSEKCESDLRQYLTALNDGLLWASKIYDASGQYSPNMLFGNEFWLGSINACRDLQHKEYYAQTPPFPCTFYVAKINLTVDGDHIPQTRPMLVGQCVPASCDKDDLKSVLDAAETTIVERAVANGFVASFTTLYVRPVPGTYDVLKDFKFHILTTVILTVSVWMLVASAYEGYLERKYRNKEPKDLEVANNNHKPTANNNNTPQASAKNVDNDIKEKDIRRDVCGVWSEILLSFSILSNGRAILSTQKPSDGALTCLHGMRFLSVLWVIMVHTYLTVFYIADNKTMRVVTERNFLYQSVGNASYCVDTFFFISGLLVTVLFLRTEENLLDKPEVRVYSKREVFGMTKSFLVLLSYRVVRLTPAYAFVIGLNELALRYTYDHTVFEPAIFDHINCNHYWWRNLLYINNLFPQKDMCMVWSWYMANDTQFYAVGIILLLISIKHTRFAMVSLILVLVSSWATTIYVSVWHQYKARIQEPFEMFDPLYDKPWSRIGPYLVGMIVGWYLHKTKCQIKMPYWLVAVGWPASLIIIASLIFGMVDGYFEVWPTAFYVSVGHTGWGVALAWISIACCCGYGGLIKSGLSYRGLLPLSRLTYCAYLVHPTIMMYTSFLLDGPLHLENSMVLVIYSGYAVMAFLASFAISLAFEAPAVRLLKIITGGSKSEK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: