MonarchBase - Protein-coding gene

DPOGS206018
Transcript	DPOGS206018-TA	1941 bp
Protein	DPOGS206018-PA	646 aa
Genomic position	DPSCF300253 + 207196-219412
RNAseq coverage	308x (Rank: top 37%)

Annotation
*Heliconius*	HMEL015376	3e-77	29.21%
*Bombyx*	BGIBMGA012637-TA	2e-95	49.12%
*Drosophila*	CG9447-PB	4e-41	24.92%
EBI UniRef50	UniRef50_Q7PTG8	2e-55	26.55%	AGAP007079-PA n=3 Tax=Culicidae RepID=Q7PTG8_ANOGA
NCBI RefSeq	XP_308678.4	3e-56	26.55%	AGAP007079-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158286325	6e-55	26.55%	AGAP007079-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158286325	6e-63	26.55%	AGAP007079-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016747	6.5e-17	transferase activity, transferring acyl groups other than amino-acyl groups
KEGG pathway	dme:Dmel_CG33337	2e-10
	K00680 (E2.3.1.-)	maps->	Benzoate degradation via CoA ligation
			Limonene and pinene degradation
			Ethylbenzene degradation
			Tyrosine metabolism
			1- and 2-Methylnaphthalene degradation
InterPro domain	[208-597] IPR002656	6.5e-17	Acyltransferase 3
Orthology group	MCL25993		Lepidoptera specific

Nucleotide sequence:

>DPOGS206018-TA
ATGGAGTGTCTGAAGAAGTTGGTATACTTAGCGATGCTGTTGGCCGTCTGTGACGGCAGCTCTGAGGAAATAAATGAGACTTCGGTCGGGAGTTTCCCACCGTTGTACGCTTTGGAGGACTGGAAGCTGTGTCAGAACCCTGGAGACGTGTATTGTATTGTGGATGCTCTGCTCGTCTCCACGAACTCTTCGCCGCTGCTGCAAGAGATACAGGAATATTCATCGAGAACGCTCAAGCACTTCAACAGGACAGTTGTCCATCGTGGGGTGTGTGTGACGAAATGCGGGGGCCAGGATCCTGATACGTGGAATGTGGCCGCTGAGGGATGTATCAACACCAGCTTGGAGGAGTATGGACTTGAGGCGGACGTCCAGGACGTCGGCTGGTGTCGCAACAACCAGCCTACACCCATGAGTACGTCGGCCCGAGTGTTCGTCATAGTATGTGCGACGTTGCTGGCTATGACATTAATAGCAACGGGACTACACGCTTTGGAATATAGATTTGGGAAATTCTTTGGTAATAAATACATCTTGGCTTTTTCATTAAAACGAAATTGGAAAATGCTTATATATGATGACAAACAACGAAACAGAAACGAGCGCACGGAGGACTTGAGTTGCATCGATGGTATTAGGTTCATCGGAACACTCAGCGTCGTTCTGACTCACGTCACAATTATTCACGTGTTTGCTTTCATCGACAATCCGGATTTTATTGAAAATTTATATGAACATGTGAGTACTAAGTCAGCCTTCAACACGCCACTTTGGATCCAAGCCTTCATATCGATATCCGGATTCCTCTCCGCGTACTATCTCCTCATTTACACCGAGAAACACTCCTTCACTTGGAAAAAATGTGTAGTATCTGTTTTACATCGATACATCAGATTAACTCCCGTGTCGTTATTCACTCTGTGGTTCACGATATCGTGGTTACCTCGCCTGGGTTCAGGTCCTCAGTGGTCGTGGCTGGTGGAGCAGGAAGCCCAGTACTGCACCGAGCGTGGATGGTACCACGCGCTTTACATTCACAACTACCTCACTCTTGGAAAGTTGTGCATGGGGCATACGTGGTACTTGGCGGTAGACATGCAGCTTCATGTACTCGGCTCATTTCTTCTTCTGATTCTTATGAGATGGAGGAAGGCCGTCATCCCTGTGCTGGCTACCATAGTGATTGCATCAATGGCTGTTACAGGATTGCTCGTCTATTTCTTAAATCTAACTCCTATCATAAGCGCGCAGTCTCCTGAGACTGTTCGCAACATGTTTAAAGGTTCAGCGATAATGCCTACGATATATTTGCCTGTGTGGGTGCATTTTGCCGGCTATGCTTTAGGCATTGCTACTGCCTATATACATTACAATGATCAAAATAATGGATACAAGCTCAGGGATAGTAAGTGGTTTTCAGCTATCTTTCACACGTCCTTGTTGCTGGCCGCAGCTGTCAGCGTCGCTGGTGTGCCATTCCTCTCAGATTCTCCTCCTCCAAGCTGGGTGACTGCTCTATATGCCTCCGTTGATAAAATACTGGTGGCGCTCTTCTTTAATGTGTTTTTATTGGGGTGCTTGAGTCGTTGTAGATCGGTGTTCCGCGACCTGTTGTCGTGGCGAGGCTGGTACTCCCCCGGCAGGTTGTCATACTCCGTCTTCATCATACACTTCGTCATCATGAGGTTCACCATCGCCAACAACCCTCAGATTATTCATATCACCGGTTATTCCTCTTTATCTTTATTAATAGTTGGAACAGTGCTGTCATATCTTATATCTGTTCCGGTATTTTTGGTGATAGAGATGCCCTTTATCCAGCTCTGGAAGGCTGTCATGGGTCTCGATGGTCCCAAAAAAGATGCACAGGCACAAGAAACACAGAATAAGATTGATCTCGTGATGAACGGGAGTAGGAGAAGTGGACAGAATGTTGTTTGA

Protein sequence:

>DPOGS206018-PA
MECLKKLVYLAMLLAVCDGSSEEINETSVGSFPPLYALEDWKLCQNPGDVYCIVDALLVSTNSSPLLQEIQEYSSRTLKHFNRTVVHRGVCVTKCGGQDPDTWNVAAEGCINTSLEEYGLEADVQDVGWCRNNQPTPMSTSARVFVIVCATLLAMTLIATGLHALEYRFGKFFGNKYILAFSLKRNWKMLIYDDKQRNRNERTEDLSCIDGIRFIGTLSVVLTHVTIIHVFAFIDNPDFIENLYEHVSTKSAFNTPLWIQAFISISGFLSAYYLLIYTEKHSFTWKKCVVSVLHRYIRLTPVSLFTLWFTISWLPRLGSGPQWSWLVEQEAQYCTERGWYHALYIHNYLTLGKLCMGHTWYLAVDMQLHVLGSFLLLILMRWRKAVIPVLATIVIASMAVTGLLVYFLNLTPIISAQSPETVRNMFKGSAIMPTIYLPVWVHFAGYALGIATAYIHYNDQNNGYKLRDSKWFSAIFHTSLLLAAAVSVAGVPFLSDSPPPSWVTALYASVDKILVALFFNVFLLGCLSRCRSVFRDLLSWRGWYSPGRLSYSVFIIHFVIMRFTIANNPQIIHITGYSSLSLLIVGTVLSYLISVPVFLVIEMPFIQLWKAVMGLDGPKKDAQAQETQNKIDLVMNGSRRSGQNVV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: