MonarchBase - Protein-coding gene

DPOGS202659
Transcript	DPOGS202659-TA	5316 bp
Protein	DPOGS202659-PA	1771 aa
Genomic position	DPSCF300039 - 40789-74974
RNAseq coverage	1187x (Rank: top 11%)

Annotation
*Heliconius*	HMEL003729	0.0	78.82%
*Bombyx*	BGIBMGA000858-TA	0.0	48.26%
*Drosophila*	drd-PA	8e-95	31.81%
EBI UniRef50	UniRef50_F4WQ68	2e-150	34.86%	Nose resistant to fluoxetine protein 6 n=2 Tax=Myrmicinae RepID=F4WQ68_ACREC
NCBI RefSeq	XP_001599124.1	2e-144	41.11%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|332023448	9e-150	34.86%	Nose resistant to fluoxetine protein 6 [Acromyrmex echinatior]
NCBI nr blastx	gi\|332023448	1e-155	32.20%	Nose resistant to fluoxetine protein 6 [Acromyrmex echinatior]

Group
Gene Ontology	GO:0016747	2.1e-19	transferase activity, transferring acyl groups other than amino-acyl groups
KEGG pathway	dme:Dmel_CG33337	7e-53
	K00680 (E2.3.1.-)	maps->	Benzoate degradation via CoA ligation
			Limonene and pinene degradation
			Ethylbenzene degradation
			Tyrosine metabolism
			1- and 2-Methylnaphthalene degradation
InterPro domain	[1338-1728] IPR002656	2.1e-19	Acyltransferase 3
	[393-545] IPR006621	2.2e-13	Nose resistant-to-fluoxetine protein, N-terminal
Orthology group	MCL17431		Insect specific

Nucleotide sequence:

>DPOGS202659-TA
ATGGTGTGCCACAGATGGACTTTAGCTCTAATTTTATTCGGCCTTCCTATATTAGCTACAGTAGGCGCATTCCGCGTGCGCTTACCTGGAAGTGTTTCTGAAGTTAGGCCCGATTTAAAAAAACACAAATGTGAGAATTGTGATATTGGTGACCTTAACTTTGACCGAGTAGATAGTGTTAGAAAGAGTGAGAAGATTCCGTACGATAACGTGAAAAGTATTCTTAGTGAAAAACGAGATTTGCTTAGTGAGAAGTTAAAAAAAATAAGCCATAAAACCATAAAAACTCAAGATGATCTTGATGAAACTGAACAGAATAAGGTTATGGGCAAAAATGAACACGATATTTCAGTCCACTTAAAAAAAGATAAAGAATCGAAAACAAAAGTAAAGAAACCGTCAATAATCTTAGACTTTTCTGATGACGATGATAGTGATATTAACGAAGACGACGATGACGAGGACGAAGATGACATAAAAAAAGTAGTGAAAGAAGATTACAAGAAGAAAGTAGATATAGTTCCAAAATTTACACCTAAAGTAGAGAAATTAGTACAGCTACCAAAATCAAAGGACAAACTGATTGTAATAAATGAAAAAATATCTGACAAAAAAGAACCAAGTAAGAATGAACCAACGGCACAAATTCAAGAAGAATCGTTTAAAGATATCAACATAAAAAATGTTAAAACTGTTGCTAAAGATAATAAAGTAAGCGATGACATCGAAAAAAAAAGTAAAAGTAAGGAAAATGATTTAAGCAAAAGAAAAATTGAGATCAAAATAGAAGAAAAAGATATCGACAAAAATAATGTAAAAAATACTAAAAAGTTGTCAGAAGATAATACAAGTATAAAACACGGTGACAAAAAACACCTAAGCAGTAAGACTTCACAAAAAAAGGATGAGTTAATGAATGAGAGTGCTAAAGAGAAAAAAAATGAACAGGCGTCGAAAAAGCTATCTGATCTCAAAGAAAGTATTCATGAGGAATCTAAAAAAGATAAACCTTTAAAAGTAGTTGATGCTACAAAAAAAGATATTGTAGATCAGAGTACTTCGAAAGACATTCGTATAATCTCAGATGCATTACAAAGAAAAAATTTGTTACATAGTGAGTTTGAAGACTTCTATTCCTTCTTACCTACTTTTGCACCAAATTTTACACGAATACACAATCCAGAATGTCGACGTCATGGACAAATACTTTTAAGACAGCTACGTGGAAGTAAGCTTTGGGCTTTAAAGATGCTAGATGCTACAGCAAAGTTTCCCTCGGGGTTTCTTCAAGGGAACGGAATCCAGTTGGGTGATTTTGACCAGTGTTTGGGGGTACGAGCAAGAGTACAACTGGACACTGGCAGCGTTGTTAGACTACAAGGAAAATATTGTCTAGCCATGATCGATGTCAAAGCTGAACACCCAGAACTTGAAATACCAGTTCATTTGGCACAGGGCAAGAATTTGTTTAAAAGTCGCATTGATGATCCAGGTCACTTCGTGCCTAGGTTTTCAACCTTGAGTTGGGGAGTGTGCATACCATCGGCTTGTACTTCAGAAGATGTGGAGGTGGTTCTCAGAGATGCTGTTAAACATTATCAATACAAGACTGGTATTAGTACCCGGATCAGGGTCGATGAACATGATTGTTTTACCAGGAAAGGTAGTAATTGGTGGAAGGAATGGATAGAGTTACCGACTGTTGTAACTTTATCCTTGTACGCGTTGGTTATCCTGATAGTATTGATAGCGACAGTCCAAGATATGTCTGCTAGAAATGATTCTAACCACGAGGAACATGAAGAGGAGAATAAACAGATGAAAAAGCAAGAGACCAAAACCAGTTCAGGTGGCTTCCTGAGCTGTTTTTCTTTGTACCATACGCTGAATAAGCTTATAGCACCAGCAAGCGAGGATGAGATAGCTTGCATCCATGGCATCCGAGCTGTTGTAACTGTGGCACTCATAGTCGCTCATAAGTTCCTACCGATGGCTTTAACACCGTACACAAACCGGATACGTTTGAGTGAGATCTTAAGCTCCTCTTTGTTGTCCTGGTGCAGAGCTGGTTGGATCTTCACAGATTGTTTCCTCCTGATAAGTGGTACTCTCACTTCATATAGGAAGTCTCCAAGTGATAATGTCGCAACAAAATTATTAACGCCGGCTCTTTTAGCAATAGTTTTGTTTTATGCTTATGTTTGGGATAATATATCCTCCGGTCCCATGTGGGGGACTCTCGTTTGGAAAAATTCTCAGCTGTGTCGCGATGGTTGGTGGTGGAATATACTATACGTGCAGAACTACTTTGGATTTGAAGATATGTGTGCTCCTCAAACCCACCACATGGCTATGGATTTTCAACTGACGATCGTAGGAAGTATAATTGTGTGGATGATCCAATCTGAGGTTCCATTTGCTGGGTCCTTGCTGCCAACGTTACATATACTGTCTGCATACTCCAGATACACGACTGTACGGGATCATCGATTGACACTCTTGGCATATCAAGGTGTCAGTGTCAGCCAACTATACAGGACAGGTCGATTGAGCTACACGTCTATTTATCATCGATGCTCGCCCTACTTGATCGGACTAAGCTTAGGGCTTTATCTTAGAAACCGCTCACGTCTCACTAAGCCCTTAGTATACTTAGGTTGGTTCATCTGTGGCACTTTATGGGGGGCAATATTTTGGGCGGGCTATGATTCCGGATACCTTGATTACCGGTATGACCTCACATACGCCGCGCAATATGCAACGCTTGCACCCATCGCCGCTGCGTTAGCCTTTGCCTGGATAATCTATGCTGCTCAAAATGGACACTCTGAAACTCTATCTCGAATGCTTTCCGGTCGTCCACTTCTATTTATTAGTAGAATATCATATGCGCTTTATCTTGTACAATTTGTTGTCTACCTTACAAACACCGCCTCTATTAAGGCTTCAAGGGAGTTTTCTCTTACATCGCTAATTGATCTTCAAGAGATCGTTACTATTCTAGTATCTTCCATAATTCTCACCGTGACCTTGGTACTTCCACTGCAGTCGCTACCAAAGTTATTTGAAGCTCCAACAATCGATAACTTGGAAAATAACGATAATAAGGATGTTTCGGAATATAACAATTTGCAAGAAAAGCTAGAATCGAAATATAAAACAGATGAGAAGGAATTAATTTCAGAATCTCATCAACCAAGGCGATCATTTTTAGCTCATCGAGAAGTTTTGGAAGAAATACCAGAAGTCGAAGTAGAATATGAGGTACAAAGAGATTCACATGACGGTTTAGAAGAAATTTTAGAAGAAGAAGATGACGAAATGATGGATCGAGAAGAAGATGATTTAGAAATTATTGAGGAAGAACAAGGAGGTGAAGAAGATTTTTGGGCAGACAGGGAAGAATATTCATCAAGTTATTTAAGAAATGGCGATCAAGAAGTTGACGAGTGGGAGTGGACTGCAAATGTGTTCGACGCATCAGCCAAGTCTCCACAAGGTCTTCTGTTCGGTTCTTCTTACCATCTCGGTAATTTCGATGAATGTGTAGGGATCGACGAGCCAGGAGAAGGTCTGACCGTGGAAGGTCAATATTGTCTGGCTACTATCAAGTGGAGGCAGTCAGAGGAAACGAAAAAGATAAGAACTGGTCGCGGCGAGACTCTTCGTTGGGCTGTATGCGTTCCGAGCGCTTGTGATGCAAAAGCTGTGGCTGGCTTTGTAGGAGATGTGTTGTCTCATACAGTCGGAAATTCAACTGGAGTGGAAGTTACCGAGAGGGATTGTTACACACGGAAACCTATAACTGTTACGAAACTTGATATCGCTTTCCTTGGCATACTATTTTTCTTTGGTTTGCTGTGTCTGTTTACAACGTCGTATGAATTATACATTATGAAGTATCCACGGAAGAAAAACAGTCCTGTCCAGGATCTGATAATTGCTTTTTCCTTGATAAACAATATGAAAAAGATTCTATCAACAAAACAAAATAATAGCTTGGGGCTAGAATGTATTAACGGCATCAAAGCGTTAGCTATGATCTTTATTATAGCGGGACACGCCTGTCTTTTTATTGGCAGTGGACCCGTTATGGACGCTGAAGCTTGGGACAGACTGATCCGAGATCCAATAAATGCCTTCATGTTAAACAACACGCTCCTTGTCGATACATTCTTGTTTCTCAGTGCATTTCTCTTCAGCCGATTGCTCCTTATTGAGTTAGATAAGCGCCGAGGGAGGCTTAATGTCCTACCCATATTAATATTTCGATATGTCAGAGTAACTCCAGCCTACCTCATTATTATACTATTTTATATGACTTGGTTACCAAAGATCGGAGAAGGTCCGTTATGGGAAGGAAGGTTGCAGCTGGAACAAGAACGTTGTATGGAAGTTTGGTGGGCCAATATACTATATATCAACAATTATATTAATACCGATAAATTGTGTATGTTCCAGTCATGGTATTTGGCAGTAGACACACAGCTTTTCTTTGTCGCACCCATATTTATCTACAGCCTGTGGCACTGGAGACGATTTGGAGCCATATTTACGTCGGCGGCGACTTTCATATCCCTCGTCATCCCATCTGTCATCACATATAAAGAACGGCTGGATCCCACTTTGTTGTTTTATGCAAAAGAATTCACGGATTTTGCCACCAATAATTATTTTGTGGGCGCTTATATAAGAACGCACATGAAGATGACGCCATATTTCATGGGAATAATAACAGGGTATATGTTACATAGAATTCAGTTGGAAAAATACCAGTTTTCAACGATTCTCAAAACTCTTGGATGGACAATAAGTATAATACTTGGTACAGTGACAACGCTCTCTGTCAGTCTATTCTATCAGGACTGGTATCAGTACAGCGAGCTTGAAGCCGCTGCATACATATCACTCCACAAATTTGCATGGAGTATAGCCAATGGCTGGCTGGTTGTTGCTTGCGCATCTGGTAACGGAGGTGTTCTCGGCAAACTTTTGAATTGGAAGTTCTTGGTGCCTATTGCTAGATTAACATTCTGCGCGTATCTCGTCAATGGTATAGTTGAGTTATACTATGTCGGCCAGTTGCGACACCCTCTTCACATAACATTCTTTACTGTGGCGGCGAACGCGATATCTCACATAGTGCTCACATTCTTTCTTGCTTTAATACTCTGTATTATATTCGAGTCTCCCTTACATGGAATAGAAAAGATTCTCCTCAGAATGTTTGCTCGTCCCGTATTAAGTGACAATGCCACGCCACCCGAATTACGTGAAACATCACGGAATACTAGTCAAACAACATTGGATAATTAA

Protein sequence:

>DPOGS202659-PA
MVCHRWTLALILFGLPILATVGAFRVRLPGSVSEVRPDLKKHKCENCDIGDLNFDRVDSVRKSEKIPYDNVKSILSEKRDLLSEKLKKISHKTIKTQDDLDETEQNKVMGKNEHDISVHLKKDKESKTKVKKPSIILDFSDDDDSDINEDDDDEDEDDIKKVVKEDYKKKVDIVPKFTPKVEKLVQLPKSKDKLIVINEKISDKKEPSKNEPTAQIQEESFKDINIKNVKTVAKDNKVSDDIEKKSKSKENDLSKRKIEIKIEEKDIDKNNVKNTKKLSEDNTSIKHGDKKHLSSKTSQKKDELMNESAKEKKNEQASKKLSDLKESIHEESKKDKPLKVVDATKKDIVDQSTSKDIRIISDALQRKNLLHSEFEDFYSFLPTFAPNFTRIHNPECRRHGQILLRQLRGSKLWALKMLDATAKFPSGFLQGNGIQLGDFDQCLGVRARVQLDTGSVVRLQGKYCLAMIDVKAEHPELEIPVHLAQGKNLFKSRIDDPGHFVPRFSTLSWGVCIPSACTSEDVEVVLRDAVKHYQYKTGISTRIRVDEHDCFTRKGSNWWKEWIELPTVVTLSLYALVILIVLIATVQDMSARNDSNHEEHEEENKQMKKQETKTSSGGFLSCFSLYHTLNKLIAPASEDEIACIHGIRAVVTVALIVAHKFLPMALTPYTNRIRLSEILSSSLLSWCRAGWIFTDCFLLISGTLTSYRKSPSDNVATKLLTPALLAIVLFYAYVWDNISSGPMWGTLVWKNSQLCRDGWWWNILYVQNYFGFEDMCAPQTHHMAMDFQLTIVGSIIVWMIQSEVPFAGSLLPTLHILSAYSRYTTVRDHRLTLLAYQGVSVSQLYRTGRLSYTSIYHRCSPYLIGLSLGLYLRNRSRLTKPLVYLGWFICGTLWGAIFWAGYDSGYLDYRYDLTYAAQYATLAPIAAALAFAWIIYAAQNGHSETLSRMLSGRPLLFISRISYALYLVQFVVYLTNTASIKASREFSLTSLIDLQEIVTILVSSIILTVTLVLPLQSLPKLFEAPTIDNLENNDNKDVSEYNNLQEKLESKYKTDEKELISESHQPRRSFLAHREVLEEIPEVEVEYEVQRDSHDGLEEILEEEDDEMMDREEDDLEIIEEEQGGEEDFWADREEYSSSYLRNGDQEVDEWEWTANVFDASAKSPQGLLFGSSYHLGNFDECVGIDEPGEGLTVEGQYCLATIKWRQSEETKKIRTGRGETLRWAVCVPSACDAKAVAGFVGDVLSHTVGNSTGVEVTERDCYTRKPITVTKLDIAFLGILFFFGLLCLFTTSYELYIMKYPRKKNSPVQDLIIAFSLINNMKKILSTKQNNSLGLECINGIKALAMIFIIAGHACLFIGSGPVMDAEAWDRLIRDPINAFMLNNTLLVDTFLFLSAFLFSRLLLIELDKRRGRLNVLPILIFRYVRVTPAYLIIILFYMTWLPKIGEGPLWEGRLQLEQERCMEVWWANILYINNYINTDKLCMFQSWYLAVDTQLFFVAPIFIYSLWHWRRFGAIFTSAATFISLVIPSVITYKERLDPTLLFYAKEFTDFATNNYFVGAYIRTHMKMTPYFMGIITGYMLHRIQLEKYQFSTILKTLGWTISIILGTVTTLSVSLFYQDWYQYSELEAAAYISLHKFAWSIANGWLVVACASGNGGVLGKLLNWKFLVPIARLTFCAYLVNGIVELYYVGQLRHPLHITFFTVAANAISHIVLTFFLALILCIIFESPLHGIEKILLRMFARPVLSDNATPPELRETSRNTSQTTLDN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: