MonarchBase - Protein-coding gene

DPOGS209503
Transcript	DPOGS209503-TA	1644 bp
Protein	DPOGS209503-PA	547 aa
Genomic position	DPSCF300127 - 27598-37997
RNAseq coverage	736x (Rank: top 18%)

Annotation
*Heliconius*	HMEL016015	4e-118	60.22%
*Bombyx*	BGIBMGA007345-TA	3e-169	67.20%
*Drosophila*	CG5112-PA	3e-107	42.63%
EBI UniRef50	UniRef50_E2BQI5	8e-120	42.01%	Fatty-acid amide hydrolase 2 n=7 Tax=Formicidae RepID=E2BQI5_HARSA
NCBI RefSeq	XP_967443.1	3e-124	44.78%	PREDICTED: similar to CG5112 CG5112-PA [Tribolium castaneum]
NCBI nr blastp	gi\|350405899	8e-124	43.52%	PREDICTED: fatty-acid amide hydrolase 2-like [Bombus impatiens]
NCBI nr blastx	gi\|350405899	4e-120	43.52%	PREDICTED: fatty-acid amide hydrolase 2-like [Bombus impatiens]

Group
Gene Ontology	GO:0016884	8.7e-172	carbon-nitrogen ligase activity, with glutamine as amido-N-donor
KEGG pathway	dpo:Dpse_GA20678	2e-68
	K01426 (E3.5.1.4, amiE)	maps->	Styrene degradation
			Benzoate degradation via CoA ligation
			Arginine and proline metabolism
			Tryptophan metabolism
			Phenylalanine metabolism
			Cyanoamino acid metabolism
InterPro domain	[72-546] IPR000120	8.7e-172	Amidase
	[73-539] IPR023631	4.5e-96	Amidase signature domain
Orthology group	MCL15852		Insect specific

Nucleotide sequence:

>DPOGS209503-TA
ATGGTTACAAAAAATGTTAAAAAACCTAAAACTGAAAAACCAGATAGACGCAAAGATAAAAGCAACAAAATATGTAAAGGAATGATTGTGAATATATTGATAAGCATATACTTTACTCTCCGCTATTATTTGGATATGTTAATCGACTACGCGTTTTCACTTTATTGGGATGAATATCGTCAGCAATTGCCAAATTTAGAGAAAAAACATGCAATGCTTATGGAAAGTGCAGTGAAATTAGCTGAGAAAATACGAAAAAAAGAACTAAAATCTGAAGATCTTGTTACTGCCTGCATTGAGAGAATTAAACAGGTCAATCCAATTCTAAATGCGGTAACAGACCAGAGATTTGAAGAAGCTCTGAAGGAAGCTCGAGAAATTGATAAGAAGATTGAAGATGGACTTCCCGATGAGGAATTTAAGAACAAACCGTTCTTGGGGGTACCTTTCACTGCCAAGGAGTCCCACGCTGTTAACGGGATGCTCCACACTCTCGGTGTTCGAGCTCGTCGTGATGTCCGCGCCGAGTACGATGCGGAGTGTGTGAGGTTGCTTAGAGAGGCCGGGGCTTTGCCCCTCGCTGTTACCAACGTACCAGAAATCAACAAATGGCAGGAGACTCGCAATATGGTCTTCGGTCAGACGAACAATCCTTACGACACGGGCCGCACTGTCGGTGGCTCCAGTGGCGGCGAGGCAGCCCTACACGCGGCGCTGGCCTCGCCTATATCACTGTGTTCGGATATTGGCGGCTCGACTCGTATGCCCGCCTTCTACTGCGGTCTCTACGGGTACAATCCCACGGCCGGACACACCAGCCTTAAAGGATCAGCTCTCCGGAGCGGTGAGGATCCAACGATCGCGTCCATCGGCTTCGTCAGCAAACATCCCGAGGACCTGGCACCTCTCACTAAGATCGTCGCCGGTGAGAAAGCCGGATTGCTAGATTTGGATAGGAAAGTCGACATTAAGGATATCAAATTCTACTACGTCGAGGACGTGAAAGATTTAAGGATCAGTCCCGTGTGCAGCGAGCTTAAGAAGGCCATGCATAAAGTAACATCGAAGCTGTCGAAGGCGAGCGAAGCACCGAAGCGGTATAGTCACGCGGGGTTCAACCACTGCTTCGCGTTATGGAAACACGCCATGACACGAGAAACCGAAGACTTCGCTAAACTGCTCACTGACAACCATGGAAGGGCTTACGGAGTTATAGAGCTGGGAAAAAAGTTAATCGGTCAATCTGACTTCACATTGGCCGCTATCCTCAAGCTGTTGGACGAGCAAGTGTTCCCGGCTGTGCCTCCAGCTTGGGCCGACCAGCTCACAGACAGCTTGAGGGATGATCTCATTACGTTGCTCGGTGATACAGGTGTTCTTATATTCCCTTCAGCGCCGAGCCCCTGTCGCCCTCACTACACCCTGTATACTGGTCCATTTAACTTTGCTCTATGGGGTATATTCAACGCTCTTAAATTCCCAGCTGTACAGGTGCCGGTGGGTCTGTCCGCCGGTCTGCCGCTCGGCGTCCAGCTGGTGGCGGCGCCTGGACGGGACGCGTTACTTCTAAATGTTGCAGCATACCTGGAGGAACACCTGGGAGGATTCACACCACCTTGTGCTGTACCACTCAATAATGCTTAG

Protein sequence:

>DPOGS209503-PA
MVTKNVKKPKTEKPDRRKDKSNKICKGMIVNILISIYFTLRYYLDMLIDYAFSLYWDEYRQQLPNLEKKHAMLMESAVKLAEKIRKKELKSEDLVTACIERIKQVNPILNAVTDQRFEEALKEAREIDKKIEDGLPDEEFKNKPFLGVPFTAKESHAVNGMLHTLGVRARRDVRAEYDAECVRLLREAGALPLAVTNVPEINKWQETRNMVFGQTNNPYDTGRTVGGSSGGEAALHAALASPISLCSDIGGSTRMPAFYCGLYGYNPTAGHTSLKGSALRSGEDPTIASIGFVSKHPEDLAPLTKIVAGEKAGLLDLDRKVDIKDIKFYYVEDVKDLRISPVCSELKKAMHKVTSKLSKASEAPKRYSHAGFNHCFALWKHAMTRETEDFAKLLTDNHGRAYGVIELGKKLIGQSDFTLAAILKLLDEQVFPAVPPAWADQLTDSLRDDLITLLGDTGVLIFPSAPSPCRPHYTLYTGPFNFALWGIFNALKFPAVQVPVGLSAGLPLGVQLVAAPGRDALLLNVAAYLEEHLGGFTPPCAVPLNNA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: