MonarchBase - Protein-coding gene

DPOGS203007
Transcript	DPOGS203007-TA	1359 bp
Protein	DPOGS203007-PA	452 aa
Genomic position	DPSCF300068 + 95083-98138
RNAseq coverage	722x (Rank: top 18%)

Annotation
*Heliconius*	HMEL011020	90.73%
*Bombyx*	BGIBMGA003866-TA	88.29%
*Drosophila*	Hn-PA	72.01%
EBI UniRef50	UniRef50_P17276	72.01%	Protein henna n=36 Tax=Eukaryota RepID=PH4H_DROME
NCBI RefSeq	XP_001600555.1	73.73%	PREDICTED: similar to phenylalanine hydroxylase [Nasonia vitripennis]
NCBI nr blastp	gi\|84095074	89.89%	phenylalanine hydroxylase [Papilio xuthus]
NCBI nr blastx	gi\|84095074	89.89%	phenylalanine hydroxylase [Papilio xuthus]

Group
Gene Ontology	GO:0016714	1.2e-288	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen, reduced pteridine as one donor, and incorporation of one atom of oxygen
	GO:0055114	1.2e-288	oxidation-reduction process
	GO:0009072	2.5e-279	aromatic amino acid family metabolic process
	GO:0005506	2.5e-279	iron ion binding
	GO:0004497	2.5e-279	monooxygenase activity
	GO:0004505	3.6e-226	phenylalanine 4-monooxygenase activity
	GO:0006559	3.6e-226	L-phenylalanine catabolic process
	GO:0016597	1.9e-07	amino acid binding
	GO:0008152	1.9e-07	metabolic process
KEGG pathway	nvi:100115984	0.0
	K00500 (phhA, PAH)	maps->	Phenylalanine metabolism
			Phenylalanine, tyrosine and tryptophan biosynthesis
InterPro domain	[1-453] IPR019773	1.2e-288	Tyrosine 3-monooxygenase-like
	[24-445] IPR001273	2.5e-279	Aromatic amino acid hydroxylase
	[23-452] IPR005961	3.6e-226	Phenylalanine-4-hydroxylase, tetrameric form
	[120-449] IPR019774	5.6e-181	Aromatic amino acid hydroxylase, C-terminal
	[41-100] IPR002912	1.9e-07	Amino acid-binding ACT
Orthology group	MCL14962		Single-copy universal gene

Nucleotide sequence:

>DPOGS203007-TA
ATGGAGCCGAGTGTAAACATACTATCAACCTCGCCGATGGACAAGCCAAAGTTAATGCAGGGTGGCAACTACATAGCCGAGGGACGCGATTCTAAAAAGTCAACATGGCTCTTATTTTCTCCGGAGACTCCGGATCAAGCTGGTTCTTTGGAGAAATTTCTGAGTATCTTTTCATCTCACGGGGTCAACTTGAGCCACATCGAATCTCGCTCCTCTGCCAGGAGACCAGGCTATGAATTCATGGTCGAGTGTGAACACGAATCCGGGGACTTTGGAGCGGCTTTGGATGAGCTGAAGAAGAGCACTGGATATCTCAACATTATTTCTAGAAACTACAAGGATAATAGATCTGCGGTGCCTTGGTTCCCTCGCCGTATTCGTGATCTGGATAGATTCGCTAATCAGATATTGTCTTATGGAGCCGAGCTCGACTCAGATCATCCAGGTTTCACAGACCCGGAGTACCGCGCGAGAAGAAAGTATTTTGCTGATATCGCTTACAACTACAAGCACGGCCAGCCGCTGCCTCACGTGAATTATACTAAAGAAGAAATTAACACATGGGGAGTAGTGTTCAGGAAGCTCACGGAACTCTACCCGACGCACGCCTGCAAGGAACACAATCATGTTTTTCCGCTTTTGATTGAAAACTGTGGTTATAGGGAGGACAATATTCCACAACTCGAAGACGTATCTAACTTTCTCAAAGATTGCACTGGATTCACTCTCCGTCCAGTGGCAGGTCTGCTTTCTTCACGAGATTTCCTCGCTGGCTTGGCGTTCCGTGTATTTCATAGTACTCAGTACATTAGGCACCATTCTCGTCCCCTTTACACTCCTGAACCTGATGTCTGCCACGAGCTCCTCGGACACGCGCCATTGTTCGCTGATCCCGCGTTCGCACAGTTCTCTCAGGAAATCGGCCTGGCTTCATTGGGAGCTCCTGACGATTTTATCGAAAGACTTGCAACGTGCTTTTGGTTTACTGTTGAATTTGGTCTGTGTCGGCAAGAAGGACAGCTGAAGGCATACGGCGCCGGTTTGCTGTCATCATTCGGTGAACTTCAATATTGTCTCTCAGATAAGCCACAGCTCCAAGAATTTGAACCAGAAATCACGGGAGAACAGAAGTATCCTATCACTGAATACCAACCAATATATTTCGTTGCTAACAGTTTTGAAAGTGCTAAGGAAAAGATGATCAAATTCGCCCAAACAATACCCCGTGACTTCGGAGTGAGATACAATCCCTACACCCAAAGTATTGACCTCCTAGATTCTCCACGGCAGATGAAAGATCTGCTGAAAGGCATCCGCCAAGAAATGGAACTGCTGGTTGGCACCATGGACAAGTTGTAG

Protein sequence:

>DPOGS203007-PA
MEPSVNILSTSPMDKPKLMQGGNYIAEGRDSKKSTWLLFSPETPDQAGSLEKFLSIFSSHGVNLSHIESRSSARRPGYEFMVECEHESGDFGAALDELKKSTGYLNIISRNYKDNRSAVPWFPRRIRDLDRFANQILSYGAELDSDHPGFTDPEYRARRKYFADIAYNYKHGQPLPHVNYTKEEINTWGVVFRKLTELYPTHACKEHNHVFPLLIENCGYREDNIPQLEDVSNFLKDCTGFTLRPVAGLLSSRDFLAGLAFRVFHSTQYIRHHSRPLYTPEPDVCHELLGHAPLFADPAFAQFSQEIGLASLGAPDDFIERLATCFWFTVEFGLCRQEGQLKAYGAGLLSSFGELQYCLSDKPQLQEFEPEITGEQKYPITEYQPIYFVANSFESAKEKMIKFAQTIPRDFGVRYNPYTQSIDLLDSPRQMKDLLKGIRQEMELLVGTMDKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: