MonarchBase - Protein-coding gene

DPOGS206781
Transcript	DPOGS206781-TA	1665 bp
Protein	DPOGS206781-PA	554 aa
Genomic position	DPSCF300001 - 5700113-5707356
RNAseq coverage	852x (Rank: top 15%)

Annotation
*Heliconius*	HMEL009822	89.96%
*Bombyx*	BGIBMGA000563-TA	88.06%
*Drosophila*	ple-PB	69.72%
EBI UniRef50	UniRef50_G6CT03	100.00%	Tyrosine hydroxylase n=67 Tax=Bilateria RepID=G6CT03_DANPL
NCBI RefSeq	NP_001138794.1	88.06%	tyrosine hydroxylase [Bombyx mori]
NCBI nr blastp	gi\|296040337	90.04%	tyrosine hydroxylase [Papilio polytes]
NCBI nr blastx	gi\|296040337	90.04%	tyrosine hydroxylase [Papilio polytes]

Group
Gene Ontology	GO:0016714	1.8e-295	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen, reduced pteridine as one donor, and incorporation of one atom of oxygen
	GO:0055114	1.8e-295	oxidation-reduction process
	GO:0009072	2.4e-246	aromatic amino acid family metabolic process
	GO:0005506	2.4e-246	iron ion binding
	GO:0004497	2.4e-246	monooxygenase activity
	GO:0042423	2e-215	catecholamine biosynthetic process
	GO:0004511	2e-215	tyrosine 3-monooxygenase activity
KEGG pathway	tca:654918	0.0
	K00501 (TH)	maps->	Isoquinoline alkaloid biosynthesis
			Tyrosine metabolism
			Parkinson's disease
InterPro domain	[1-551] IPR019773	1.8e-295	Tyrosine 3-monooxygenase-like
	[105-551] IPR001273	2.4e-246	Aromatic amino acid hydroxylase
	[102-548] IPR005962	2e-215	Tyrosine 3-monooxygenase
	[216-547] IPR019774	8.5e-175	Aromatic amino acid hydroxylase, C-terminal
Orthology group	MCL14257		Single-copy universal gene

Nucleotide sequence:

>DPOGS206781-TA
ATGGCCGTCGCAGCAGCCCAGAAAAATCGCGAAATGTTCGCCATCAAGAAGTCTTACAGCATTGAGAACGGCTATCCATCCCGCCGTCGTTCACTGGTAGACGATGCCCGTTTCGAAACCCTGGTAGTCAAACAGACCAAACAAAGTGTACTTGAAGAAGCTCGTGCCCGTGCTAATGACTCTGGTTTGGATTCCGAATTCATCCAAGATGTCTCTCAAATTGATGACGCCGAGAAGACCGAAGGTGTCCAAAACGAAGATTGTAAAAACGGTCACCTTGAAGGAGGTAACGAGACTGGTACAAAATCAGATGAAGATTACACTCTTACTGAAGAGGAAGTTATTCTACAAAATGCTGCAAGTGAAAGCCCTGAAGCAGAACAGGTGATCCAAAAAGCTGCTTTACTTTTGCGTATGCGAGATGGAATGGGCTCTCTTGCTCGCATTCTTAAAACAATTGATAACTATAAAGGTTGTGTTGACCATCTTGAAACTCGGCCCTCCCAAATATCAGGAGTCCAATTCGATGCACTCGTAAAGGTCAGCATGACCCGCATCAACCTGCTCCAACTTATCCGGGCACTCCGTCAATCAACCTCATTTGCCGGTGTAAATTTGCTTTCGGATAATATTTCAAACAAAACTCCATGGTTCCCTCGTCATGCTTCCGATCTTGACAACTGTAACCATCTTATGACTAAATTTGAGCCAGAACTTGATATGAATCACCCAGGATTCGCTGATAAGGAATACAGAGAACGTAGGAAACAAATTGCTGCTGTCGCTTTTGCATACAAATATGGTGATCCATTTCCAGCGATTACTTACACTGAAAGCGAGAATGCTACCTGGCAACGAGTATTCAATACTGTACTGGATTTGATGCCAAAACATGCATGCCGTGAATATAAGGCCGCTTTTGGTAAATTACAAGCTGCCGAAATCTTCGTGCCACACCGCATTCCCCAGTTGGAGGATGTAAGCAACTTCCTCCGCAAACATACTGGTTTCACCCTGCGCCCAGCTGCAGGATTACTTACGGCTCGAGACTTTTTGGCTTCTCTCGCTTTTCGTGTATTCCAATCAACACAATACGTGCGCCACGCTAACTCACCCTTCCACACTCCTGAACCGGACTGTATTCATGAACTATTAGGACATATTCCACTTCTAGCTGACCCAAGCTTTGCTCAATTTTCTCAAGAAATTGGTCTTGCTTCACTCGGCGCTTCTGATTCCGAAATCGAAAAGCTTTCTACGGTTTACTGGTTCACGGTCGAATTCGGTCTTTGTAAGGAGAACCAACAACTGAAGGCATACGGAGCAGCTCTTCTATCGTCTATCGGAGAACTGCTTCATGCTTTAAGTGACAAGCCTGAACTGCGACCCTTCGAACCATCTTCTACTTCCATTCAACCTTACCAAGACCAAGAGTACCAACCAATTTATTACGTGGCTGAAAGCTTTGAGGATGCAAAAGATAAATTCAGACGCTGGGTATCAACTATGTCAAGACCATTCGAAGTGCGTTTCAACCCACACACAGAGCGCGTGGAAATCCTCGACTCCGTAGACAAACTTGAAACACTCATATGGCAATTGAATACCGAGATGCTCCACCTCACTAATGCTATCAAAAAACTTAAGGATTCATCCTTTGAGTAA

Protein sequence:

>DPOGS206781-PA
MAVAAAQKNREMFAIKKSYSIENGYPSRRRSLVDDARFETLVVKQTKQSVLEEARARANDSGLDSEFIQDVSQIDDAEKTEGVQNEDCKNGHLEGGNETGTKSDEDYTLTEEEVILQNAASESPEAEQVIQKAALLLRMRDGMGSLARILKTIDNYKGCVDHLETRPSQISGVQFDALVKVSMTRINLLQLIRALRQSTSFAGVNLLSDNISNKTPWFPRHASDLDNCNHLMTKFEPELDMNHPGFADKEYRERRKQIAAVAFAYKYGDPFPAITYTESENATWQRVFNTVLDLMPKHACREYKAAFGKLQAAEIFVPHRIPQLEDVSNFLRKHTGFTLRPAAGLLTARDFLASLAFRVFQSTQYVRHANSPFHTPEPDCIHELLGHIPLLADPSFAQFSQEIGLASLGASDSEIEKLSTVYWFTVEFGLCKENQQLKAYGAALLSSIGELLHALSDKPELRPFEPSSTSIQPYQDQEYQPIYYVAESFEDAKDKFRRWVSTMSRPFEVRFNPHTERVEILDSVDKLETLIWQLNTEMLHLTNAIKKLKDSSFE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: