MonarchBase - Protein-coding gene

DPOGS216038
Transcript	DPOGS216038-TA	1707 bp
Protein	DPOGS216038-PA	568 aa
Genomic position	DPSCF300067 - 337511-344857
RNAseq coverage	788x (Rank: top 16%)

Annotation
*Heliconius*	HMEL008929	0.0	74.82%
*Bombyx*	BGIBMGA009018-TA	0.0	82.60%
*Drosophila*	CG11208-PA	0.0	65.27%
EBI UniRef50	UniRef50_Q9UJ83	6e-180	53.44%	2-hydroxyacyl-CoA lyase 1 n=60 Tax=Eumetazoa RepID=HACL1_HUMAN
NCBI RefSeq	NP_001040193.1	0.0	82.60%	2-hydroxyphytanoyl-CoA lyase [Bombyx mori]
NCBI nr blastp	gi\|114051914	0.0	82.60%	2-hydroxyphytanoyl-CoA lyase [Bombyx mori]
NCBI nr blastx	gi\|114051914	0.0	82.60%	2-hydroxyphytanoyl-CoA lyase [Bombyx mori]

Group
Gene Ontology	GO:0030976	4.7e-48	thiamine pyrophosphate binding
	GO:0000287	2.3e-32	magnesium ion binding
	GO:0003824	2.1e-24	catalytic activity
KEGG pathway	dwi:Dwil_GK15680	0.0
	K12261 (HACL1)	maps->	Peroxisome
InterPro domain	[5-171] IPR012001	4.7e-48	Thiamine pyrophosphate enzyme, N-terminal TPP-binding domain
	[193-322] IPR012000	2.3e-32	Thiamine pyrophosphate enzyme, central domain
	[389-547] IPR011766	2.1e-24	Thiamine pyrophosphate enzyme, C-terminal TPP-binding
Orthology group	MCL11921		Single-copy universal gene

Nucleotide sequence:

>DPOGS216038-TA
ATGGGGATCGACGGGAACAATATACTCGCTGAAAGCTTGAAGCGACAAGGCATTGAATATGTTTTTGGGATTGTTGGTATTCCTGTAATAGAGACTTCATTAGCTTTTCAAGCTGCAGGTCTCAAGTACATTGGGATGCGAAATGAACAGGCAGCCTGTTATGCTGCTCAAGCTATTGGCTATTTAACAGGTAAACCAGGAGTATGTCTGGTTGTATCTGGCCCTGGTCTCTTACATTGTATTGGAGGTATGGCCAATGCTCAAGTTAACTGTTGGCCGCTGTTAGTCATAGCCGGATCTTGCCCGGAAGACCATGAAGGCATTGGCGGTTTCCAGGAATGGCTGCAGGTGGAGTCATCTCGTCAGTATAGTAAATATGCAGCCCGACCACCTTCCCCACGACTTATTCCACTACATGTAGAAAAAGCAATCAGATATGCCAGCTCCGGACGTCCAGGTGTCGCTTATCTTGATATGCCTGCTACCTTATTGACGGCTGAAGCTGATGAAGATAAGGTTCCTTTAGACTACTACTCAGCGGATCCAGTTAGTTTGGCTCACCCAAATCCAGTACTGGTAAATGAAGCAGCTGACCTATTGTCCAAGGCTGAAAGACCCCTCATCATAGTTGGCAAAGGAGCTGCTTATGGAAAAGCAGAAGAGGCTATCACCAAGCTTGTGGAGAATATTAAAGTACCATTCCTACCGACTCCTATGGGCAAAGGAGTGGTCCCAGACGAGTCTCAATACTGTGTGTCAACCGCTCGCACTCAGGCGCTACTTGGGGCTGACGTCATACTGCTGTTGGGGGCAAGAATGAATTGGATGATGCATTTCGGACAGGTCCCGAGATATGCAGCCAATGTTAAGATTATTCAAGTGGATATAGCTCCCGAAGAATTCCACAACAGTGTCAAATCAGAAGTGGCCGTCCATTCAGATATCAAACCGTTTGTGGAAGCGCTCACAAATAAACTAGCGGAGAAAAAGTTTTCATTACAAAATAATAGTCCCTGGTGGCAAGCATTGAAGGAAAAACAAAAGAAAAACACAGAATTTGTTAAGGCACAAGCAGCCGATAAATCCCTGCCACTGAATTACTATGCAGTTTTTAAAGCTGTTCAAGAAAATATCCCAAAGGATTCAATAATAGTGAGTGAAGGCGCTAACACTATGGACATCGGCCGCGGGATATTACTCAATAACAAACCGAGGCATCGTCTGGACGCGGGAACATTTGGCACTATGGGGGTCGGCCCCGGGTTCGCCGTAGCTGCGGCGCAGTGGTGCCGTGACCACGCTCCAGATAAACGAGTGATTTGTGTTGAAGGAGATTCTGCGTTTGGTTTCTCAGGTATGGAAATTGAGACAATGTTCCGCTACAAGTTGCCAGTGATTATTGTGATTGTGAACAACAACGGCATTTACAGCGGCTTCGACAAAGAAATGATGACGGAGATACAAAACTCCGGCGATCTTGCCCAGTGTACTCCACCCACAGCACTGTCAACGGAAGTGAGATATGAAAAAATGATGGAAATGTTTGGATCAAGCGGCCATTTCTGTCGTACAGTTGAAGAAATCGAAAATGCCTTGAAATCAGCTATTAAAGTAACCGACAGACCCAGTATTATAAATATTGCCATTAACCCACAATCCAACAGAAAACCTCAAACATTCAACTGGCTGACTGAATCAAAACTATAA

Protein sequence:

>DPOGS216038-PA
MGIDGNNILAESLKRQGIEYVFGIVGIPVIETSLAFQAAGLKYIGMRNEQAACYAAQAIGYLTGKPGVCLVVSGPGLLHCIGGMANAQVNCWPLLVIAGSCPEDHEGIGGFQEWLQVESSRQYSKYAARPPSPRLIPLHVEKAIRYASSGRPGVAYLDMPATLLTAEADEDKVPLDYYSADPVSLAHPNPVLVNEAADLLSKAERPLIIVGKGAAYGKAEEAITKLVENIKVPFLPTPMGKGVVPDESQYCVSTARTQALLGADVILLLGARMNWMMHFGQVPRYAANVKIIQVDIAPEEFHNSVKSEVAVHSDIKPFVEALTNKLAEKKFSLQNNSPWWQALKEKQKKNTEFVKAQAADKSLPLNYYAVFKAVQENIPKDSIIVSEGANTMDIGRGILLNNKPRHRLDAGTFGTMGVGPGFAVAAAQWCRDHAPDKRVICVEGDSAFGFSGMEIETMFRYKLPVIIVIVNNNGIYSGFDKEMMTEIQNSGDLAQCTPPTALSTEVRYEKMMEMFGSSGHFCRTVEEIENALKSAIKVTDRPSIINIAINPQSNRKPQTFNWLTESKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: