MonarchBase - Protein-coding gene

DPOGS214377
Transcript	DPOGS214377-TA	1371 bp
Protein	DPOGS214377-PA	456 aa
Genomic position	DPSCF300020 + 888902-890272
RNAseq coverage	266x (Rank: top 40%)

Annotation
*Heliconius*	HMEL005451	0.0	88.21%
*Bombyx*	BGIBMGA004001-TA	0.0	86.15%
*Drosophila*	Hmgs-PB	2e-169	61.59%
EBI UniRef50	UniRef50_B4MPF2	3e-166	60.66%	GK21611 n=8 Tax=root RepID=B4MPF2_DROWI
NCBI RefSeq	NP_001093297.1	0.0	86.15%	3-hydroxy-3-methylglutaryl-CoA synthase [Bombyx mori]
NCBI nr blastp	gi\|153791703	0.0	86.15%	3-hydroxy-3-methylglutaryl-CoA synthase [Bombyx mori]
NCBI nr blastx	gi\|153791703	0.0	86.15%	3-hydroxy-3-methylglutaryl-CoA synthase [Bombyx mori]

Group
Gene Ontology	GO:0008299	6.2e-216	isoprenoid biosynthetic process
	GO:0004421	6.2e-216	hydroxymethylglutaryl-CoA synthase activity
	GO:0008152	2.5e-60	metabolic process
	GO:0003824	2.5e-60	catalytic activity
KEGG pathway	dan:Dana_GF13593	4e-169
	K01641 (E2.3.3.10, pksG)	maps->	Terpenoid backbone biosynthesis
			Valine, leucine and isoleucine degradation
			Butanoate metabolism
			Synthesis and degradation of ketone bodies
InterPro domain	[6-455] IPR010122	6.2e-216	Hydroxymethylglutaryl-CoA synthase, eukaryotic
	[178-455] IPR013746	1.4e-108	Hydroxymethylglutaryl-coenzyme A synthase C-terminal
	[6-177] IPR013528	2.9e-93	Hydroxymethylglutaryl-coenzyme A synthase, N-terminal
	[178-455] IPR016039	2.5e-60	Thiolase-like
	[6-174] IPR016038	3.1e-31	Thiolase-like, subgroup
Orthology group	MCL10996		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214377-TA
ATGGCTAATAGAGTCGAAAATGTTGGCATTCTGGCTATGGAGATATATATTCCTTCTCAATATGTAGCTCAGGAAGAATTAGAAAAATTCGATGGTGTGGATACTGGTAAATATACAATCGGGTTAGGCCAGAGTAAAATGGGATTTTGTTCAGATAGAGAAGACATAAACTCGATTTGTATGACTGCTTTGCACCGCCTCATTGAGAATAACAACATAAACCTTCATGACATTGGAAGGTTAGAGGTTGGTACAGAAACTATTATTGATAAAAGCAAAAGTGTAAAAACATTTCTCATGACATTATTTGCCAAAGAGGGTGCAACTGATATTGAAGGCATTGACACCACAAATGCTTGTTATGGTGGGACAGCTGCATTGTTCAATACTATTAATTGGGTGGAATCTTCTTCTTGGGATGGCAGGAAGGCTATTGTTGTGGCTGGTGACATTGCTGTATATGGCAAAGGCCCAGCTCGGCCGACTGGAGGTGCAGGAGCAGTTGCTATGCTCATTGGCCCTGATGCACCATTAGTATTTGATTGTGGTGTACGTGCATCTTATATGACTCATGCATATGATTTCTACAAGCCAGATCTTGCATCAGAATTTCCTTATGTGGATGGCAAGCTATCAATTCAGTGTTATCTTAATGCTTTAGACAAATGTTATAATTTGTTTTGTGATAAAATGAAAAAGGTAAACCCGGACTTTAAAGGTCTTTTGAGCCTGGACGGCATGTTATTCCATTCTCCTTATTGTAAGCTCGTTCAAAAATCACTAGCCAGAGTGTCTTTCAATGATTTCTTGAATTGTGCTGAAGATGATAGAGAAAAACAATTCCCGGGACTTTCACAGTTCAGCAAACACCAAAGATCTGAAACATATTTTGATAGAGATCTTGAAAAGGCATTTATGGCTTACAGCAAAGATCTGTTTGAAGAAAAAACTAAGCCGTCTCTGTACATTGCAAGAAACGTCGGCAATATGTACACCGCCTCACTGTATGGTGGTTTAGTTTCATATTTAATCAGCAAGTCACCAGAGCAGTTAATTGGCAAGAAATTTGCCTTGTTCTCTTACGGCTCTGGATTGGCATCGACTATGTACTCTGTCAATATATGCAATGATATGAGCGCTGGTTCCAAACTAGAAAAGCTCATTAATTCTCTTCATAATAATGTAGCTATGTTAGATAAAAGAATTAATGTTGAACCGCAAGCCTTCTCAGATTCCATGCAAATTAGGACAGAGAATTATCACACGGCACCATACGAGCCATCGGGTTCCATTGATATACTTTTCCCTGGAACGTACTATCTGGTGAAGATCGATGACCAAAGAAGACGGACATATGATAGAAAATTATAA

Protein sequence:

>DPOGS214377-PA
MANRVENVGILAMEIYIPSQYVAQEELEKFDGVDTGKYTIGLGQSKMGFCSDREDINSICMTALHRLIENNNINLHDIGRLEVGTETIIDKSKSVKTFLMTLFAKEGATDIEGIDTTNACYGGTAALFNTINWVESSSWDGRKAIVVAGDIAVYGKGPARPTGGAGAVAMLIGPDAPLVFDCGVRASYMTHAYDFYKPDLASEFPYVDGKLSIQCYLNALDKCYNLFCDKMKKVNPDFKGLLSLDGMLFHSPYCKLVQKSLARVSFNDFLNCAEDDREKQFPGLSQFSKHQRSETYFDRDLEKAFMAYSKDLFEEKTKPSLYIARNVGNMYTASLYGGLVSYLISKSPEQLIGKKFALFSYGSGLASTMYSVNICNDMSAGSKLEKLINSLHNNVAMLDKRINVEPQAFSDSMQIRTENYHTAPYEPSGSIDILFPGTYYLVKIDDQRRRTYDRKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: