MonarchBase - Protein-coding gene

DPOGS201755
Transcript	DPOGS201755-TA	1038 bp
Protein	DPOGS201755-PA	345 aa
Genomic position	DPSCF300279 + 20556-27082
RNAseq coverage	220x (Rank: top 45%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA002650-TA	2e-70	84.03%
*Drosophila*	CG10399-PA	2e-104	57.53%
EBI UniRef50	UniRef50_Q2F685	3e-155	81.09%	Hydroxymethylglutaryl-CoA lyase isoform 1 n=2 Tax=Bombyx mori RepID=Q2F685_BOMMO
NCBI RefSeq	NP_001040133.1	6e-156	81.09%	hydroxymethylglutaryl-CoA lyase [Bombyx mori]
NCBI nr blastp	gi\|114051864	1e-154	81.09%	hydroxymethylglutaryl-CoA lyase [Bombyx mori]
NCBI nr blastx	gi\|114051864	7e-151	81.09%	hydroxymethylglutaryl-CoA lyase [Bombyx mori]

Group
Gene Ontology	GO:0008152	4.4e-67	metabolic process
	GO:0003824	4.4e-67	catalytic activity
KEGG pathway	dmo:Dmoj_GI17729	2e-105
	K01640 (E4.1.3.4, HMGCL, hmgL)	maps->	Peroxisome
			Valine, leucine and isoleucine degradation
			Butanoate metabolism
			Geraniol degradation
			Synthesis and degradation of ketone bodies
InterPro domain	[37-313] IPR013785	4.4e-67	Aldolase-type TIM barrel
	[46-293] IPR000891	9.8e-52	Pyruvate carboxyltransferase
Orthology group	MCL12402		Multiple-copy universal gene

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS201755-TA
ATGATTGTTAGTGGAGATCTTGTAATTAAGGGCTTGTACATCTGCATTCCCGAAAATATCAACAACGCTAAAATTGACGATAACACGAAGGACAGTCAAGCGGTTCCAGATATTCGAATATACGAAGTAGGTCCAAGAGACGGTCTTCAAAATGAGTCTAAGTTTGTACCAACTGATATAAAAGTAGAACTTATTCACAAACTCTCTGAAGCAGGAATCAAAGATATTGAATGTGCCAGCTTTGTAAGTCCAAAATGGGTAAAACAAATGAGTGATGGTACTGAAGTTATGAAAACTATCAAAAGGGTACCTGGTGTTAACTATCCAGTATTAATACCCAATCTAAAAGGATATGAGGCAGCTAAACAATGTAATATTGAAGAAATAGCAATATTTCCTGCTGGTTCAGAGGGTTTCTCTCAGAAGAATTTAAATTGTTCTATAGAAGAAGGATTAAAACGGTTCAAACTGGTCGCTGATCAGGCTATTAAAGATGGAATGAGAGTCAGAGGTTACGTTTCATGTGTTGTAGGCTGTCCCTATGATGGTCCAATAAATCCAAAAGGGATTGCCAAGATAACTGAAGAGTTGTTTACAATGGGTTGCTATGAGGTATCACTGGGTGACACTATCGGAGTGGGAACGGCCGGATCGGTGAAGAAATTAATGAATGAGGTTATAAAAGTAGCAACACCTGACAAAATAGCACTTCACTTCCATGATACATATGGACAGGGGCTATCTAACTTACTGGCTGGCTTGGAGTTCGGAATTAAAACTGTGGATTCGTCTGTGTCCGGACTTGGCGGGTGTCCGTATGCCCGTGGTGCGAGCGGGAACCTTGCTACTGAGGACCTTGTATACTTTCTCTACGGGCTAGGAGTGAACACTAACATAGACCTGGTCAAACTCATAGAAGCTGGCCGCTACATATCAAACTTCCTCGCAAAACCGACCGAGTCCAAAGTCAACCGTGCCATCGGGGATAGATTTAAAAATCATAAAGATATTATAAAAATAGCGTCTTGTACTTTATAA

Protein sequence:

>DPOGS201755-PA
MIVSGDLVIKGLYICIPENINNAKIDDNTKDSQAVPDIRIYEVGPRDGLQNESKFVPTDIKVELIHKLSEAGIKDIECASFVSPKWVKQMSDGTEVMKTIKRVPGVNYPVLIPNLKGYEAAKQCNIEEIAIFPAGSEGFSQKNLNCSIEEGLKRFKLVADQAIKDGMRVRGYVSCVVGCPYDGPINPKGIAKITEELFTMGCYEVSLGDTIGVGTAGSVKKLMNEVIKVATPDKIALHFHDTYGQGLSNLLAGLEFGIKTVDSSVSGLGGCPYARGASGNLATEDLVYFLYGLGVNTNIDLVKLIEAGRYISNFLAKPTESKVNRAIGDRFKNHKDIIKIASCTL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: