MonarchBase - Protein-coding gene

DPOGS201038
Transcript	DPOGS201038-TA	1104 bp
Protein	DPOGS201038-PA	367 aa
Genomic position	DPSCF300299 - 167274-171038
RNAseq coverage	327x (Rank: top 35%)

Annotation
*Heliconius*	HMEL012156	0.0	82.79%
*Bombyx*	BGIBMGA008076-TA	3e-157	78.96%
*Drosophila*	CG17691-PE	4e-147	66.48%
EBI UniRef50	UniRef50_P21953	8e-145	66.57%	2-oxoisovalerate dehydrogenase subunit beta, mitochondrial n=230 Tax=root RepID=ODBB_HUMAN
NCBI RefSeq	XP_974707.1	2e-160	75.36%	PREDICTED: similar to AGAP007531-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91076836	4e-159	75.36%	PREDICTED: similar to AGAP007531-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91076836	3e-156	76.18%	PREDICTED: similar to AGAP007531-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	1.4e-42	metabolic process
	GO:0003824	1.4e-42	catalytic activity
KEGG pathway	tca:663575	6e-160
	K00167 (E1.2.4.4B, bkdA2)	maps->	Valine, leucine and isoleucine degradation
InterPro domain	[46-221] IPR005475	1.5e-57	Transketolase-like, pyrimidine-binding domain
	[240-363] IPR015941	1.4e-42	Transketolase-like, C-terminal
	[230-367] IPR009014	5e-42	Transketolase, C-terminal/Pyruvate-ferredoxin oxidoreductase, domain II
	[236-344] IPR005476	3e-36	Transketolase, C-terminal
Orthology group	MCL15091		Single-copy universal gene

Nucleotide sequence:

>DPOGS201038-TA
ATGAGTTTCTTAGCTCAAAAACTTTTCAGTTTCGGTGGTGCTATTAAAAATGTAAACAAAAATTCTATTAGACTTTCTTCTCATTTCATATATCATCCAGATAATGAAAAACCCATTGAAGGAGAAACAAAAAAGATGAACATGATGCAAGCTATAAACGATGCAATGGACATCACACTCAAAAACGATCCAACGGCTGTTTTATTCGGAGAAGATGTCGGCTTTGGAGGTGTTTTTAGATGTGCCTTGGGATTACAGGAAAAGTATGGCAAAGACAGAGTATTTAACACACCATTGTGTGAGCAGGGTATTGCAGGGTTTGGTATTGGATTAGCGACGGCCGGTGCTACTGCCATAGCTGAAATACAGTTTGCAGATTATATATTCCCAGCCTTTGATCAGCTTGTAAATGAAGCAGCTAAGGCTCGATACAGATCGGGCGGTCAGTTTGACTGCGGCGCGTTGACGGTTCGCGCTCCGTGTGGTGCCGTGGGCCACGGAGGGTTGTACCACTCACAGAGCCCTGAGGCATTCTTCGCTCATGCAGCTGGGCTCAAGGTGATAGTACCAAGAGGTCCAATTGCTGCGAAAGGTCTTTTATTGGCGTGCATCCAAGAAAGGGACCCCTGTATTTTCTTAGAACCAAAAATTTTATACAGATCTGCCAATGAAGAAGTCCCTATTGATAGTTATACTTTACCCATCGGAAAGGCTCAAATTTTAAGAGAAGGTAATCAAGTCACTTTAATAGCGTGGGGTACACAAGTACACGTTTTACTGGAAGTTGCTAAACTAGCAAAGGAGCAGTTTGACGTTAGTTGTGAGGTCATAGATCTCATGTCAATACAACCGTGGGACGAAGTGACTGTTTGTGATTCAGTGAAAAAAACCGGAAGATGTCTAATAGCGCATGAAGCTCCACTCACTTGCGGTTTCGGCGCTGAATTGGCAGCCACTATTCAGGAGGAATGCTTTCTTCACCTGGAGGCACCTATATCACGTGTGACAGGCTGGGATGCGCCCTTCCCTCATGTGTTCGAACCCTTCTACTTACCAGACCGTTGGCGATGTCTAGAAGCCATCAAACAATTGGTGCAGTACTAG

Protein sequence:

>DPOGS201038-PA
MSFLAQKLFSFGGAIKNVNKNSIRLSSHFIYHPDNEKPIEGETKKMNMMQAINDAMDITLKNDPTAVLFGEDVGFGGVFRCALGLQEKYGKDRVFNTPLCEQGIAGFGIGLATAGATAIAEIQFADYIFPAFDQLVNEAAKARYRSGGQFDCGALTVRAPCGAVGHGGLYHSQSPEAFFAHAAGLKVIVPRGPIAAKGLLLACIQERDPCIFLEPKILYRSANEEVPIDSYTLPIGKAQILREGNQVTLIAWGTQVHVLLEVAKLAKEQFDVSCEVIDLMSIQPWDEVTVCDSVKKTGRCLIAHEAPLTCGFGAELAATIQEECFLHLEAPISRVTGWDAPFPHVFEPFYLPDRWRCLEAIKQLVQY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: