MonarchBase - Protein-coding gene

DPOGS214110
Transcript	DPOGS214110-TA	1011 bp
Protein	DPOGS214110-PA	336 aa
Genomic position	DPSCF300014 - 1897168-1899755
RNAseq coverage	0x (Rank: top 99%)

Annotation
*Heliconius*	HMEL011408	2e-170	89.42%
*Bombyx*	BGIBMGA006160-TA	6e-161	83.44%
*Drosophila*	CG5955-PA	1e-148	76.53%
EBI UniRef50	UniRef50_Q9VPE8	2e-146	76.53%	CG5955 n=46 Tax=Opisthokonta RepID=Q9VPE8_DROME
NCBI RefSeq	NP_001037542.1	8e-166	85.41%	L-threonine dehydrogenase [Bombyx mori]
NCBI nr blastp	gi\|112982820	2e-164	85.41%	L-threonine dehydrogenase [Bombyx mori]
NCBI nr blastx	gi\|112982820	9e-163	85.41%	L-threonine dehydrogenase [Bombyx mori]

Group
Gene Ontology	GO:0005488	1.1e-31	binding
	GO:0044237	2.7e-16	cellular metabolic process
	GO:0003824	2.7e-16	catalytic activity
	GO:0050662	2.7e-16	coenzyme binding
KEGG pathway	bfo:BRAFLDRAFT_116658	3e-111
	K00060 (E1.1.1.103, tdh)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[29-238] IPR016040	1.1e-31	NAD(P)-binding domain
	[31-258] IPR001509	2.7e-16	NAD-dependent epimerase/dehydratase
Orthology group	MCL14550		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214110-TA
ATGGTAGCTATTGCTAGATTTGTAGCTAGATTTGTAGCTATACTATTGCTAGATTTACGGCCAATTACTTTTAAAATTGCTCGTGGACTTGGACAACTTGGTGTGGAGTGTGCGAAATATTTACGAGGAAAATATGGAAGAGAAAATGTTATACTGTCTGATATTATTAAACCAACGACTGAAGTGTTCAATGATGGACCATATATTTTCGCAGATATTCTAGATTTTAAAGGTCTCCAGAAAATTGTTGTCGATCACAGAGTGGACTGGTTGATACATTTTTCCGCTCTACTTAGTGCTATTGGCGAACAAAACGTACCATTAGCTGTCAGAGTTAATATAGAAGGAATGCACAATGTTATAGAGCTAGCAAAACAATATCGTCTCAGAATTTTCGTGCCAAGTACGATTGGAGCTTTCGGACCTGACTCACCGAGAAATCCTACACCTAATATAACTGTGCAGAGACCACGAACGATATATGGTGTTTCTAAAGTGCATGCGGAATTACTTGGTGAATATTATTACTATAAGTTTGGACTGGATTTCCGTTGCCTGAGATTCCCTGGAGTTATTTCCAGTGATCCTCCCGGTGGAGGTACTACAGACTATGCCATCGCAATATTCCATGATGTTCTTCGGAAGGGTCGCTACGAGTGTTACCTGAGGCCCGACACACGTCTACCAATGATGCATGTCAAGGATGCACTGAGAGCTCTCTCGAACTTTCTGGAAGCCCCCAACAAGATGTTACACAGACGAGTATACAACGTTACCTCAATGAGTTTCACCCCAGAAGAATTGGCTGATCATATGTTCAAATACATACCTGATTTTAGTATTTCGTATAAACCGGACAGTCGGCAGGATATCGCCGACTCCTGGCCTCAGGTTTTCGACGACAGCGAAGCCAGACGAGACTGGAACTGGAAGCCGGAAGTAGACTTGGATAATTTAGTTAAATTAATGCTGAAAGAAGTTAAGGAAAAGATAAATGATTACGACTATTGA

Protein sequence:

>DPOGS214110-PA
MVAIARFVARFVAILLLDLRPITFKIARGLGQLGVECAKYLRGKYGRENVILSDIIKPTTEVFNDGPYIFADILDFKGLQKIVVDHRVDWLIHFSALLSAIGEQNVPLAVRVNIEGMHNVIELAKQYRLRIFVPSTIGAFGPDSPRNPTPNITVQRPRTIYGVSKVHAELLGEYYYYKFGLDFRCLRFPGVISSDPPGGGTTDYAIAIFHDVLRKGRYECYLRPDTRLPMMHVKDALRALSNFLEAPNKMLHRRVYNVTSMSFTPEELADHMFKYIPDFSISYKPDSRQDIADSWPQVFDDSEARRDWNWKPEVDLDNLVKLMLKEVKEKINDYDY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: