MonarchBase - Protein-coding gene

DPOGS209858
Transcript	DPOGS209858-TA	1344 bp
Protein	DPOGS209858-PA	447 aa
Genomic position	DPSCF300451 + 64114-73448
RNAseq coverage	140x (Rank: top 55%)

Annotation
*Heliconius*	HMEL016973	1e-174	91.24%
*Bombyx*	BGIBMGA002346-TA	0.0	81.34%
*Drosophila*	CtBP-PE	0.0	83.62%
EBI UniRef50	UniRef50_O46036	0.0	83.62%	C-terminal-binding protein n=88 Tax=Bilateria RepID=CTBP_DROME
NCBI RefSeq	XP_972241.1	0.0	80.69%	PREDICTED: similar to 2-hydroxyacid dehydrogenase [Tribolium castaneum]
NCBI nr blastp	gi\|91090312	0.0	80.69%	PREDICTED: similar to 2-hydroxyacid dehydrogenase [Tribolium castaneum]
NCBI nr blastx	gi\|91090312	0.0	81.34%	PREDICTED: similar to 2-hydroxyacid dehydrogenase [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	2.7e-64	binding
	GO:0016616	2e-55	oxidoreductase activity, acting on the CH-OH group of donors, NAD or NADP as acceptor
	GO:0048037	2e-55	cofactor binding
	GO:0055114	2e-55	oxidation-reduction process
	GO:0008152	1.3e-29	metabolic process
	GO:0051287	1.3e-29	NAD binding
KEGG pathway	tca:660954	0.0
	K04496 (CTBP)	maps->	Pathways in cancer
			Wnt signaling pathway
			Chronic myeloid leukemia
			Notch signaling pathway
InterPro domain	[142-318] IPR016040	2.7e-64	NAD(P)-binding domain
	[134-318] IPR006140	2e-55	D-isomer specific 2-hydroxyacid dehydrogenase, NAD-binding
	[32-352] IPR006139	1.3e-29	D-isomer specific 2-hydroxyacid dehydrogenase, catalytic domain
Orthology group	MCL11354		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209858-TA
ATGGACAAACGCAAGATGCTGCCAAAGAGAGCGCGCATGGATAGCATGCGGGGTCCCATCGCTAACGGACCACTGCAGTCGAGGCCCCTGGTGGCGTTGCTCGACGGTAGAGACTGCACCGTCGAGATGCCCATACTGAAGGACGTGGCTACCGTCGCCTTCTGCGACGCACAGTCCACATCCGAAATACACGAGAAGGTGCTGAACGAGGCAGTCGGCGCTCTCATGTGGCACACCATCATACTCACCAAGGAGGACCTGGAGAAGTTCAAGGCGCTCAGGATCATTGTGCGCATCGGCTCCGGCGTAGACAACATCGACGTCAAGGCCGCCGGCGAGTTGGGCATAGCGGTTTGTAACGTGCCGGGTTACGGCGTTGAGGAGGTGGCCGACACCACCATGTGTCTCATACTGAACCTCTACAGACGGACGTACTGGCTGGCCAACATGGTGCGCGAGGGGAAGAAGTTCACAGGTCCGGAGCAGGTCCGCGAGGCGGCGGCCGGCTGTGCCCGTATCCGCGGCGACACGCTGGGTATCGTGGGTCTGGGCCGGATCGGCTCGGCCGTGGCGCTCCGGGCGAAGGCCTTCGGCTTCAACGTCATCTTCTACGACCCCTACCTGCCCGACGGCATCGAGAAGTCGCTGGGGCTCACCAGGGTCTACACGCTGCAGGATCTACTATTCCAGAGTGACTGTGTGTCATTGCACTGCAGCTTAAACGAACACAATCACCATCTTATTAATGAATTTACTATCAAACAAATGCGTCCAGGGGCGTTCCTGGTGAACACGGCCCGCGGCGGGCTGGTCGACGACGAGGGTCTAGCGGCGGCTCTCAAACAGGGACGGATCCGGGCGGCGGCGCTAGACGTGCACGAGAACGAACCCTTCAACGTCTTCCAGGGTCCGCTGAAGGAGGCTCCCAACGTCCTGTGCACGCCTCACGCCGCCTTCTACTCGGACGCCTCCGCCCAGGAACTGAGAGAAATGGCCGCCTCCGAGATACGACGAGCTATCGTCGGACGTATACCTGACTGTCTCAGGAACTGTGTCAATAAGGACTACTTCCTAGCGGGCGCCGCGCCGGTGCTGGCGCCGCCTCCGCCCATCGCAGCGCCTCAACCCCCAGCGCCCGCCTACACTGAAGCGGGTATGAACGGCGGCTACTACGGCGGCGGGGGCGCTCAGGCCGCTCACTCCACGACGGCGGTCCACGAGGCGCCCGCGCTGCCGCCCCAGACGGCGCCGCAACCTCCGCCTCAACCGCCCATCACGCTCCCGATAAACACGTCGGACCCGGCCAATCATCAGCTGAAGCAGGAGAGCTCGGACGTTCACTAA

Protein sequence:

>DPOGS209858-PA
MDKRKMLPKRARMDSMRGPIANGPLQSRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTSEIHEKVLNEAVGALMWHTIILTKEDLEKFKALRIIVRIGSGVDNIDVKAAGELGIAVCNVPGYGVEEVADTTMCLILNLYRRTYWLANMVREGKKFTGPEQVREAAAGCARIRGDTLGIVGLGRIGSAVALRAKAFGFNVIFYDPYLPDGIEKSLGLTRVYTLQDLLFQSDCVSLHCSLNEHNHHLINEFTIKQMRPGAFLVNTARGGLVDDEGLAAALKQGRIRAAALDVHENEPFNVFQGPLKEAPNVLCTPHAAFYSDASAQELREMAASEIRRAIVGRIPDCLRNCVNKDYFLAGAAPVLAPPPPIAAPQPPAPAYTEAGMNGGYYGGGGAQAAHSTTAVHEAPALPPQTAPQPPPQPPITLPINTSDPANHQLKQESSDVH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: