MonarchBase - Protein-coding gene

DPOGS212210
Transcript	DPOGS212210-TA	1050 bp
Protein	DPOGS212210-PA	349 aa
Genomic position	DPSCF300323 + 127929-128978
RNAseq coverage	45x (Rank: top 71%)

Annotation
*Heliconius*	HMEL013284	3e-55	34.02%
*Bombyx*	BGIBMGA001156-TA	1e-109	56.17%
*Drosophila*	CG10749-PA	1e-51	35.14%
EBI UniRef50	UniRef50_Q9VU29	2e-49	35.14%	Malate dehydrogenase n=10 Tax=Drosophila RepID=Q9VU29_DROME
NCBI RefSeq	XP_002066060.1	1e-51	35.40%	GK22135 [Drosophila willistoni]
NCBI nr blastp	gi\|195436206	3e-50	35.40%	GK22135 [Drosophila willistoni]
NCBI nr blastx	gi\|195327277	6e-48	35.46%	GM25384 [Drosophila sechellia]

Group
Gene Ontology	GO:0055114	1.4e-64	oxidation-reduction process
	GO:0006108	1.4e-64	malate metabolic process
	GO:0030060	1.4e-64	L-malate dehydrogenase activity
	GO:0016616	5.1e-36	oxidoreductase activity, acting on the CH-OH group of donors, NAD or NADP as acceptor
	GO:0003824	5.1e-36	catalytic activity
	GO:0005975	5.1e-36	carbohydrate metabolic process
	GO:0005488	5.5e-21	binding
	GO:0016491	5.2e-17	oxidoreductase activity
	GO:0044262	1.1e-11	cellular carbohydrate metabolic process
KEGG pathway	dwi:Dwil_GK22135	4e-51
	K00026 (MDH2)	maps->	Citrate cycle (TCA cycle)
			Pyruvate metabolism
			Carbon fixation in photosynthetic organisms
			Glyoxylate and dicarboxylate metabolism
InterPro domain	[3-348] IPR010097	1.4e-64	Malate dehydrogenase, type 1
	[174-338] IPR015955	5.1e-36	Lactate dehydrogenase/glycoside hydrolase, family 4, C-terminal
	[174-337] IPR022383	2.6e-23	Lactate/malate dehydrogenase, C-terminal
	[28-173] IPR016040	5.5e-21	NAD(P)-binding domain
	[29-158] IPR001236	5.2e-17	Lactate/malate dehydrogenase, N-terminal
	[27-341] IPR001557	1.1e-11	L-lactate/malate dehydrogenase
Orthology group	MCL44299		Lepidoptera specific

Nucleotide sequence:

>DPOGS212210-TA
ATGAATGTATTTAGTAGAAGTTTACAAAGAACACAATTTAAATCTCTTTGTTCTGTAAAAAATTATGTGCAGCGAAGAAATGTACAAATATCGATAGTCGGTGCCGCTAGTGACATTGGAAAGAACGTGGCATTGCTGTTGAAACGGAATCCTTATATTACGAGGCTGCACTTATACGATGACAATAATATAGTAAAAGGTATTGGCCTGGAATTGGAACAGATTCCCGGAGGACCCAAAGTAGCTTCATTTTCGGGGGATCCCTTTTTGTCGGCAGCTATAAGATACTCCAATCTGGTACTGCTTGTTTCGAGAACTCCTCGTAAACTCGGATTTTCCCGTGAACAGATGCTAGCCACGAATGCTATACCCGTATATAAATTGTGCAAAGTTTTGTCATACCAAAACCCTGATGCCTTTTTTGCCATTTCAACTAATCCTATAAATTCAATAATACCGTTTGCAAACTTATTATTAAAAAACTGCAACGCTCATAATCCGTTTAAACTCTTCGGTATAACCCACATCGACACGACGAGAGCCAGGGCCTTCATTTCAAACACTTTGAACGTTAATCCGAGACATCTCTATGTACCGGTGATCGGAGGGCACTCTGACGAAACGATAGTTCCCCTATTTTCAAATTTGTGTCCTAGCCATTATTGCGTCGGTCACTGTGAAGCTGACACATTGACACGTCTGATTAAGAAATCTGGCACAGAAGTGTTAAACCGAAAGCACGGCAGTGATTCATCGACGCTGGCTATGGCCTGGTCGATCAACGAATTCGTCCAAAATCTCATTGAAGCTCTGTACGGGAACTGTGTAATCGTGAACAGTTATACAGCGAATCCTCATTTTGGAACAAAATTTTTTTCAGGTCCGACTAAGGTTGGACCCGAAGGCGTCATAGAAACATGCAATAAGACCTTTCACATGAGTGATTATGAAAGCAAACTCCTGGAGCGCGCTGTTCCCATCATAAACAGGGACGTGGCTGAGGGTGAAGCGCATGTCAGCGTCCTCGAAAGTGCCAGGAGTTGTTACTAG

Protein sequence:

>DPOGS212210-PA
MNVFSRSLQRTQFKSLCSVKNYVQRRNVQISIVGAASDIGKNVALLLKRNPYITRLHLYDDNNIVKGIGLELEQIPGGPKVASFSGDPFLSAAIRYSNLVLLVSRTPRKLGFSREQMLATNAIPVYKLCKVLSYQNPDAFFAISTNPINSIIPFANLLLKNCNAHNPFKLFGITHIDTTRARAFISNTLNVNPRHLYVPVIGGHSDETIVPLFSNLCPSHYCVGHCEADTLTRLIKKSGTEVLNRKHGSDSSTLAMAWSINEFVQNLIEALYGNCVIVNSYTANPHFGTKFFSGPTKVGPEGVIETCNKTFHMSDYESKLLERAVPIINRDVAEGEAHVSVLESARSCY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: