MonarchBase - Protein-coding gene

DPOGS212201
Transcript	DPOGS212201-TA	618 bp
Protein	DPOGS212201-PA	205 aa
Genomic position	DPSCF300323 - 126065-126682
RNAseq coverage	86x (Rank: top 63%)

Annotation
*Heliconius*	HMEL013284	6e-35	35.15%
*Bombyx*	BGIBMGA000994-TA	3e-69	57.92%
*Drosophila*	Mdh2-PA	4e-36	36.87%
EBI UniRef50	UniRef50_B4L2P2	2e-30	33.67%	Malate dehydrogenase n=1 Tax=Drosophila mojavensis RepID=B4L2P2_DROMO
NCBI RefSeq	XP_003137632.1	2e-36	38.00%	malate dehydrogenase [Loa loa]
NCBI nr blastp	gi\|312069331	3e-35	38.00%	malate dehydrogenase [Loa loa]
NCBI nr blastx	gi\|66513092	4e-34	37.00%	PREDICTED: malate dehydrogenase, mitochondrial-like isoform 1 [Apis mellifera]

Group
Gene Ontology	GO:0055114	1.1e-40	oxidation-reduction process
	GO:0030060	1.1e-40	L-malate dehydrogenase activity
	GO:0006108	1.1e-40	malate metabolic process
	GO:0016616	7.7e-33	oxidoreductase activity, acting on the CH-OH group of donors, NAD or NADP as acceptor
	GO:0005975	7.7e-33	carbohydrate metabolic process
	GO:0003824	7.7e-33	catalytic activity
	GO:0005488	3.5e-05	binding
KEGG pathway	ame:408950	6e-36
	K00026 (MDH2)	maps->	Citrate cycle (TCA cycle)
			Pyruvate metabolism
			Carbon fixation in photosynthetic organisms
			Glyoxylate and dicarboxylate metabolism
InterPro domain	[1-200] IPR010097	1.1e-40	Malate dehydrogenase, type 1
	[40-200] IPR015955	7.7e-33	Lactate dehydrogenase/glycoside hydrolase, family 4, C-terminal
	[40-199] IPR022383	2.9e-25	Lactate/malate dehydrogenase, C-terminal
Orthology group	MCL44291		Lepidoptera specific

Nucleotide sequence:

>DPOGS212201-TA
ATGTCGCCGATGCCGTTCGTAGGTATCGCTACGGAACCCATTAACACTTTAGTTCCCATGGCTGCGGAAATAATGAAGAACCATGGGGAATATGATCCCAAAAAAATGTTCGGCATCACAATATTAGATAAGCTGAAAACAGAAGCATTGTACGCCGCGGAAGCCGAAAAGGATCCTCAAAACTGCAACGTCCCAGTGATAGGCGGCCACTCAGAAAAAACCCTGATACCGCTACTGTCACAGGCAGAACCCAAATGTAACTTGGACGAGAAAAGAATACAAGAATTCACATCTAGGGTGAGGTCATCTGATAGCGCAATTTTGAAATCAAAATGCGGATGGTCGCCATCTTTGTCCGTAGCGTACGGCGCTGTGGCATTCACTAAATGTATTATGGATGCTTTGGACGGTCGAACGACTCAAATACAAGCGTACGTTGAAAACAATGACTTCGGCACGTCGTATTTCTCTGGACTGGTCACCGTTGATCAAAATGGAGTTAAGGAGATGCAAAGCTACTCAAACCTATCGTCATACGAATGTCAGTTGTTAGAAAGAAGTATCGAGCAGCTGAGAAAGGAAGTCTTGATGGGGAAGAAGGCACTGGAGCTGGAGTAG

Protein sequence:

>DPOGS212201-PA
MSPMPFVGIATEPINTLVPMAAEIMKNHGEYDPKKMFGITILDKLKTEALYAAEAEKDPQNCNVPVIGGHSEKTLIPLLSQAEPKCNLDEKRIQEFTSRVRSSDSAILKSKCGWSPSLSVAYGAVAFTKCIMDALDGRTTQIQAYVENNDFGTSYFSGLVTVDQNGVKEMQSYSNLSSYECQLLERSIEQLRKEVLMGKKALELE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: