MonarchBase - Protein-coding gene

DPOGS200448
Transcript	DPOGS200448-TA	1167 bp
Protein	DPOGS200448-PA	388 aa
Genomic position	DPSCF300260 - 288625-292791
RNAseq coverage	5649x (Rank: top 2%)

Annotation
*Heliconius*	HMEL006298	3e-166	81.89%
*Bombyx*	BGIBMGA011412-TA	0.0	87.11%
*Drosophila*	CG5028-PA	2e-151	69.12%
EBI UniRef50	UniRef50_D2Y061	0.0	86.86%	Isocitrate dehydrogenase n=7 Tax=Pancrustacea RepID=D2Y061_BOMMO
NCBI RefSeq	NP_001165386.1	0.0	86.86%	isocitrate dehydrogenase [Bombyx mori]
NCBI nr blastp	gi\|284813561	0.0	86.86%	isocitrate dehydrogenase [Bombyx mori]
NCBI nr blastx	gi\|284813561	0.0	86.86%	isocitrate dehydrogenase [Bombyx mori]

Group
Gene Ontology	GO:0000287	3.4e-196	magnesium ion binding
	GO:0016616	3.4e-196	oxidoreductase activity, acting on the CH-OH group of donors, NAD or NADP as acceptor
	GO:0051287	3.4e-196	NAD binding
	GO:0055114	3.4e-196	oxidation-reduction process
	GO:0006099	1.3e-150	tricarboxylic acid cycle
	GO:0004449	1.3e-150	isocitrate dehydrogenase (NAD+) activity
KEGG pathway	tca:662903	3e-163
	K00030 (IDH3)	maps->	Citrate cycle (TCA cycle)
InterPro domain	[42-389] IPR001804	3.4e-196	Isocitrate/isopropylmalate dehydrogenase
	[54-384] IPR004434	1.3e-150	Isocitrate dehydrogenase NAD-dependent
	[51-386] IPR024084	1.6e-111	Isopropylmalate dehydrogenase-like domain
Orthology group	MCL14031		Single-copy universal gene

Nucleotide sequence:

>DPOGS200448-TA
ATGGCAGTGAGGTTGCTCTCGAAAGTGAAATGCCTGCCTGGGATACAGGGAGTGGTATACGCTAGTGGGGCGGCTGCTCCAGCTCAGCTTTCAGATTTTGAGTTACAGCATAAGACGCCAGTAATTCGTAAGCAGAAGAACATCCCCATAGCTCAGTACGGAGGCCGTCATGCCGTCACCATGCTCCCTGGTGGTGGAATCGGCCCTGAATGCATGGGCTACGTCAGGGAAATTTTCAAGTACATCGGTGCCCCCATAGACTTTGAACTTGTGAATATTGATCCTAATGTAGACAATGATGACGACGTCCAATATGCCATCACCACCATCAAGAGGAATGGTGTCGGACTTAAGGGTAATATTGAGACTAAGAGCGAGGCAGCGTACGTAACTTCACGTAATGTTGCGTTACGTAACGAGTTAGACATGTACGCATATGTTTTGAACTGCAAATCATTTCCCGGAGTCAGCACCAGGCACAAGGATATTGACATCGTTATTATAAGACAGAACACAGAAGGTGAATATGCCATGTTGGAACATGAATCTGTTAGGGGGGTGATTGAATCGATGAAGGTGGTCACAGCGAGCAACTCGGAGAGGGTTGCCAGATTCGCTTTTGAATTTGCCAAGAGGAATGGAAGGAAGAAGGTAACGACTGTCCACAAAGCGAATATCATGAAGCTATCAGATGGGCTGTTCCTGGAGACATCCCGTCGTTTGGCTCAAGAGTATCCGGACATAGAACATAATGATATGATCATTGACAACTGTTGTATGCAACTTGTTGCCAGGCCGCACCAGTTTGACGTGATGTTGATGACAAATCTGTATGGATCAATTGTCTCTAACGTGGTTTGTGGTCTACTCGGAGGAGCTGGTTTACTCTCCGGGAGGAATTATGGTGACAACTACGCAGTCTTTGAACCTGGCACTAGGAATACTGGTACAGCCATAGCTGGCAAGAACATTGCTAACCCAATAGCCATGATAAACGCCTCGGTGGACATGTTGGAGCACCTCGGACACCATTATCATGCCGGTTTGATCAGGAGAGCGTTGGATAAAACTATTAATACCGATAGAGTGCTCACCCCTGACTGCGGAGGAACAGCCAGTTCCAGTGAAGTGGTTGACAGCATCATGCAGAATATTGGCCGCTGCTAG

Protein sequence:

>DPOGS200448-PA
MAVRLLSKVKCLPGIQGVVYASGAAAPAQLSDFELQHKTPVIRKQKNIPIAQYGGRHAVTMLPGGGIGPECMGYVREIFKYIGAPIDFELVNIDPNVDNDDDVQYAITTIKRNGVGLKGNIETKSEAAYVTSRNVALRNELDMYAYVLNCKSFPGVSTRHKDIDIVIIRQNTEGEYAMLEHESVRGVIESMKVVTASNSERVARFAFEFAKRNGRKKVTTVHKANIMKLSDGLFLETSRRLAQEYPDIEHNDMIIDNCCMQLVARPHQFDVMLMTNLYGSIVSNVVCGLLGGAGLLSGRNYGDNYAVFEPGTRNTGTAIAGKNIANPIAMINASVDMLEHLGHHYHAGLIRRALDKTINTDRVLTPDCGGTASSSEVVDSIMQNIGRC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: