MonarchBase - Protein-coding gene

DPOGS215558
Transcript	DPOGS215558-TA	1137 bp
Protein	DPOGS215558-PA	378 aa
Genomic position	DPSCF300129 + 724949-729920
RNAseq coverage	1334x (Rank: top 10%)

Annotation
*Heliconius*	HMEL006171	6e-104	69.31%
*Bombyx*	BGIBMGA010687-TA	2e-180	92.65%
*Drosophila*	CG6439-PB	1e-153	71.32%
EBI UniRef50	UniRef50_Q9VD58	2e-151	71.32%	CG6439, isoform A n=23 Tax=Eumetazoa RepID=Q9VD58_DROME
NCBI RefSeq	XP_973953.2	6e-161	74.22%	PREDICTED: similar to CG6439 CG6439-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189241141	1e-159	74.22%	PREDICTED: similar to CG6439 CG6439-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189241141	6e-158	74.22%	PREDICTED: similar to CG6439 CG6439-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0000287	1.5e-206	magnesium ion binding
	GO:0016616	1.5e-206	oxidoreductase activity, acting on the CH-OH group of donors, NAD or NADP as acceptor
	GO:0051287	1.5e-206	NAD binding
	GO:0055114	1.5e-206	oxidation-reduction process
	GO:0006099	1.6e-143	tricarboxylic acid cycle
	GO:0004449	1.6e-143	isocitrate dehydrogenase (NAD+) activity
KEGG pathway	tca:662783	2e-160
	K00030 (IDH3)	maps->	Citrate cycle (TCA cycle)
InterPro domain	[5-377] IPR001804	1.5e-206	Isocitrate/isopropylmalate dehydrogenase
	[50-375] IPR004434	1.6e-143	Isocitrate dehydrogenase NAD-dependent
	[49-377] IPR024084	6.1e-106	Isopropylmalate dehydrogenase-like domain
Orthology group	MCL13977		Single-copy universal gene

Nucleotide sequence:

>DPOGS215558-TA
ATGTCTCTTATAACTAGAAACCTGTGTCGTACTCTAGTCCAGGGATCTCAGCATGTCAGCAAAGGTTTGCATACAAGTGCAGTAAACTCTGAAAAAAACGTATGTTTCGCGCCACTATCAATTAGCAGCCTGCAAACAAGCAAGGAAGGTCGCATCAAGTGTACTCTTATACCGGGAGACGGTGTTGGTCCAGAGCTTGTGTATTCGGTACAGGAGGTGTTTAAGGCGACCAGCATTCCTGTTGATTTTGAATCATTCTTTTTCTCTGAAGTTAATCCAACATTGAGTGCGCCTTTAGAAGATGTTGTTAGCTCAATTGCTAGGAATAAGATATCTACCCCGGACTTCTCCCACACTGGTGAACTTCAGACGCTCAACATGAAGCTCCGTAATGCCTTGGATCTGTACGCTAATGTGGTGCATGTCAAGTCACTACCTAATGTCAAATGCAGACACACAGATGTTGATTGTATCATCATAAGAGAACAAACTGAAGGGGAATACTCTGCACTGGAACATGAATCGGTTCCCGGTGTTGTTGAATGTCTCAAGATAATAACGGCTGCTAAGTCTGAACGTATAGCTAAATTCGCTTTTGACTACGCGGTCAAGATGCGCCGTAAGAAGGTCACGGCTGTGCACAAGGCTAACATCATGAAGCTGGGCGACGGATTGTTCCTGAGGAGCTGTGAGGAGATGGCAAAATTATATCCAAGGATACAGTTTGAGAAGATGATTGTTGACAATTGCACGATGCAAATGGTCTCCAACCCGAACCAGTTTGATGTGATGGTGACACCCAACTTGTACGGCAACATAGTGGACAATCTGGCCAGCGGTTTGGTTGGTGGAGCCGGGGTGGTGGCTGGAGCCTCATACAGCGCTGACTGTGCTGTGTTCGAACAGGGTGCTCGTCATATATTCTCTGGTGCTGTCGGTAAGAACATCGCCAATCCGACAGCTATGCTTCTATGCTCGGCCAATTTGCTGTCTCACGTCAATCTGCACTCCTATGCTGATATGATCAAGAACGCTATCAATAAAGTTCTAAAAGACGGCAAGGTGAGAACAAAGGATTTGGGCGGACAGTCCACAACAAAGGACTTCACCAACGCCATCATACACTGCCTCGCTTAG

Protein sequence:

>DPOGS215558-PA
MSLITRNLCRTLVQGSQHVSKGLHTSAVNSEKNVCFAPLSISSLQTSKEGRIKCTLIPGDGVGPELVYSVQEVFKATSIPVDFESFFFSEVNPTLSAPLEDVVSSIARNKISTPDFSHTGELQTLNMKLRNALDLYANVVHVKSLPNVKCRHTDVDCIIIREQTEGEYSALEHESVPGVVECLKIITAAKSERIAKFAFDYAVKMRRKKVTAVHKANIMKLGDGLFLRSCEEMAKLYPRIQFEKMIVDNCTMQMVSNPNQFDVMVTPNLYGNIVDNLASGLVGGAGVVAGASYSADCAVFEQGARHIFSGAVGKNIANPTAMLLCSANLLSHVNLHSYADMIKNAINKVLKDGKVRTKDLGGQSTTKDFTNAIIHCLA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: