MonarchBase - Protein-coding gene

DPOGS210806
Transcript	DPOGS210806-TA	3168 bp
Protein	DPOGS210806-PA	1055 aa
Genomic position	DPSCF300027 - 783057-795752
RNAseq coverage	7133x (Rank: top 2%)

Annotation
*Heliconius*	HMEL007830	92.78%
*Bombyx*	BGIBMGA007121-TA	92.38%
*Drosophila*	Acon-PB	79.71%
EBI UniRef50	UniRef50_Q99798	75.09%	Aconitate hydratase, mitochondrial n=92 Tax=cellular organisms RepID=ACON_HUMAN
NCBI RefSeq	XP_391994.1	82.70%	PREDICTED: similar to Aconitase CG9244-PB [Apis mellifera]
NCBI nr blastp	gi\|28971712	90.07%	hypothetical protein [Antheraea yamamai]
NCBI nr blastx	gi\|28971712	90.07%	hypothetical protein [Antheraea yamamai]

Group
Gene Ontology	GO:0006099	1.5e-293	tricarboxylic acid cycle
	GO:0003994	1.5e-293	aconitate hydratase activity
	GO:0051539	1.5e-293	4 iron, 4 sulfur cluster binding
	GO:0008152	1.4e-180	metabolic process
KEGG pathway	ame:408446	0.0
	K01681 (ACO, acnA)	maps->	Citrate cycle (TCA cycle)
			Reductive carboxylate cycle (CO2 fixation)
			Glyoxylate and dicarboxylate metabolism
InterPro domain	[20-1052] IPR006248	0	Aconitase, mitochondrial-like
	[20-1052] IPR015937	0	Aconitase/isopropylmalate dehydratase
	[70-509] IPR001030	1.4e-180	Aconitase/3-isopropylmalate dehydratase large subunit, alpha/beta/alpha
	[834-1050] IPR015928	2.4e-93	Aconitase/3-isopropylmalate dehydratase, swivel
	[46-235] IPR015931	4.5e-67	Aconitase/3-isopropylmalate dehydratase large subunit, alpha/beta/alpha, subdomain 1/3
	[857-984] IPR000573	3.5e-46	Aconitase A/isopropylmalate dehydratase small subunit, swivel
	[236-348] IPR015932	4.8e-42	Aconitase/3-isopropylmalate dehydratase large subunit, alpha/beta/alpha, subdomain 2
Orthology group	MCL10855		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210806-TA
ATGGCTCACTGTACGAGAGTTTTACATGGCCAAGGTGGCAGGACGAGGCTTGCGCTCGTGGAAATTCAGAAACGATGCTTCAGTGTATCACCATTAACCGCAGCAGCGGCCCAGGTCGCGATGTCAAAATTCGACAAAGCTCCTCTCCCGTACCAAAAGTTAACTCAGAATATCGAAATTGTGAAGAAAAGGTTGGGCCGTGATTTGACCTTGTCCGAGAAGGTCTTGTACTCTCATCTGGACGACCCTAAAGGACAGGAAATCGAACGTGGTACCAGCTATCTCCGCCTTCGTCCTGACCGTGTTGCGATGCAAGATGCCACAGCGCAGATGGCCATGCTACAGTTCATATCTTCAGGACTCCCCAGAGTGGCTGTTCCATCTACCATCCACTGCGATCACTTGATTGAGGCCCAAATCGGCGGAGATAAAGATTTAGCAAGAGCCAAGGATATTAACAAAGAGGTATACAAGTTCCTTGAAACAGCCGGTGCTAAGTACGGAGTGGGCTTCTGGAAACCTGGTTCTGGTATCATTCACCAGATCATCTTGGAGAATTACGCCTTTCCTGGTTTACTGATGATCGGTACCGATTCTCACACTCCTAACGGCGGTGGTCTTGGTGGACTCTGCATTGGTGTTGGCGGAGCTGATGCTGTAGATGTAATGGCCGACATCCCCTGGGAGCTGAAGTGTCCCAAGGTCATCGGTGTCAAACTCACAGGCAAGCTGAAGGGCTGGACGAGCCCTAAGGATGTGATCCTGAAGGTAGCCGGCATCCTGACAGTGAAGGGAGGCACGGGCGCCATCGTGGAGTACCACGGACCTGGCGTCGACTCCATCTCGTGTACCGGCATGGCAACCATCTGTAACATGGGGGCCGAGATCGGCGCTACCACCAGTGTGTTCCCTTACAACGCCCGTATGGAGGCCTACCTTAAATCCACCGGCCGTCACGACATCGCCTCCGCCGCTAACAGCTACAAGAACCTCCTCACACCTGATCCCAAGGCGCCTTACGACCAGTTAATCGAAATCGACCTGTCTACATTGGAGCCCCACGTGAACGGTCCCTTCACGCCCGACCTCGCCAACCCGATCTCCAAGTTGGGAGAGATCGCGAAGAAGAACGACTGGCCTATCGACATCAAGGTCGGCCTCATTGGCTCGTGCACCAACTCCTCGTACGAAGACATGGGACGCTGTGCCAGTATTGTCAAGGAGGCCCTGAGTCACGGCGTCAAATCCAAGATACCGTTCAACGTGACCCCCGGCTCGGAACAAGTGCGCGCCACCATAGAGAGAGACGGCATCGCGCAGACACTCAGGGACTTCGGAGGAACCGTGTTGGCGAACGCCTGCGGTCCGTGCATCGGTCAATGGGACCGCAAGGACGTGAAGAAGGGGGATAAGAACACCATAGTGACGTCATACAACAGAAACTTCACCGGCAGAAACGACGCCAACCCCGCCACCCACTGCTTCGTCACCAGCCCCGAGCTGGTCACGGCTCTCTCACTGGCCGGCAAGCTGAAGGGCTGGACGAGCCCTAAGGATGTGATCCTGAAGGTAGCCGGCATCCTGACAGTGAAGGGAGGCACGGGCGCCATCGTGGAGTACCACGGACCTGGCGTCGACTCCATCTCGTGTACCGGCATGGCAACCATCTGTAACATGGGGGCCGAGATCGGCGCTACCACCAGTGTGTTCCCTTACAACGCCCGTATGGAGGCCTACCTTAAATCCACCGGCCGCCACGACATCGCCTCCGCCGCTAACAGCTACAAGAACCTCCTCACGCCTGATCCCAAGGCGCCTTACGACCAGTTAATCGAAATCGACCTGTCTACATTGGAGCCCCACGTGAACGGTCCCTTCACGCCCGACCTCGCCAACCCGATCTCCAAGTTGGGAGAGATCGCGAAGAAGAACGACTGGCCTATCGACATCAAGGTCGGCCTCATTGGCTCGTGCACCAACTCCTCGTACGAAGACATGGGACGCTGTGCCAGTATTGTCAAGGAGGCTTTGAGTCACGGCGTCAAATCCAAGATACCGTTCAACGTGACCCCCGGCTCGGAACAAGTGCGCGCCACCATAGAGAGAGACGGCATCGCGCAGACACTCAGGGACTTCGGAGGAACCGTGTTGGCGAACGCCTGCGGTCCGTGCATCGGTCAATGGGACCGCAAGGACGTGAAGAAGGGGGATAAGAACACCATAGTGACGTCATACAACAGAAACTTCACCGGCAGAAACGACGCCAACCCCGCCACCCACTGCTTCGTCACCAGCCCCGAGCTGGTCACGGCTCTCTCACTGGCCGGCCGTCTTGATTTCAATCCCCTGACCGACTCCCTGAAGGGCAAGGATGGCAAGGAGTTCAAACTATCAGATCCCTTCGCTGATGAGTTACCAGCTAAAGGCTTCGACCCCGGCCAGGACACGTACGAACACCCGCCAGCCGATGGATCCAAGGTCAAAGTGGACGTGTCTCCTACATCAGACCGCCTGCAGTTGTTGGAACCTTTCGACAAGTGGGATGGCAAGGACCTCAGTGACCTGACCATACTCATCAAGGTGAAGGGGAAATGCACCACGGACCACATCTCCGCCGCCGGGCCCTGGCTCAAGTACAGAGGTCATCTGGACAACATCTCCAATAACATGTTCATAACCGCAACGAACGCTGAGAACGGCGAGCTGAACAAGGTCCGCAACCTGCAGACGGGCGAGTGGGGGCCTGTCCCGGCGACCGCCCGGGCTTACAAGGCGGCCGGCGTGAGGTGGTGTGTGGTGGGAGACGAGAACTACGGAGAGGGCTCCAGCAGGGAGCACGCCGCCCTGGAGCCGAGGCACCTCGGGGGACGAGCCATCATAGTCAAATCCTTCGCCAGAATCCACGAGACCAACTTGAAGAAGCAGGGTCTACTGCCGCTGACCTTCGCCAACCCCTCGGACTACGACAAGATCCAGCCATCGGACAAGATCTCACTGCTGGGACTCAACGACCTGGCGCCTGGAAAGCAAGTGGAATGTGAAATCAAACACAAGGACGGTAAATCCGAGCGCATCAAACTGAACCACTCTTTGAACGAGCAACAGATCTCGTGGTTCAAGGCTGGGTCAGCTCTCAACAGGATGAAGGAGATCGCCGCTGGGAAGTAA

Protein sequence:

>DPOGS210806-PA
MAHCTRVLHGQGGRTRLALVEIQKRCFSVSPLTAAAAQVAMSKFDKAPLPYQKLTQNIEIVKKRLGRDLTLSEKVLYSHLDDPKGQEIERGTSYLRLRPDRVAMQDATAQMAMLQFISSGLPRVAVPSTIHCDHLIEAQIGGDKDLARAKDINKEVYKFLETAGAKYGVGFWKPGSGIIHQIILENYAFPGLLMIGTDSHTPNGGGLGGLCIGVGGADAVDVMADIPWELKCPKVIGVKLTGKLKGWTSPKDVILKVAGILTVKGGTGAIVEYHGPGVDSISCTGMATICNMGAEIGATTSVFPYNARMEAYLKSTGRHDIASAANSYKNLLTPDPKAPYDQLIEIDLSTLEPHVNGPFTPDLANPISKLGEIAKKNDWPIDIKVGLIGSCTNSSYEDMGRCASIVKEALSHGVKSKIPFNVTPGSEQVRATIERDGIAQTLRDFGGTVLANACGPCIGQWDRKDVKKGDKNTIVTSYNRNFTGRNDANPATHCFVTSPELVTALSLAGKLKGWTSPKDVILKVAGILTVKGGTGAIVEYHGPGVDSISCTGMATICNMGAEIGATTSVFPYNARMEAYLKSTGRHDIASAANSYKNLLTPDPKAPYDQLIEIDLSTLEPHVNGPFTPDLANPISKLGEIAKKNDWPIDIKVGLIGSCTNSSYEDMGRCASIVKEALSHGVKSKIPFNVTPGSEQVRATIERDGIAQTLRDFGGTVLANACGPCIGQWDRKDVKKGDKNTIVTSYNRNFTGRNDANPATHCFVTSPELVTALSLAGRLDFNPLTDSLKGKDGKEFKLSDPFADELPAKGFDPGQDTYEHPPADGSKVKVDVSPTSDRLQLLEPFDKWDGKDLSDLTILIKVKGKCTTDHISAAGPWLKYRGHLDNISNNMFITATNAENGELNKVRNLQTGEWGPVPATARAYKAAGVRWCVVGDENYGEGSSREHAALEPRHLGGRAIIVKSFARIHETNLKKQGLLPLTFANPSDYDKIQPSDKISLLGLNDLAPGKQVECEIKHKDGKSERIKLNHSLNEQQISWFKAGSALNRMKEIAAGK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: