MonarchBase - Protein-coding gene

DPOGS209348
Transcript	DPOGS209348-TA	2022 bp
Protein	DPOGS209348-PA	673 aa
Genomic position	DPSCF300336 + 217758-224591
RNAseq coverage	5134x (Rank: top 2%)

Annotation
*Heliconius*	HMEL013249	6e-160	88.82%
*Bombyx*	BGIBMGA014294-TA	9e-161	89.00%
*Drosophila*	ATPCL-PD	0.0	63.09%
EBI UniRef50	UniRef50_Q6AWP8	0.0	62.91%	RE70805p n=33 Tax=cellular organisms RepID=Q6AWP8_DROME
NCBI RefSeq	XP_001842482.1	0.0	63.45%	ATP-citrate synthase [Culex quinquefasciatus]
NCBI nr blastp	gi\|312370903	0.0	62.91%	hypothetical protein AND_22915 [Anopheles darlingi]
NCBI nr blastx	gi\|289724570	0.0	63.45%	ATP-citrate lyase [Glossina morsitans morsitans]

Group
Gene Ontology	GO:0046912	9.3e-58	transferase activity, transferring acyl groups, acyl groups converted into alkyl on transfer
	GO:0044262	9.3e-58	cellular carbohydrate metabolic process
	GO:0008152	2.1e-16	metabolic process
	GO:0003824	2.1e-16	catalytic activity
	GO:0005488	2.4e-06	binding
KEGG pathway	cqu:CpipJ_CPIJ000859	0.0
	K01648 (ACLY)	maps->	Citrate cycle (TCA cycle)
			Reductive carboxylate cycle (CO2 fixation)
InterPro domain	[111-549] IPR016141	9.3e-58	Citrate synthase-like, core
	[66-244] IPR016102	5.9e-56	Succinyl-CoA synthetase-like
	[105-230] IPR005811	2.1e-16	ATP-citrate lyase/succinyl-CoA ligase
	[394-538] IPR002020	9.8e-15	Citrate synthase-like
	[443-539] IPR016143	8.9e-11	Citrate synthase-like, small alpha subdomain
	[28-45] IPR005810	2.3e-06	Succinyl-CoA ligase, alpha subunit
	[7-65] IPR016040	2.4e-06	NAD(P)-binding domain
Orthology group	MCL11576		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209348-TA
ATGGATGTAGCTATGAGGAAACACCAAGAGGCGACCGTCCTTGTTAACTTCGCGTCCCTCCGGTCAGCTTACGACAGCACCATGCAGGCGATGCAGCATCCACAGATCAACACAGTCGTTATTATAGCGGAGGGCATACCGGAGAATATGACGAGGAAGATAATCAAGCTAGCCGACGACAGAGGGGTGAATATAATCGGTCCGGCCACAGTGGGTGGTATCAAACCCGGATGTTTCAAGATTGGCAACACTGCCGGCATGATCGACAACATTATAGGCAGCAAGTTGTACAGACCTGGCAGCGTGGCGTACGTGTCCCGTTCCGGCGGCATGAGTAACGAGCTGAACAACATCATATCCAAGGAGGCGGACGGCGTGTGCGAGGGAGTCGCCATAGGGGGCGACAGATACCCGGGGACCACCTTCATAGACCACCTGATGAGGTACGAGGCGGATCCTAACGTGAAGATGCTGGTGCTCCTGGGCGAGGTGGGCGGAGTTGAGGAGTACCACGTGTGCCGCGCCATCAAGGACGGGAGGATCACGAAGCCGCTCGTCGCCTGGTGTATAGGGACGTGCTCCGACATGTTCACGTCTGAGGTACAGTTCGGGCACGCGGGTTCGCTCGCCGGCTCGGCTCTAGAGAAGGCCGCTGCTAAGAATAAGGCTTTGGCCAAACACGGGGCGGTGGTGCCAGACTCGTTTGACACTCTGGGGGCGGCCATTAATAAGCATGTGAGTAATAAATTTTCTGTATCATCTTCAGACATGTTCACGTCTGAGGTACAGTTCGGGCACGCGGGTTCGCTCGCCGGCTCGGCTCTAGAGAAGGCCGCTGCTAAGAATAAGGCTTTGGCCAAACACGGGGCGGTGGTGCCAGACTCGTTTGACACTCTGGGGGCGGCCATTAATAAGGTTTACAAGAAGCTCGTCTCCGAAGGCAAGATAATTGAGAAGGAAGAGGTCGGCCCACCAAAAGTACCCATGGACTACGACTGGGCTCGGAAACTCGGTATAATTCGTAAGCCGGCAGCGTTTGTGAGCACTATATGCGACGAGCGAGGCCAGGAGTTGAGCTACTGCGGCGTGCCCATAACGTCCATACTGGAGAAACAGATGGGGGTCGGTGGTACCATCAGCCTGCTGTGGTTCCAGCGCGAGTTGCCGGACTGGGCGTGCAAGTTCTTCGAGCTGGTGCTGATAGTGACGGCCGACCACGGGCCCGCTGTCTCCGGGGCTCACAATACGATGGTCACCGCGCGGGCCGGCAAGGACCTTATATCGTCTGTGGTCTCCGGGCTGCTTACTATCGGAGATCGTTTCGGCGGTGCCCTGGACAGAGCTGCCGCGGATTTCTGTGCTGCTTACGATCGAGGGCAGCACCCCCAGGAGTTTGTTAACGAGAAACGTGCCAAGGGTGAACTTATTATGGGGATCGGACATCGCGTGAAGTCTATCAACAACCCAGACTCGCGCGTTCGCGAGCTGAAGGCGTATGTGACGTCACGTTGGCCCGCGTGGCCGGTGACGAGGTACGCCCTGGACGTGGAGGCGATCACCACGAGGAAGAAGCCCAACCTGATCCTGAACGTGGACGGCATAGTGGCGGCCGCCATGGTGGACCTGTTCCGACACTGCCAGCTGTTCTCGCACGTGAAGTCTATCAACAACCCAGACTCGCGCGTTCGCGAGCTGAAGGCGTATGTGACGTCACGCTGGCCCGCGTGGCCGGTGACGAGGTACGCCCTGGACGTGGAGGCGATCACCACGAGGAAGAAGCCCAACCTGATCCTGAACGTGGACGGCATAGTGGCGGCCGCCATGGTGGACCTGTTCCGACACTGCCAGCTCTTCTCGCAGGAGGAAGGTAACAGCTACATCAGTATGGGCTCTATAAACGCGTTGTTCGTGCTCGGCCGCACTATCGGCCTGGTCGGACACTACCTGGACCAGAAGCGTCTCAAGCAGCCTCTGTACCGTCATCCCTGGGACGACATCACCTACATGTCCCCTCTCAACTAA

Protein sequence:

>DPOGS209348-PA
MDVAMRKHQEATVLVNFASLRSAYDSTMQAMQHPQINTVVIIAEGIPENMTRKIIKLADDRGVNIIGPATVGGIKPGCFKIGNTAGMIDNIIGSKLYRPGSVAYVSRSGGMSNELNNIISKEADGVCEGVAIGGDRYPGTTFIDHLMRYEADPNVKMLVLLGEVGGVEEYHVCRAIKDGRITKPLVAWCIGTCSDMFTSEVQFGHAGSLAGSALEKAAAKNKALAKHGAVVPDSFDTLGAAINKHVSNKFSVSSSDMFTSEVQFGHAGSLAGSALEKAAAKNKALAKHGAVVPDSFDTLGAAINKVYKKLVSEGKIIEKEEVGPPKVPMDYDWARKLGIIRKPAAFVSTICDERGQELSYCGVPITSILEKQMGVGGTISLLWFQRELPDWACKFFELVLIVTADHGPAVSGAHNTMVTARAGKDLISSVVSGLLTIGDRFGGALDRAAADFCAAYDRGQHPQEFVNEKRAKGELIMGIGHRVKSINNPDSRVRELKAYVTSRWPAWPVTRYALDVEAITTRKKPNLILNVDGIVAAAMVDLFRHCQLFSHVKSINNPDSRVRELKAYVTSRWPAWPVTRYALDVEAITTRKKPNLILNVDGIVAAAMVDLFRHCQLFSQEEGNSYISMGSINALFVLGRTIGLVGHYLDQKRLKQPLYRHPWDDITYMSPLN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: