MonarchBase - Protein-coding gene

DPOGS200904
Transcript	DPOGS200904-TA	1398 bp
Protein	DPOGS200904-PA	465 aa
Genomic position	DPSCF300066 + 100873-113750
RNAseq coverage	5270x (Rank: top 2%)

Annotation
*Heliconius*	HMEL013400	97.20%
*Bombyx*	BGIBMGA000672-TA	94.62%
*Drosophila*	kdn-PB	77.26%
EBI UniRef50	UniRef50_O75390	75.00%	Citrate synthase, mitochondrial n=251 Tax=cellular organisms RepID=CISY_HUMAN
NCBI RefSeq	XP_970124.1	80.56%	PREDICTED: similar to citrate synthase [Tribolium castaneum]
NCBI nr blastp	gi\|332373860	81.43%	unknown [Dendroctonus ponderosae]
NCBI nr blastx	gi\|332373860	81.43%	unknown [Dendroctonus ponderosae]

Group
Gene Ontology	GO:0046912	9.9e-277	transferase activity, transferring acyl groups, acyl groups converted into alkyl on transfer
	GO:0044262	9.9e-277	cellular carbohydrate metabolic process
	GO:0004108	5.9e-245	citrate (Si)-synthase activity
KEGG pathway	tca:658667	0.0
	K01647 (CS, gltA)	maps->	Citrate cycle (TCA cycle)
			Glyoxylate and dicarboxylate metabolism
InterPro domain	[14-461] IPR002020	9.9e-277	Citrate synthase-like
	[33-458] IPR010109	5.9e-245	Citrate synthase, eukaryotic
	[30-462] IPR016141	2.2e-150	Citrate synthase-like, core
	[33-353] IPR016142	2.3e-132	Citrate synthase-like, large alpha subdomain
Orthology group	MCL11457		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200904-TA
ATGGCTCTATTCAGGATCACATCATCAAAACTTATTGATATACAGAAAACATGCCCAACAGCGACGATACTGCTGCGAAACTTAAGCGCGGAACAGACGAATCTTAAAAGTATCCTACAGGAGAAGATCCCCAAAGAACAAGAGAAGATCAAAGAATTCCGTAAGAAGCATGGGGCCACCAAAGTTGGCGAAGTCACCGTCGACATGATGTACGGTGGCATGAGAGGCATCAAGGGTCTTGTTTGGGAGACGTCTGTATTGGATCCTGATGAGGGCATCCGTTTCCGTGGCCTCTCAATCCCCGAGTGCCAACAGCAGCTGCCAAAAGCCAAGGGCGGAGAGGAACCCTTACCCGAAGGTCTGTTCTGGCTTCTGGTGACCGGTGAAATACCAACCGAGGCTCAAGTGAAGGCTATTTCCAAGGAATGGGCTCAAAGAGCTGAACTTCCCGCTCACGTGGTGACCATGTTGAACAACATGCCCAGCAAGTTGCATCCGATGTCACAGTTCTCAGCAGCCGTTACAGCCCTCAACAGCGAGTCGAAGTTCGCGCAGGCCTACTCCGAGGGTGTTCACAAGTCCAAGTATTGGGAGTATGTGTACGAGGACTCTATGAATCTGATCGCTAAGCTGCCGGTTATAGCCGCTACTATCTACCGCAACACCTATCGCGATGGTAAGGGCATTGGAGCGATCGATGACAACAAGGACTGGTCAGCCAACTACTGCACCATGTTGGGCTTCGACGATCCCCAGTTCACAGAGCTCATGAGGCTATACCTCACCATCCACAGCGACCACGAAGGCGGTAACGTGTCTGCTCACACCACCCACCTCGTGGGCTCGGCTCTAAGTGACCCCTACCTTTCATTCGCTGCTGGTCTCAACGGTCTCGCGGGACCTCTCCACGGACTCGCCAACCAGGAGGTATTGATCTGGTTGGAGAAACTGCGCAAGCAGGTCGGTGATAACTTCACGGAGGAAGGCCTCAAGGAGTTCATTTGGAAGACACTTAAATCCGGTCAAGTCGTGCCCGGATACGGTCACGCCGTGCTTAGGAAGACTGATCCCAGATACACCTGCCAACGCGAATTCGCCCTCAAGCACCTTCCCAACGACCCCCTGTTCAAGCTTGTGGCAGCGGTGTACAAAGTCGTTCCTCCAATCCTAACCGAGCTCGGCAAGGTCAAGAACCCGTGGCCAAATGTCGACTCACACTCTGGTGTGCTCTTACAGTATTACGGTCTTAAGGAGATGAATTACTACACGGTGATGTTCGGTGTGTCTCGTGCTTTGGGTGTGTTGGCTCAGCTGATCTGGTCCCGTGCTCTCGGTCTGCCCATAGAACGCCCCAAATCCCTCAGCACCGACCTCCTCATCAAACAGATCGGCAAGTAA

Protein sequence:

>DPOGS200904-PA
MALFRITSSKLIDIQKTCPTATILLRNLSAEQTNLKSILQEKIPKEQEKIKEFRKKHGATKVGEVTVDMMYGGMRGIKGLVWETSVLDPDEGIRFRGLSIPECQQQLPKAKGGEEPLPEGLFWLLVTGEIPTEAQVKAISKEWAQRAELPAHVVTMLNNMPSKLHPMSQFSAAVTALNSESKFAQAYSEGVHKSKYWEYVYEDSMNLIAKLPVIAATIYRNTYRDGKGIGAIDDNKDWSANYCTMLGFDDPQFTELMRLYLTIHSDHEGGNVSAHTTHLVGSALSDPYLSFAAGLNGLAGPLHGLANQEVLIWLEKLRKQVGDNFTEEGLKEFIWKTLKSGQVVPGYGHAVLRKTDPRYTCQREFALKHLPNDPLFKLVAAVYKVVPPILTELGKVKNPWPNVDSHSGVLLQYYGLKEMNYYTVMFGVSRALGVLAQLIWSRALGLPIERPKSLSTDLLIKQIGK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: