MonarchBase - Protein-coding gene

DPOGS209347
Transcript	DPOGS209347-TA	1425 bp
Protein	DPOGS209347-PA	474 aa
Genomic position	DPSCF300336 + 208422-217172
RNAseq coverage	5273x (Rank: top 2%)

Annotation
*Heliconius*	HMEL013249	0.0	81.65%
*Bombyx*	BGIBMGA014446-TA	5e-136	90.69%
*Drosophila*	ATPCL-PD	7e-167	56.97%
EBI UniRef50	UniRef50_Q6AWP8	1e-164	56.97%	RE70805p n=33 Tax=cellular organisms RepID=Q6AWP8_DROME
NCBI RefSeq	XP_001808341.1	2e-173	59.34%	PREDICTED: similar to ATP-citrate synthase [Tribolium castaneum]
NCBI nr blastp	gi\|270008566	1e-172	59.92%	hypothetical protein TcasGA2_TC015096 [Tribolium castaneum]
NCBI nr blastx	gi\|270008566	2e-167	59.92%	hypothetical protein TcasGA2_TC015096 [Tribolium castaneum]

Group
Gene Ontology	GO:0005524	6.2e-11	ATP binding
	GO:0016874	6.2e-11	ligase activity
KEGG pathway	tca:656728	4e-173
	K01648 (ACLY)	maps->	Citrate cycle (TCA cycle)
			Reductive carboxylate cycle (CO2 fixation)
InterPro domain	[187-352] IPR016102	5.2e-20	Succinyl-CoA synthetase-like
	[115-166] IPR013816	6.2e-11	ATP-grasp fold, subdomain 2
Orthology group	MCL11576		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209347-TA
ATGAAAACTGTTACGTCATCGTATGCAGTGACCCAGTACGTGAAGCAACTAGTGGTGAAGCCCGACCAGCTGATCAAGAGACGAGGCAAGTTGGGACTGGTTGGTGTGAATAAAACGGCGGCGGAGGTCAGGCGCTGGCTGGCCGAGCATGACTCCAAGGAGCAGAAGGTCGGAGCGGCCGCGGGGAAGCTCAGGAGATTCGTGGTGGAACCGTTCGTGAAGCACGATCCGAGCGAGGAGATGTACCTGTGCATCCAATCAGGCCGACGAGCGGACACCATCATGTTCCATCACCAGGGCGGAGTGGACGTGGGTGATGTGGACGCGCTGGCTCTCAGGATGGATTTCATCGTGAGCCTGTACCGCGTGTTCGTGAACCTGTACTTCACGTACATGGAGATCAACCCGGTGGTGGTGACCAACGAGCGAGTCTACCTCCTTGACCTGGCCGCCAAGTTGGATCAGACGGCGGATTTCATATGCGCCAAGAACTGGGGGGAGATCACCTTCCCCCCGCCCTTCGGCAGGGACGCGTACCCCGAGGAAGCTCATATAGCTGATCTTGACGCTAAGAGCGGGGCTAGCTTGAAGCTGACGGTGCTGAACAAGTCCGGGCGTATCTGGACGATGGTGGCGGGCGGCGGGGCGTCCGTGGTGTACACGGACACGGTCTGCGCCCTGGGCGGGGCGGCCGAGCTCGCCAACTACGGCGAGTACTCCGGGGCGCCCACCGAGAGCCAGACAGCCGACTACGCCAAGACCATATTCAGTCTCATGTGCAGAGAGAAGCATCCCAAGGGCAAGGTCCTGATTATCGGCGGCGGCATCGCGAACTTCACGAACGTGGCGGACACCTTCCGCGGCATCATCACCGCCATCGAGACGTACCGGGACGCTCTGCTTCAGTACAACGTCACCATCTTCGTGAGGCGGGGCGGCCCCAACTACCAGGAAGGGCTGAGACAAATGCGTGAAGTGGGGCAGCGTCTCCGTATCCCCATGTACGTGTTCGGTCCGGAGAGCAACATGACCGCCATCGTGAGGCTGGCTCTGGGACACGCGGTCATACCCAGCGACCACCAGCTCGACTACGCCCCGAAACAGCTGCCCAAGCCGGACACCGCTCCGTCCCCGCAGATCGAGCTTCCAGAGCTGAGCCCGTCCCTGCTGGAGCTGGTGTGCTCGCAGGCGCCCACCAGGAGCGACCTCGGCCAGCAGCTGTCCACAGCCAGGCCGCTGTTCAGTGACAGGACCAAGGCTATAGTGTGGGGAATGCAGAACAGAGCTATACAGGGTATGCTCGACTTCGACTACGTGTGTCGCCGCAGTGAGCCGTCAGTGGTGGCCATAGTGTACCCCTTCACCGCTGACCACAAACAGAAGTACTACTTCGGCACTAAGGAACACAAATATGGGCCACTCTAA

Protein sequence:

>DPOGS209347-PA
MKTVTSSYAVTQYVKQLVVKPDQLIKRRGKLGLVGVNKTAAEVRRWLAEHDSKEQKVGAAAGKLRRFVVEPFVKHDPSEEMYLCIQSGRRADTIMFHHQGGVDVGDVDALALRMDFIVSLYRVFVNLYFTYMEINPVVVTNERVYLLDLAAKLDQTADFICAKNWGEITFPPPFGRDAYPEEAHIADLDAKSGASLKLTVLNKSGRIWTMVAGGGASVVYTDTVCALGGAAELANYGEYSGAPTESQTADYAKTIFSLMCREKHPKGKVLIIGGGIANFTNVADTFRGIITAIETYRDALLQYNVTIFVRRGGPNYQEGLRQMREVGQRLRIPMYVFGPESNMTAIVRLALGHAVIPSDHQLDYAPKQLPKPDTAPSPQIELPELSPSLLELVCSQAPTRSDLGQQLSTARPLFSDRTKAIVWGMQNRAIQGMLDFDYVCRRSEPSVVAIVYPFTADHKQKYYFGTKEHKYGPL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: