MonarchBase - Protein-coding gene

DPOGS215498
Transcript	DPOGS215498-TA	3495 bp
Protein	DPOGS215498-PA	1164 aa
Genomic position	DPSCF300518 - 30056-44138
RNAseq coverage	1244x (Rank: top 10%)

Annotation
*Heliconius*	HMEL014572	86.59%
*Bombyx*	BGIBMGA011222-TA	80.39%
*Drosophila*	ACC-PD	78.07%
EBI UniRef50	UniRef50_E9G1C9	71.10%	Putative uncharacterized protein n=16 Tax=Coelomata RepID=E9G1C9_DAPPU
NCBI RefSeq	XP_969851.2	79.12%	PREDICTED: similar to acetyl-coa carboxylase [Tribolium castaneum]
NCBI nr blastp	gi\|270008988	75.99%	hypothetical protein TcasGA2_TC015613 [Tribolium castaneum]
NCBI nr blastx	gi\|270008988	76.06%	hypothetical protein TcasGA2_TC015613 [Tribolium castaneum]

Group
Gene Ontology	GO:0003989	2.7e-96	acetyl-CoA carboxylase activity
	GO:0005524	2.7e-96	ATP binding
	GO:0006633	2.7e-96	fatty acid biosynthetic process
	GO:0016874	1.1e-93	ligase activity
	GO:0003824	8e-53	catalytic activity
	GO:0008152	3.8e-52	metabolic process
KEGG pathway	tca:658362	0.0
	K11262 (ACAC)	maps->	Propanoate metabolism
			Insulin signaling pathway
			Fatty acid biosynthesis
			Pyruvate metabolism
InterPro domain	[833-1160] IPR013537	2.7e-96	Acetyl-CoA carboxylase, central domain
	[367-632] IPR013816	1.1e-93	ATP-grasp fold, subdomain 2
	[63-230] IPR016185	8e-53	PreATP-grasp-like fold
	[300-485] IPR005479	3.8e-52	Carbamoyl-phosphate synthetase, large subunit, ATP-binding
	[108-247] IPR013817	5.2e-47	Pre-ATP-grasp fold
	[516-631] IPR011054	3.8e-33	Rudiment single hybrid motif
	[108-227] IPR005481	3.8e-28	Carbamoyl-phosphate synthase, large subunit, N-terminal
	[521-628] IPR005482	1.5e-24	Biotin carboxylase, C-terminal
	[303-364] IPR013815	5.3e-19	ATP-grasp fold, subdomain 1
	[751-833] IPR011053	1.2e-13	Single hybrid motif
	[767-829] IPR000089	7.4e-13	Biotin/lipoyl attachment
Orthology group	MCL10587		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215498-TA
ATGTTGAAGAGGAGAAGCTCGAAGCGGTTCGTGCTTGGGGACACCTCGGTCGATGAAGGGGAGTGGGCTGATGAGGCAACAGACGTGATGCCAGCGCACGTCGTGCAGAAGTTCCAGGTGACGATCAACTCGGAACCTGAGGGGAATGTGAAAAATGAAGCGCTGGAGGTGGATAAAAGGCTACTCGGACCTCCCACGGCCAGCACCTTGCAGCCGTCGATGTCCCAGGGTACTGTGATCCACAGTCAGCGTTTCCAAGAGAAGGATTTCACTGTTGCCACCCCTGAAGAATTTGTTCGACGTTTCCAAGGGACCAAGGCCATTAACAAGGTGCTGATAGCGAATAATGGCATTGGAGCTGTGAAATGTATGCGTTCTATACGAAGGTGGTCCTATGAGATGTTCAAGAATGAGAGGGCTGTGCGCTTCGTTGTTATGGTGACCCCCGAGGACCTGAAAGCGAATGCTGAATACATAAAGATGGCTGATCATTATGTCCCTGTGCCCGGAGGCTCAAACAACAACAACTATGCCAACGTCGAACTCATAGTGGACATCGCTGTGCGGACCCAAGTACAGGCCGTATGGGCTGGTTGGGGTCATGCTTCAGAGAATCCCAAGCTTCCGGAACTGCTCCATCGAGCTGGTGTAGTTTTCATCGGACCGCCAGAGAAAGCGATGTGGGCTCTCGGAGACAAGATCGCCTCGTCCATAGTGGCCCAGACAGCTGATATACCCACGCTAGCATATATATATATATATATATATATATATATATATATATATATATATCTTTATTTATTTATTATTATATTAGAAAAAAGGTTCCCAAACTTTTTTTTTGAACTTAAAGCGGAGTACAATACAAAGAAGATAAAGATATCATCGGAACTGTTCGCTAGAGGCTGTGTGTCTACACCGGAGCAAGGACTCCAAGCTGCTAACAAGATCGGTTTCCCCGTCATGATAAAGGCTTCTGAGGGTGGAGGAGGTAAAGGTATCAGGAAGGTCGAGGTGCCTGATGACTTCAGCAACATGTTCAGACAGGTCCAAGCGGAAGTGCCAGGTTCTCCGATATTCGTGATGAAGCTGGCGCGGTCAGCTAGACATCTGGAAGTGCAGCTGTTGGCTGATCAGTACGGTAACGCTATATCTCTGTTCGGGAGAGACTGTTCCATCCAGCGACGGCATCAGAAGATCATTGAGGAGGCACCGGCTGCCGTCGCCAAGCCGGAAGTGTTCATTGAAATGGAGAAGGCGGCTGTCCGTCTCGCTAAGATGGTCGGCTACGTGAGTGCTGGCACCGTGGAGTATCTATATGAGCCGATAACGGGGGCTTACTACTTCCTGGAGCTAAACCCTCGCCTGCAGGTGGAACACCCCTGTACGGAGATGGTAGCGGACGTCAACCTACCAGCCGCGCAACTACAGATCGCCATGGGTCTCCCATTATACCACATCAAGGACATCCGTCTCCTGTATGGGGAGTCGCCCTGGGGTATGACTCAGATAGACTTCGACGAGCCCAAACAGAGACCCTCGCCCTGGGGACATGTCATCGCTGCCAGGATCACGTCGGAGAATCCTGATGAAGGTTTCAAACCTTCCTCGGGTACGGTCCAAGAGCTCAACTTCCGGTCGTCAAAGAACGTGTGGGGCTATTTCAGTGTGGCCGCATCCGGGGGCTTGCACGAGTTTGCCGATTCACAGTTCGGGCACTGCTTCTCCTTCGGGGAGACCAGGGAACAGGCTAGAGAGAACCTGGTGATAGCTCTCAAGGAGCTCAGCATCCGAGGAGATTTCAGAACCACGGTCGAATATCTGATCACATTGTTGGAGACGCCCGCCTTCCAGGACAACAACATTGATACTAGCTGGCTGGACGCGCTCATCGCGGAGAGGGTCCAGTCGGAGAAGCCGGACGTGATGCTGGGCGTCATCTGCGGGTCCATCCTCATCGCCGACAACCTCATCACGGCACATCTGCTGGAGTTTAAGAGCGCCCTGGAGAAGGGTCAGATCCAAGGGTCGAGTCAGCTGTCGAACACTGTAGAAGTGGAGCTGATACACTCCGGTCACAAGTACAAAGTTCAAGCAACTAAGTCTGGCCCCACCTCGTACTTCCTGGCTATGAACGGCAGCTTCAAGGAGCTTGAGGTTCATAAGCTAACTGACGGCGGTACCTTACTGTCAATCGACGGAGCGTCATACACGACGTATTTAAAGGAGGAGGTTGACAAGTACAGGATAGTGATCGGCAACCAAACCGTGGTCTTCGAGAAGGAGAAGGATCCGTCCAAGCTGAGAGCCCCCTCCGCTGGGAAGCTGGTCAACACGCTGGTTGAAGATGGAGGGCATGTGGACAAGGGTCAGCCTTACGCTGAGATAGAGGTGATGAAAATGGTGATGACTCTATCAGCGCCAGAATCGGGCAAGGTCTTCTGGAATCTAAGACCTGGTGCTGTGCTGGATATGGGAGCGTTGATGGGAACACTAGAGTTGGACGATCCGTCGCTAGTGACCACAGCCCAGCCCTACAAGGGCCAGTTCCCTCACGAGGACAACCCCAACCTGACGGAGAAACTAAACCACGCCCACAACAAATATAGATATATACTGGAGAACACACTTGCTGGTTACTGTCTGCCCGAGCCGTACAACACTCCTCGTCTCCGGGAGGTGGTGGAGAAATTCATGTCCAGTCTGAGAGACCCCTCGCTGCCCTTACTGGAGTTACAGGAGGTGTTATCATCAACGTCCGGTCGTATCCCGGTCTCCGTGGAGAAGAAGGTCCGCAAGCTGATGGCGCTCTACGAGAGCAACATCACGAGTGTGCTGGCACAGTTCCCCAGCCAGCAGATAGCCAGCGTCATTGACCATCACGCGGCGTCCCTCGCGAAGCGCGCTGACAGGGACGTGTTCTTCATGAGCACGCAGGCCTTGGTGGTGCTAGTGCAGCGGTACAGGAACGGTATCCGCGGTAGGATGAAGGCGGCCGTTCATGATCTCTTGAAGCAGTACTACCAGGTCGAGAGCAACTTCCAACTGGGTTCGTACGACAAATGTGTGATGGCGCTGCGGGATCGTTACAAGGACGACATGCAGGCCGTGGCTAACATCATCTTCTCACACAACCAAGTGGCTAAGAAGAATCTCCTGGTGACGATGTTGATAGACCACCTGTGGTCTAATGAACCAGGTCTCACCGATGAACTGGCGGCCACCCTCAACGAACTGACCTCGTTACACCGAGCCGAACACAGTCGGGTAGCGCTGAGAGCCAGACAGGTGCTGATCGCCGCCCACCAGCCCGCCTACGAGTTGCGGCACAATCAAATGGAGTCTATCTTTTTGTCAGCGGTCGATATGTACGGACACGACTTCCATCCGGAGAACCTTCAGAAGCTGATCCTCTCGGAGACTTCGATATTCGACATCCTTCACGATTTCTTCTATCACACGAACGCGGCGGTGAGTAGACCGAGTAGACCATAG

Protein sequence:

>DPOGS215498-PA
MLKRRSSKRFVLGDTSVDEGEWADEATDVMPAHVVQKFQVTINSEPEGNVKNEALEVDKRLLGPPTASTLQPSMSQGTVIHSQRFQEKDFTVATPEEFVRRFQGTKAINKVLIANNGIGAVKCMRSIRRWSYEMFKNERAVRFVVMVTPEDLKANAEYIKMADHYVPVPGGSNNNNYANVELIVDIAVRTQVQAVWAGWGHASENPKLPELLHRAGVVFIGPPEKAMWALGDKIASSIVAQTADIPTLAYIYIYIYIYIYIYIYLYLFIIILEKRFPNFFFELKAEYNTKKIKISSELFARGCVSTPEQGLQAANKIGFPVMIKASEGGGGKGIRKVEVPDDFSNMFRQVQAEVPGSPIFVMKLARSARHLEVQLLADQYGNAISLFGRDCSIQRRHQKIIEEAPAAVAKPEVFIEMEKAAVRLAKMVGYVSAGTVEYLYEPITGAYYFLELNPRLQVEHPCTEMVADVNLPAAQLQIAMGLPLYHIKDIRLLYGESPWGMTQIDFDEPKQRPSPWGHVIAARITSENPDEGFKPSSGTVQELNFRSSKNVWGYFSVAASGGLHEFADSQFGHCFSFGETREQARENLVIALKELSIRGDFRTTVEYLITLLETPAFQDNNIDTSWLDALIAERVQSEKPDVMLGVICGSILIADNLITAHLLEFKSALEKGQIQGSSQLSNTVEVELIHSGHKYKVQATKSGPTSYFLAMNGSFKELEVHKLTDGGTLLSIDGASYTTYLKEEVDKYRIVIGNQTVVFEKEKDPSKLRAPSAGKLVNTLVEDGGHVDKGQPYAEIEVMKMVMTLSAPESGKVFWNLRPGAVLDMGALMGTLELDDPSLVTTAQPYKGQFPHEDNPNLTEKLNHAHNKYRYILENTLAGYCLPEPYNTPRLREVVEKFMSSLRDPSLPLLELQEVLSSTSGRIPVSVEKKVRKLMALYESNITSVLAQFPSQQIASVIDHHAASLAKRADRDVFFMSTQALVVLVQRYRNGIRGRMKAAVHDLLKQYYQVESNFQLGSYDKCVMALRDRYKDDMQAVANIIFSHNQVAKKNLLVTMLIDHLWSNEPGLTDELAATLNELTSLHRAEHSRVALRARQVLIAAHQPAYELRHNQMESIFLSAVDMYGHDFHPENLQKLILSETSIFDILHDFFYHTNAAVSRPSRP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: