MonarchBase - Protein-coding gene

DPOGS205605
Transcript	DPOGS205605-TA	1677 bp
Protein	DPOGS205605-PA	558 aa
Genomic position	DPSCF300167 + 138123-154771
RNAseq coverage	2277x (Rank: top 5%)

Annotation
*Heliconius*	HMEL017459	0.0	85.57%
*Bombyx*	BGIBMGA007210-TA	8e-147	90.41%
*Drosophila*	CG4538-PA	1e-169	62.00%
EBI UniRef50	UniRef50_Q16HN4	0.0	68.49%	ATP-dependent clp protease atp-binding subunit clpx n=6 Tax=Metazoa RepID=Q16HN4_AEDAE
NCBI RefSeq	XP_001605256.1	0.0	64.51%	PREDICTED: similar to ATP-dependent clp protease atp-binding subunit clpx [Nasonia vitripennis]
NCBI nr blastp	gi\|340729247	0.0	64.90%	PREDICTED: ATP-dependent Clp protease ATP-binding subunit clpX-like, mitochondrial-like [Bombus terrestris]
NCBI nr blastx	gi\|345488179	0.0	64.19%	PREDICTED: ATP-dependent Clp protease ATP-binding subunit clpX-like, mitochondrial-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0006457	1.9e-254	protein folding
	GO:0005524	1.9e-254	ATP binding
	GO:0051082	1.9e-254	unfolded protein binding
	GO:0000166	5.1e-11	nucleotide binding
	GO:0017111	5.1e-11	nucleoside-triphosphatase activity
KEGG pathway	nvi:100121647	0.0
	K03544 (clpX, CLPX)	maps->	Cell cycle - Caulobacter
InterPro domain	[12-547] IPR004487	1.9e-254	Clp protease, ATP-binding subunit ClpX
	[224-439] IPR013093	5.1e-37	ATPase, AAA-2
	[446-517] IPR019489	6e-14	Clp ATPase, C-terminal
	[223-374] IPR003593	5.1e-11	ATPase, AAA+ type, core
Orthology group	MCL11969		Single-copy universal gene

Nucleotide sequence:

>DPOGS205605-TA
ATGAGTAGCGTTCGACTTAGTTTCGTATCAGTGGGACGGATTGCGGTAAGGAGAAATTCTCAGTTCACATCGGTAGCGTCAGGTGTTCAGACGTGTCGCGCCATCCGTCGCTCCTGTGCCCGCAGCATCAGCACCGGCGTCTCCCTCAGGAAGGGCACCGGGGAACTGCCGCCATCACACAACAAGGATGGGAATACATCCGGAACATCAGGTAAGAAAGGCGGCAGCGGAGTCCTAACATGTCCTAAGTGCGGGGACCCTTGTACCCACGTTGAGACGTTCGTCAGCTCGACACGTTTCGTGAAGTGCGACAAGTGCCACCACTTTTTCGTGGTCCTCAGCGAGGTGGACACCAAGAAGAGCATCAAGGACAACACTGAGAACAAGTCCGGCTTCTACAGGAAACCTCCTCCTCCACCAAAGAAGATCTTCGAATATCTGAACAAGCACGTGGTGGGTCAGGAATACGCCAAGAAGGTGTTGTCAGTTGCCGTCTACAACCACTACAAGCGTATATACAACAACGTGACGAGCGGCGCGCCCGCCGACGGACAACATCCGCTACATCACACGCACAGAGATCTGCTCCACGTGAACCAGGGCCAGAGCCCCGGCGCGGGGGGAGGGGCGGAGGTGCTGGAGAGGAACAACCACGAGCTCAGGCTCGACAAGAGCAATGTGCTGCTGCTGGGACCCACCGGCAGCGGTAAGACCCTCCTCGCTCAAACCATCGCCCAGTGCCTGGACGTGCCGTTCGCCATCTGTGACTGCACCACCCTCACCCAGGCCGGGTACGTGGGCGAGGACATCGAGAGCGTCATCGCTAAACTGCTACAGGACGCCAACTTCAATGTTGAACGAGCACAGACCGGTATAGTGTTTTTGGACGAAGTCGACAAAATAGGAGCCGTGCCCGGGATACACCAGCTGAGGGATGTTGGAGGCGAGGGAGTTCAGCAGGGTATGCTGAAGATGTTGGAGGGCGCGCTGGTGTCCGTCCCCGAGAGGAACTCGCGCAAGCTGAGAGGAGACGCCGTGCAGGTCGACACCACCAACATACTGTTCGTGGCCAGCGGCGCTTATAACGGACTGGACAGACTGATCCAGCGCCGCAACAACGAGAAGTACCTCGGCTTCGGTGCCTGGGACCCTCGCTCGGGGCGCCGCGCAGCCCTGGCCGCCGCCGCCGCCGACGCCTCGCCCCTGGACAGCGCCACGGACGAGGCGGGCGAGAGGGACCACTGGCTGCGAGCCGTGCAGGCCCGGGACCTTATCGACTTCGGCATGATACCGGAGTTCGTCGGCCGCTTCCCGGTGCTGGTGCCCTTCCACAGTCTGAACCAAGATCTGCTGGTTAGGATACTCACGGAACCCAAGAACGCCATTGTGGCTCAGTACAAGTTGTTGTTCGCGATGGACAAGTGCGAGCTGTCGTTCAGCGACGAAGCCTTACGAGCGGTGGCCGCACTCGCCATGGAGAGGAAGACGGGCGCCAGGGGATTGCGGGCTATCATGGAGAATCTGTTACTGGAGGTGATGTTCGAGATCCCCGGCTCAGACATAACCTGCGTTCACATACACGAGGGCTGCGTGCAACGAGCGGAGCCGCCCACCGTGAGGCGGAGGGAGAGGGAGAGGCAACCCTGGAGCTCGGTGCGACTCTCTAATTGTACGTAG

Protein sequence:

>DPOGS205605-PA
MSSVRLSFVSVGRIAVRRNSQFTSVASGVQTCRAIRRSCARSISTGVSLRKGTGELPPSHNKDGNTSGTSGKKGGSGVLTCPKCGDPCTHVETFVSSTRFVKCDKCHHFFVVLSEVDTKKSIKDNTENKSGFYRKPPPPPKKIFEYLNKHVVGQEYAKKVLSVAVYNHYKRIYNNVTSGAPADGQHPLHHTHRDLLHVNQGQSPGAGGGAEVLERNNHELRLDKSNVLLLGPTGSGKTLLAQTIAQCLDVPFAICDCTTLTQAGYVGEDIESVIAKLLQDANFNVERAQTGIVFLDEVDKIGAVPGIHQLRDVGGEGVQQGMLKMLEGALVSVPERNSRKLRGDAVQVDTTNILFVASGAYNGLDRLIQRRNNEKYLGFGAWDPRSGRRAALAAAAADASPLDSATDEAGERDHWLRAVQARDLIDFGMIPEFVGRFPVLVPFHSLNQDLLVRILTEPKNAIVAQYKLLFAMDKCELSFSDEALRAVAALAMERKTGARGLRAIMENLLLEVMFEIPGSDITCVHIHEGCVQRAEPPTVRRRERERQPWSSVRLSNCT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: