MonarchBase - Protein-coding gene

DPOGS215092
Transcript	DPOGS215092-TA	2673 bp
Protein	DPOGS215092-PA	890 aa
Genomic position	DPSCF300187 + 263008-272113
RNAseq coverage	601x (Rank: top 21%)

Annotation
*Heliconius*	HMEL010543	73.71%
*Bombyx*	BGIBMGA007194-TA	69.68%
*Drosophila*	CG8798-PC	55.60%
EBI UniRef50	UniRef50_Q7KUT2	55.60%	Lon protease homolog, mitochondrial n=8 Tax=cellular organisms RepID=LONM_DROME
NCBI RefSeq	XP_973021.1	64.00%	PREDICTED: similar to AGAP010451-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91077206	64.00%	PREDICTED: similar to AGAP010451-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91077206	57.97%	PREDICTED: similar to AGAP010451-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	2.1e-207	proteolysis
	GO:0005524	2.1e-207	ATP binding
	GO:0004176	2.1e-207	ATP-dependent peptidase activity
	GO:0004252	2e-71	serine-type endopeptidase activity
KEGG pathway
InterPro domain	[477-886] IPR004815	2.1e-207	Peptidase S16, ATP-dependent protease La
	[680-886] IPR008269	2e-71	Peptidase S16, Lon C-terminal
	[704-890] IPR020568	5.9e-53	Ribosomal protein S5 domain 2-type fold
	[112-378] IPR003111	3.8e-44	Peptidase S16, lon N-terminal
	[110-222] IPR015947	1.6e-14	PUA-like domain
	[477-599] IPR003959	1.9e-12	ATPase, AAA-type, core
Orthology group	MCL11213		Single-copy universal gene

Nucleotide sequence:

>DPOGS215092-TA
ATGCACATAGCGAGTGTATTAGTGCGTAATACCGCACTTCTTAATCCCTCGATTAGGCCTTCATCGCAAACTGTTCGTAATGTAACCAAAATTGCATCATATTGCAAGCCGGTAGGAAATCGTTTTTTTAATGGACACAATTTGTACGGAACTCGCAACGCTCGGATATGCTCGTATAACCAAGAATATGCAGCCGTGAAAAAGGTACAGAACATTAGACATTATTCGAAGAAGCTTAATCCGGAAGAAGAGGAATCAGCTGATATTAAAGAGGACCCGCCATTGTTCTCAAGCCAGCTACCAGCAACTGTGGCTGTGCCTGAAGTGTGGCCGCAAGTGCCCGTTATTGCCATTAATAGGAACCCCGTTTTTCCAAGATTTATTAAATTAATTGAGATATCAAACCCAGCTTTAATAGATCTAATAAGGCGTAAAGTGAAACTGAATCAGCCGTATGTTGGTATATTTTTGCGTAAGAAAGAAGACGAGAAATCAGATGTTGTGTCGAGTTTGGACGATCTTCATGATGTGGGGGTGTTCGCTCAGATCCACGAGATGCAGGATATGGATTACAAGCTACGTCTAGTCGTTATGGCACACAGAAGAATAAAAATCACCGGCCAGTTTATAGAAGACGAGATCGAAACTGGCCCAGCCGAAATGAAGCTAAAGTTTCCCGTATTTAACGTGGAATTTAACGTTACCCGCGAAGAATCAGACGCTGAGCGACGTAGGAGGAAATATCGTAACACGAGACGGCAACGTAACGACTCGGACGCGGAACACGAGAAGGAGGTGCAGGAACCAAAGGAAGCTAAGAAACCTCCGCCGGACCAGCTTATGATGGTCAAAGTGGAGAATATGATGCATGACAAGTTCCAGCAGAACGAGGAGGTGAAAGCGTTGACGCAGGAGATCATCAAGACTATCAGGGATATCATCAATATGAACCCCCTGTATAGAGAATCTCTGCATCACATGCTAGCTCAAGGTCAGCGTGTTGTGGACGATCCCGTGTACCTCGCGGATTTAGGCGCCGCCTTAACCGCAGCTGAGCCCAAGGACCTACAGCCGGTTCTTGAGGAGATGGATATTCCGAAACGACTGTTACTATCATTATCACTGCTGAAGAAGGAATATGAACTGTCCAAATTGCAGCAGAAAATCGGTAAGGAAGTTGAAGAAAAGGTGAAACAGCAGCACAGGAAATACATTCTGCATGAACAACTCAAGGTTATAAAAAAAGAATTAGGTCTTGAGAAGGATGACAAAGACGCCATTGGTGAGAAATTCCGCGAGAGACTGGCTGATAAAGTGGTACCACCCTCTGTTCAGACGGTCATTGACGAGGAGCTCAACAAACTGAACTTCCTAGAGAGTCATAGCTCAGAGTTCAAGTTAGTATGGTCGATAACGTTCAATAAAACCCGTTCCATAGCCAGAGCGTTGAACCGTAAGTATTTTAGGTTCTCAGTGGGCGGTATGACGGATGTGGCGGAGATAAAGGGACACAGACGTACATACGTGGGCGCTATGCCCGGGAAGCTGGTGCAGTGCTTGAAGAAGACGAACACAGAGAACCCATTGGTCCTTATAGATGAAGTGGATAAGATCGGGAAAGGTGTCCACGGTGATCCGTCATCAGCTCTTCTGGAACTGCTGGATCCAGAACAGAACGCGAATTTCCTGGACCACTACTTGGATGTTCCGGTGGACCTGTCTCGAGTGCTCTTCATCTGCACAGCGAACGTACTCGACCTTATACCGGAACCTCTGAGGGACAGGATGGAACTTATAGAAATGTCAGGATATGTGGCAGAAGAGAAGCTAGCCATAGCCCAGCAGTACTTGATACCGACAGCCCTCAAGAACTGTGGTCTCACAGACGAAAAAATCAATATAACACCGGAGGCATTACACACACTCATAAGGTCATACTGCAGGGAGAGCGGAGTCAGGAATCTACAGAAACATATTGAGAAGATTGCACGTAAGGTAGCCTACAAGCTTGTAAAGAAAGAGACGTCTTCCTTATCTGTGACGGACGCTAATTTATCGGAACTGGTTGGGAAGCCGACCTTCAAACACGACCGCATGTATGACGTCACACCACCCGGAGTGGTGATGGGCCTAGCGTGGACCGCCATGGGTGGTAGTACGTTATACATAGAAACAGCTGTACGGAACACTATGAAGGGTGAGAAGCAATCCGGCTCGCTGGAGCTGACCGGGCACCTGGGTGACGTCATGAAGGAGTCGGCCCGGATCGCGCTCACCGTGGCCCGCAACTACCTCAAGGAGTCCCAGCCGGACAACGACTTCCTTAACACCAGTCACCTCCACCTCCACGTGCCCGAGGGCGCGACTCCCAAGGACGGTCCATCAGCGGGCGTGACCATCGCCACCGCTCTCCTGAGCCTAGCGCTCCAACGACCAGCCAACACCCTCGCTATGACCGGGGAGCTCACCCTCACTGGACGAGTGCTGCCCGTTGGAGGGATCAAGGAGAAGATTATAGCGGCTAAGCGTGTCGGAGTGACTTGCGTGATTCTCCCCGAGGACAACAGGCGCGACTTCGACGACCTGCCCTCCTTCATCAGGGACGGTATCGACGTGCACTTCGTCAATGTGTATGATGACGTGTTCAAGATAGTCTTCGACGGAAAGGTTTAA

Protein sequence:

>DPOGS215092-PA
MHIASVLVRNTALLNPSIRPSSQTVRNVTKIASYCKPVGNRFFNGHNLYGTRNARICSYNQEYAAVKKVQNIRHYSKKLNPEEEESADIKEDPPLFSSQLPATVAVPEVWPQVPVIAINRNPVFPRFIKLIEISNPALIDLIRRKVKLNQPYVGIFLRKKEDEKSDVVSSLDDLHDVGVFAQIHEMQDMDYKLRLVVMAHRRIKITGQFIEDEIETGPAEMKLKFPVFNVEFNVTREESDAERRRRKYRNTRRQRNDSDAEHEKEVQEPKEAKKPPPDQLMMVKVENMMHDKFQQNEEVKALTQEIIKTIRDIINMNPLYRESLHHMLAQGQRVVDDPVYLADLGAALTAAEPKDLQPVLEEMDIPKRLLLSLSLLKKEYELSKLQQKIGKEVEEKVKQQHRKYILHEQLKVIKKELGLEKDDKDAIGEKFRERLADKVVPPSVQTVIDEELNKLNFLESHSSEFKLVWSITFNKTRSIARALNRKYFRFSVGGMTDVAEIKGHRRTYVGAMPGKLVQCLKKTNTENPLVLIDEVDKIGKGVHGDPSSALLELLDPEQNANFLDHYLDVPVDLSRVLFICTANVLDLIPEPLRDRMELIEMSGYVAEEKLAIAQQYLIPTALKNCGLTDEKINITPEALHTLIRSYCRESGVRNLQKHIEKIARKVAYKLVKKETSSLSVTDANLSELVGKPTFKHDRMYDVTPPGVVMGLAWTAMGGSTLYIETAVRNTMKGEKQSGSLELTGHLGDVMKESARIALTVARNYLKESQPDNDFLNTSHLHLHVPEGATPKDGPSAGVTIATALLSLALQRPANTLAMTGELTLTGRVLPVGGIKEKIIAAKRVGVTCVILPEDNRRDFDDLPSFIRDGIDVHFVNVYDDVFKIVFDGKV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: