MonarchBase - Protein-coding gene

DPOGS214561
Transcript	DPOGS214561-TA	2262 bp
Protein	DPOGS214561-PA	753 aa
Genomic position	DPSCF300266 + 137194-145487
RNAseq coverage	1331x (Rank: top 10%)

Annotation
*Heliconius*	HMEL016113	0.0	80.86%
*Bombyx*	BGIBMGA010088-TA	3e-94	41.19%
*Drosophila*	CG3499-PC	0.0	69.91%
EBI UniRef50	UniRef50_F3YDF1	0.0	69.91%	MIP17311p n=16 Tax=Endopterygota RepID=F3YDF1_DROME
NCBI RefSeq	XP_970259.1	0.0	60.53%	PREDICTED: similar to GA17483-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91086165	0.0	60.53%	PREDICTED: similar to GA17483-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91086165	0.0	60.27%	PREDICTED: similar to GA17483-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	3.2e-154	membrane
	GO:0004222	3.2e-154	metalloendopeptidase activity
	GO:0030163	3.2e-154	protein catabolic process
	GO:0005524	1.3e-41	ATP binding
	GO:0006508	4e-40	proteolysis
	GO:0000166	1.7e-21	nucleotide binding
	GO:0017111	1.7e-21	nucleoside-triphosphatase activity
KEGG pathway
InterPro domain	[255-722] IPR005936	3.2e-154	Peptidase M41, FtsH
	[337-467] IPR003959	1.3e-41	ATPase, AAA-type, core
	[529-636] IPR000642	4e-40	Peptidase M41
	[333-470] IPR003593	1.7e-21	ATPase, AAA+ type, core
Orthology group	MCL12854		Single-copy universal gene

Nucleotide sequence:

>DPOGS214561-TA
ATGTTCTCATTGAACTCCATAAACACCCAGAACCAGATTCTAATAAGTTTTAGTCAACTATCGTCTCGATATTCCAACGCATTTAGAAATAGAAGGAGTAGCAATGTTAAGAACAAAGATTTAATAAGAAAAGAGGCCACAACAGCTCCTTACAACGCATCAATATGTCCAGAAAGTTTTGATGAGGCCCTGCGTCATTTTGATAAGAATGTATTAACGGAGATGCGTAACATTGATCTGAGATATGTGACATCTTTAGCCGGATCCTCTAGTAATATTATGAGAAATGTAGCCGGCTTAGCATCGTCCAAAAAAGTATCATTCGTATCTACGGATTCGTTTGAGAAAAACAAAAATGGTTGGGTCGCTACACCTACGATCACCGTAGACCTACGCCACAAAAATACTAAACTTAGTTTGACCGACAACTTTGTTGGTCTGCTGTCGAAGAGCATAAGGGATAATTGCTTTAATTATAATGTACAAGTAAGAGGTTTTAAGACAGAAAGAGGTATACATGCTGATCTGAAGAGAAACCCCAATTTATTTAATAGACTACGTCTTCATGTATCCGACACGTCTGATAACAAATCCAACCTCGGTCCAGATGTTGCTCCACGATTGGAGAAGTTGCTCAGTGAAGACTCGACTAATCTTACACACCAACAGAAGGATAAGATTAAAATTGCCTTTGCCGAGGGATATTTGGCAGGATCTCACCCTGACAATGCCCGAGGGACGAAGGCCTCTAAGTACTTAAAGCTAGTACAACAACTCCTCACTATAGTACTATTCCTGGCTATATTTGTCAGTCTGATGGCATCTGTTAGCGGCACTGTTTTCCGGATCCAGTTGGGTAACCAGGTGGAGGTGGATCCTGAAGATATAACGGTCACCTTCGATGACGTCAAGGGTGCTGACGAAGCCAAGCAGGAGCTCAAGGATGTGGTGGAGTTCCTGAAATCCCCGGAGAAGTTTTCATCTTTGGGGGGCAAATTGCCTAAGGGTGTGTTACTGGTGGGTCCCCCTGGCACCGGGAAGACGTTATTGGCTCGAGCTGTGGCTGGTGAGGCGAGGGTGCCGTTCTTCCACGCAGCCGGACCAGAGTTCGATGAGATCCTCGTGGGACAGGGCGCTAGGCGCGTCAGGGATCTATTTAAGGCGGCCAAGGAGCGAGCCCCCTGCGTCATATTCATTGACGAGATAGATTCAGTGGGTGCCAAACGTACCAACAGCGTGCTGCATCCGTACGCCAACCAGACAATAAACCAACTCTTATCAGAGATGGATGGATTCCATCAGAACGAGGGTGTGATAGTGCTGGGCGCCACCAACAGGAGAGACGACCTGGACCAGGCCCTGCTGAGACCTGGAAGATTCGATGTCGAAGTGTCCGTACCAACACCAGACTACGGTGGTCGTCTGGAGATACTGCGGATGTACGTGTCGAGGGTCGCGGCTGCCCCGGGGCTGGACGTGGAATCCCTAGCCAGGGGTACCACGGGATTCACGGGCGCTGACCTCGAGAGTATGGTCAACCAGGCAGCACTCAAGGCAGCCATCGAGGGCGCCAAAACTGTGAGCATGTACCACCTGGAGGAGGCGAGGGACAAGGTGCTCATGGGCCCGGCGAGAAGAGCGAGGCTACCCGACGACGAGGCCAACGCTATCACCGCCTGCCACGAGGGCGGGCATGCGGTGGTAGCGTACTACACTAAGGATTCTCACCCACTTCACAAGGTCACCATAATACCACGCGGACCTTCCCTGGGACACACAGCCTACATACCGGCCAAAGAAAGATATCACGTGACGAAACAACAACTCCTGGCTATGATGGACACCATGATGGGCGGGCGGGCGGCCGAGGAACTGGTCTACGGACCGGATAAGATTACATCGGGTTTAGGAGGTGCAAGTGATCAAGGCCGCCATCACACCGAATCTACAGGTGGCATAGCCAGCGGTTGGCGTACTTCCGCCTTCTTCCACGGTTTCACCTGGAGAATGGAAAATGCTGTGGATGCTGAAATAAAGAAAATTCTATCAGAGAGCTACGAAAGAGCTAAGGCCATACTGAGGACGCACGCTAAAGAACATAAGGCTCTGTCGGAAGCCTTATTAAAATACGAGACTCTGGACGCTGACGACATCAAAGCGATCATGTCAGGAGACAAGGTGAAGATGGACCGAGGTAGAAGCAGCAACACTAATAAGGAGCCCTCGCCCGCCACGCTGCTGCCGCACACGATGCCCGCTTAG

Protein sequence:

>DPOGS214561-PA
MFSLNSINTQNQILISFSQLSSRYSNAFRNRRSSNVKNKDLIRKEATTAPYNASICPESFDEALRHFDKNVLTEMRNIDLRYVTSLAGSSSNIMRNVAGLASSKKVSFVSTDSFEKNKNGWVATPTITVDLRHKNTKLSLTDNFVGLLSKSIRDNCFNYNVQVRGFKTERGIHADLKRNPNLFNRLRLHVSDTSDNKSNLGPDVAPRLEKLLSEDSTNLTHQQKDKIKIAFAEGYLAGSHPDNARGTKASKYLKLVQQLLTIVLFLAIFVSLMASVSGTVFRIQLGNQVEVDPEDITVTFDDVKGADEAKQELKDVVEFLKSPEKFSSLGGKLPKGVLLVGPPGTGKTLLARAVAGEARVPFFHAAGPEFDEILVGQGARRVRDLFKAAKERAPCVIFIDEIDSVGAKRTNSVLHPYANQTINQLLSEMDGFHQNEGVIVLGATNRRDDLDQALLRPGRFDVEVSVPTPDYGGRLEILRMYVSRVAAAPGLDVESLARGTTGFTGADLESMVNQAALKAAIEGAKTVSMYHLEEARDKVLMGPARRARLPDDEANAITACHEGGHAVVAYYTKDSHPLHKVTIIPRGPSLGHTAYIPAKERYHVTKQQLLAMMDTMMGGRAAEELVYGPDKITSGLGGASDQGRHHTESTGGIASGWRTSAFFHGFTWRMENAVDAEIKKILSESYERAKAILRTHAKEHKALSEALLKYETLDADDIKAIMSGDKVKMDRGRSSNTNKEPSPATLLPHTMPA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: