MonarchBase - Protein-coding gene

DPOGS208369
Transcript	DPOGS208369-TA	2358 bp
Protein	DPOGS208369-PA	785 aa
Genomic position	DPSCF300146 - 145924-154602
RNAseq coverage	618x (Rank: top 21%)

Annotation
*Heliconius*	HMEL007236	78.26%
*Bombyx*	BGIBMGA012223-TA	90.49%
*Drosophila*	CG2658-PA	61.11%
EBI UniRef50	UniRef50_O76867	61.11%	EG:100G10.7 protein n=18 Tax=Eumetazoa RepID=O76867_DROME
NCBI RefSeq	XP_001813433.1	66.62%	PREDICTED: similar to paraplegin [Tribolium castaneum]
NCBI nr blastp	gi\|189235434	66.62%	PREDICTED: similar to paraplegin [Tribolium castaneum]
NCBI nr blastx	gi\|189235434	66.91%	PREDICTED: similar to paraplegin [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	7.6e-176	membrane
	GO:0004222	7.6e-176	metalloendopeptidase activity
	GO:0030163	7.6e-176	protein catabolic process
	GO:0006508	8.1e-70	proteolysis
	GO:0005524	8.1e-70	ATP binding
	GO:0000166	2.4e-19	nucleotide binding
	GO:0017111	2.4e-19	nucleoside-triphosphatase activity
KEGG pathway
InterPro domain	[249-738] IPR005936	7.6e-176	Peptidase M41, FtsH
	[537-737] IPR000642	8.1e-70	Peptidase M41
	[339-473] IPR003959	1.2e-39	ATPase, AAA-type, core
	[334-476] IPR003593	2.4e-19	ATPase, AAA+ type, core
Orthology group	MCL12117		Single-copy universal gene

Nucleotide sequence:

>DPOGS208369-TA
ATGTTATTAATCAAGCGACTACCAGCGCTTTCAGCATCAAAAATTAATTTAAAAGTACCGTATCTTGAAAAAAATGTGATCCTCGAGAGGCAAATTAGTAAACACTGCCACTATAATTTGTTAAAGTTATGTAAATCTGCATCAGTACTACATAATTTAACCCACAAATCTAAAAATCCACAACTTCGGCAGTTCCATGCAGAATATAAGGCAGCCTTTGCTTTGCTGCAGAGATCAAATTTTTTAGGATTTGGTTCCTTTTTAAATACAAATTCAAGAAGGTTGCATACAAATTCCCCAAATCAAAACAGGAAAAATGAAGACAATGACGATAAGGAGAAAAAGAAAGAAAACGATAAAGGGACAATGCCATCATTATTACTGAAGGCGGCATTTTGGATGCTCACAACATTTACCTTAATAATGCTCAGCTCATTTCTTGTACCAGGAGACAACACACAAAATGAGTTAATCCGTTACGTGTCGTGGAACGAGTTCGTATATTCGATGTTATCAAAGGGGGAAGTTGAGGAATTGATAGTCCGACCAGATTTAGAGGTGGTCACCATTATATTACACGAAGGTGCTGTCATAAAAGGCAAAAGATCAAACCATCGAGTTTTCCACATGAATGTTGGTGACATTCATCGGTTTGAAGAGAAACTGAGAGAGACAGAACTCGGCCTAGGGGTTAAGGAAGGAGTTCGTGTAATATATGATAGGAATGGAAGTGTCGCTGGGAAAATTATTACAAGCCTTCTGATAGCCGCTATTATTATGTCCTTCCTCTATTCAACTAAGTCAATGAGGATGAATATAAACTTGGGTGGATTTAGTCAGTTGAGGCGTGCCAAATTCACTCTAGTTGATTCTATGAGCGGTCAAGGGAAGGGTGTTAAGTTTGAGGACGTGGCCGGCCTGAAGGAAGCCAAGATAGAGGTTATGGAGTTTGTTGACTACTTGAAGCGACCAGAGCATTACAGAAGCTTAGGTGCTAAGGTGCCCAAGGGAGCTCTGTTACTTGGTCCACCGGGTTGTGGTAAGACGTTACTTGCTAAGGCTGTGGCTACGGAAGCTAATGTACCATTTCTCTCTATGAACGGATCAGAGTTCATCGAAATGATCGGAGGCTTGGGAGCGGCGAGAGTCAGGGATCTGTTCAAAGAGGCGAGCTCGAGAGCACCCTGTATAATATATATCGACGAAATGGATGCCGTTGGTCGTGCGAGGTCATCCGGCACTTCCTCCTGGGGTCCCGGCGGTGGGGAGGGGGAACAGACCCTCAATCAGTTGCTGGTAGAAATGGACGGCATGAAAAGCAGGGAGGGGGTCGTTGTATTAGCCAGCACCAACAGAGCTGATGTACTAGATAAGGCGCTACTCCGTCCGGGACGGTTCGACAGACACATCCTCATAGATTTACCGACTTTGTTAGAACGAGAAGAAATCTTCGAGAGGCATTTGAAGAACATAGTACTTGAGAAGTTGCCACCTTATTATGTTAAACGTCTTGCGTATTTAACGCCTGGATTCAGTGGCGCTGATATAGCTAACGTTTGTAACGAGGCGGCCTTACACGCTGCTAGATTCAAGCAAAGTATAGTGAAGGCTTCGGATCTGGAATACGCCGTCGAGAGGGTCGTCGGTGGTACGGAAAAACGAAGTCACGCTATTTCACCGGCTGAGAAGCGTGTCATAGCTTACCATGAGGCGGGACACGCTCTGGTCGGCTGGCTGCTAGAACATACGGACGCCTTGCTCAAGGTCACGATCGTGCCGCGTACCAATAAAGCATTGGGCTTCGCTCAATACACGACATCAGATCAAAAACTGTACTCCAAGGAAGAGTTGTTCGATCGCATGTGTATGGCGTTGGGCGGTCGGGCGGCCGAGGCGATAACATTCAACTCTGTAACCAGCGGAGCCCAGAACGACCTTGAGAAGGTCACCAAAATAGCATACGCACAGGTCCGTGTTTTCGGCATGTCGCCGAGCGTAGGGTTGGTTTCTTTCCCCGATGTCAAAGAGCACCAGAGGAGTCCATTCAGCAAGGCTCTGAAGAACCTCATAGATATGGAGGCGAGACAGCTGATCGCTAAAGCCTACTACAGGACCGAGGAGCTCTTGAAACGGAATGAGAACAAACTGAAATTACTCGCCGAGGAACTTATAAAGAAAGAAACGCTCAACTACAAGGACGTTGAGGCTATTCTAGGCAAGCCTCCGTTCGCCAAGAAATTCATAGATCCGATAGAGTTCGAACAGAATCTAAGGAACATGGAACACGTCGCTAAAACCGGAGACGATGACGTCGGCGCGGCCTCAGCCAAACCCACCGCAAACAACGGCCTTCACTAG

Protein sequence:

>DPOGS208369-PA
MLLIKRLPALSASKINLKVPYLEKNVILERQISKHCHYNLLKLCKSASVLHNLTHKSKNPQLRQFHAEYKAAFALLQRSNFLGFGSFLNTNSRRLHTNSPNQNRKNEDNDDKEKKKENDKGTMPSLLLKAAFWMLTTFTLIMLSSFLVPGDNTQNELIRYVSWNEFVYSMLSKGEVEELIVRPDLEVVTIILHEGAVIKGKRSNHRVFHMNVGDIHRFEEKLRETELGLGVKEGVRVIYDRNGSVAGKIITSLLIAAIIMSFLYSTKSMRMNINLGGFSQLRRAKFTLVDSMSGQGKGVKFEDVAGLKEAKIEVMEFVDYLKRPEHYRSLGAKVPKGALLLGPPGCGKTLLAKAVATEANVPFLSMNGSEFIEMIGGLGAARVRDLFKEASSRAPCIIYIDEMDAVGRARSSGTSSWGPGGGEGEQTLNQLLVEMDGMKSREGVVVLASTNRADVLDKALLRPGRFDRHILIDLPTLLEREEIFERHLKNIVLEKLPPYYVKRLAYLTPGFSGADIANVCNEAALHAARFKQSIVKASDLEYAVERVVGGTEKRSHAISPAEKRVIAYHEAGHALVGWLLEHTDALLKVTIVPRTNKALGFAQYTTSDQKLYSKEELFDRMCMALGGRAAEAITFNSVTSGAQNDLEKVTKIAYAQVRVFGMSPSVGLVSFPDVKEHQRSPFSKALKNLIDMEARQLIAKAYYRTEELLKRNENKLKLLAEELIKKETLNYKDVEAILGKPPFAKKFIDPIEFEQNLRNMEHVAKTGDDDVGAASAKPTANNGLH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: