MonarchBase - Protein-coding gene

DPOGS214555
Transcript	DPOGS214555-TA	3039 bp
Protein	DPOGS214555-PA	1012 aa
Genomic position	DPSCF300266 - 64297-67335
RNAseq coverage	431x (Rank: top 28%)

Annotation
*Heliconius*	HMEL003162	77.50%
*Bombyx*	BGIBMGA003279-TA	72.78%
*Drosophila*	CG3107-PA	45.60%
EBI UniRef50	UniRef50_B0WCZ9	50.90%	Presequence protease, mitochondrial n=1 Tax=Culex quinquefasciatus RepID=B0WCZ9_CULQU
NCBI RefSeq	XP_001662373.1	52.19%	metalloprotease [Aedes aegypti]
NCBI nr blastp	gi\|157131944	52.19%	metalloprotease [Aedes aegypti]
NCBI nr blastx	gi\|157131944	52.19%	metalloprotease [Aedes aegypti]

Group
Gene Ontology	GO:0008237	1.8e-66	metallopeptidase activity
	GO:0006508	1.8e-66	proteolysis
	GO:0008270	1.8e-66	zinc ion binding
	GO:0046872	4.9e-58	metal ion binding
	GO:0003824	4.9e-58	catalytic activity
	GO:0004222	1.4e-11	metalloendopeptidase activity
KEGG pathway
InterPro domain	[501-747] IPR013578	1.8e-66	Peptidase M16C associated
	[297-559] IPR011249	4.9e-58	Metalloenzyme, LuxS/M16 peptidase-like, metal-binding
	[74-280] IPR011237	1.3e-21	Peptidase M16, core
	[242-425] IPR007863	1.4e-11	Peptidase M16, C-terminal
Orthology group	MCL11946		Single-copy universal gene

Nucleotide sequence:

>DPOGS214555-TA
ATGTATTCAAGACTTCACAAGCTGTCGGGCTTACAAAAAAGCCTCATTATAGCCGGCCAGAGAAATTACGCTGGAGGGATTCTGAAAACGAAGAAGAATCTGTCGAGCTTGCAACCAGGAAAGGTCTACCATGGATTTATGTGCTGTGAAGTGGAACCAATAAATGAGTACAACATGACCGCGTACCTGTTAAGACACGAGAAAACTCAGACTGAATACCTGCATTTAGAGAGAGACGACACAAATAATGTTTTTTCTGTCGGTTTCCGTACAACTCCACTAGATTCTATGGGAACTCCACACATTTTGGAGCACACGGTGTTATGTGGCTCAGAAAAGTACCCAGTCAGAGATCCCTTCTTTAAAATGCTCAACAGATCTCTAGCTACATTCATGAATGCATTGACGGGTCCCGATTATACATTTTACCCGTTTTCATCCCAAAATGAAGTTGACTATAGGAATCTGCAGAAAGTATATCTAGATGCTGTGTTTAAACCTAATCTATCTAGATTAGACTTTCTACAAGAAGGTTGGAGGTTGGAACATTCTAATCTAGATGATAAATCTTCAAATTTAGTGTTCAAAGGTGTAGTGTATAATGAAATGAAAGGTGCATTCTCCGAGACAAGCTCACTGTTCGGCCAAAAGTTCATTAACACAATACTGCCGCAAGGCACATATGGCTTTGTGTCTGGCGGTGACCCTTTACACATTCCGGAACTAACCCATGAACATTTGAAAAAATTCCACGCCACCTACTATCACCCGAGTAATTCCAGAATATACTCCTATGGTAGTTTTCCTTTGGAACATAATCTAAAATTTCTTAATGAGACATATCTTAGTAAATATGAGTACCTTGATCCTAGTGCTACCGTTGTTGCACCACAGGAAAGGTGGAAAATGCTCAAAAGATCAAATATCCCCTGTAGATTTGACCAGTATGGTGGTCCCATAGAAAAACAGAACCAAATAGCCATGGGTATGGTTATGTCTGACATAACAGACATATATGAGACATTCATGCTGACGGCACTAGCTGAATTAATGATTATAGGTCCAAATTCAGCCTTCTATAAAAGCCTTATCGAGAAAAACATTTCTGGTGGTTACAACTCCTTGACGGGCTATGACAATCAGATACGTGATACACTATTTGTGGTCGGCTTACGTGATGTGGAAGAGTCAAAGTTTGACCTGGTTGAGAAGATTGCAAATCAGACCATACAAGATATATATGAGAAAGGCTTTGAAAAAGACCATATCGAAAGTGTACTCCACGGTTTTGAGTTGTCTATAAAACACCAGTCGCCCAAATTTGGCCTCAATATGCTTTTCAATCTAATGCCTCTATGGAATCACAACGGGCCGATATTAAGCGCTCTTAAAGTAAATAATCTACTGGAGCAAATGAAAAAGAATCTCAAGAATCCAAATTATGTGAAGAATGTCATTGAGAAGTACTTCATCAGGAACAACCATAAGCTGATAATGACTATGACACCGGATCCTAAATTTGATGACGTTTTCAACAACGCCGAGGCAGATCTATTAAGGGCCAAAGTCAGTAAATTGACATCAGAACAGAAAGAAAGCATTTACAAAGACGGGTTAGAACTTTCCAAAGCACAGAAGGAAATACAAAACCTCGATGTCCTGCCGTGTTTGAAAATTGATGAGATAACATTGAACAAAACAGCACCTCCCTTGAAACATACTATTTCTGGGACGGTACCCTTGCAATTATGTAGGGCTAACACCAATGGTGTGACGTATTTCAAGGGTGTCCTAGGCACTGAGTGCTTGAATGAGCAGCAGAGACAGTTTTTACCATTTTTCAACTACATTTTGGACAAATTCGACACCAAGTCATATAATTACAGGGATTTTGATAAATTTGTCAGCAAGTCAACTTCAGGATTATCATTCCTGACTCATATAACTGAGCACATAGACCAGAGAGAGCAGTACGAACAGGGTGTCATATTGAGCAGTCACTGCTTGGACCACAATCTGCCAAAAATGCTCGACATATGGAAAGAAATATTCAGCAAACCAAACTTTTCCAACAGCGAAAGAATGACTATGCTCCTAAATAACTACGCTTCATCATTGACAAGCGGTATCATAGACAGCGGTCACACGTACGCCATGCAGAGCGCCCGGTCGCTGGTGTCTCCTGTGGACGAGTGTAAGGAATGTCTGTTAGGAATCAAGCACGTCATGAATATGCAAGAAGCCCAGAAACAGTACAAGATAGAAAACGTCCAGGAGATAGTTGATCAAATCGGCAAAACTATATTACACGGCACAAATCTACGGGCAGCGTTTCATTACTCAGACGATAATGTACAAAGCACTATAGAACAGTTCTGCATGGATTTGTGTAAAGACGATCAGTCGGATGTCAATAGGATAAATTGGACGGATTGCAAGGCACCGAAGAAACAGAATCGAGGGGTTCACATAGCTATGAACATTCCTGTAAATTTCTGCTCCAAGGTCATACCGACAGTACCATACACTGACCCCGATTACCCTAAACTGAGGGTATTATCCAGATTTATAACGTCGAAATACCTACATCCCATAGTCCGCGAACAAAACGGCGCTTACGGCGGCGGTGCAATGTTAACTATCGATGGGATATTCAATTTCTACTCATACAGAGACCCAAATTCAAGGGTCACTTTGGATGTGTTCGACGATACAACCAATTGGATGTCCAAAAATAAGGACTTGGTTGATGACCAGAATCTGTTTGAAGCTAAGCTGTCCATACTTCAACAAATGGATCAACCGATAGCTGAATATATGAGAGGAATTGAGCTGTTCCTGTATGGGCTGTCATATGACATTTGGCAGACACAAAGGGAACGAGTGCTAGCTGTCACCAAGGAAGATCTCGTAGAAGTCTGCCAGAAGTATCTGAAAGGAGGCGAGTGGTCCGGAAAATGTGTGATTGGTAACGGTGCAAACCAGCAAATTAAAAAGGACAGTGAAAACTGGGACACAATTAACGGACCACAAGATTGA

Protein sequence:

>DPOGS214555-PA
MYSRLHKLSGLQKSLIIAGQRNYAGGILKTKKNLSSLQPGKVYHGFMCCEVEPINEYNMTAYLLRHEKTQTEYLHLERDDTNNVFSVGFRTTPLDSMGTPHILEHTVLCGSEKYPVRDPFFKMLNRSLATFMNALTGPDYTFYPFSSQNEVDYRNLQKVYLDAVFKPNLSRLDFLQEGWRLEHSNLDDKSSNLVFKGVVYNEMKGAFSETSSLFGQKFINTILPQGTYGFVSGGDPLHIPELTHEHLKKFHATYYHPSNSRIYSYGSFPLEHNLKFLNETYLSKYEYLDPSATVVAPQERWKMLKRSNIPCRFDQYGGPIEKQNQIAMGMVMSDITDIYETFMLTALAELMIIGPNSAFYKSLIEKNISGGYNSLTGYDNQIRDTLFVVGLRDVEESKFDLVEKIANQTIQDIYEKGFEKDHIESVLHGFELSIKHQSPKFGLNMLFNLMPLWNHNGPILSALKVNNLLEQMKKNLKNPNYVKNVIEKYFIRNNHKLIMTMTPDPKFDDVFNNAEADLLRAKVSKLTSEQKESIYKDGLELSKAQKEIQNLDVLPCLKIDEITLNKTAPPLKHTISGTVPLQLCRANTNGVTYFKGVLGTECLNEQQRQFLPFFNYILDKFDTKSYNYRDFDKFVSKSTSGLSFLTHITEHIDQREQYEQGVILSSHCLDHNLPKMLDIWKEIFSKPNFSNSERMTMLLNNYASSLTSGIIDSGHTYAMQSARSLVSPVDECKECLLGIKHVMNMQEAQKQYKIENVQEIVDQIGKTILHGTNLRAAFHYSDDNVQSTIEQFCMDLCKDDQSDVNRINWTDCKAPKKQNRGVHIAMNIPVNFCSKVIPTVPYTDPDYPKLRVLSRFITSKYLHPIVREQNGAYGGGAMLTIDGIFNFYSYRDPNSRVTLDVFDDTTNWMSKNKDLVDDQNLFEAKLSILQQMDQPIAEYMRGIELFLYGLSYDIWQTQRERVLAVTKEDLVEVCQKYLKGGEWSGKCVIGNGANQQIKKDSENWDTINGPQD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: