MonarchBase - Protein-coding gene

DPOGS210786
Transcript	DPOGS210786-TA	3234 bp
Protein	DPOGS210786-PA	1077 aa
Genomic position	DPSCF300027 - 1376173-1383689
RNAseq coverage	77x (Rank: top 65%)

Annotation
*Heliconius*	HMEL016942	2e-178	55.12%
*Bombyx*	BGIBMGA007097-TA	0.0	62.68%
*Drosophila*	Nep4-PA	0.0	52.40%
EBI UniRef50	UniRef50_E2C8U1	0.0	73.46%	Endothelin-converting enzyme 1 n=5 Tax=Formicidae RepID=E2C8U1_HARSA
NCBI RefSeq	XP_002430353.1	0.0	69.98%	hypothetical protein Phum_PHUM474680 [Pediculus humanus corporis]
NCBI nr blastp	gi\|242019813	0.0	69.98%	hypothetical protein Phum_PHUM474680 [Pediculus humanus corporis]
NCBI nr blastx	gi\|328782544	0.0	70.35%	PREDICTED: endothelin-converting enzyme 1 [Apis mellifera]

Group
Gene Ontology	GO:0008237	1.1e-127	metallopeptidase activity
	GO:0006508	1.1e-127	proteolysis
	GO:0004222	6.3e-60	metalloendopeptidase activity
KEGG pathway
InterPro domain	[240-1077] IPR000718	0	Peptidase M13, neprilysin
	[861-1077] IPR024079	8.2e-131	Metallopeptidase, catalytic domain
	[261-811] IPR008753	1.1e-127	Peptidase M13
	[870-1075] IPR018497	6.3e-60	Peptidase M13, neprilysin, C-terminal
Orthology group	MCL10214		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210786-TA
ATGGCGCGCGTTGACTCAACACCCCAAACAGTTTCGATCAAACCGAAAAGTGCCAATTTTTGTAGATTTATAATTATTATTGTTTTAACATTATTCTGTGCTGTAGCCTATTTTATTTCGAGGAGACCTCTAGACACATTAGGAGATCCGTCTGATCAGTTTACTGTTAAAAACATCCCAAATATATATACACGTTTGGAAAGTGTTGATCCTGAGGAGAGGGAGGTGTTCCAAGGATTCCAAACATCATTCCTGCCGCCGGAGGAGGTGGTGTTATCTAGGAAAGGATTTGAAGATAGTGACGAAGTTTTAAACAGTAATGTGAAAAGCGATATATTTAAATGGGAAGAAAAAAGACGAGAAAATCCCACAAGGGTTAAACGAGGAAGCCATTCCACTTTCTCGACACAAGATTACGATCAAGAAACACCAACACAAAACCAACAAAATGTCGAAGATATTCAAGAAGATGACGACGATGGAAACGAAAAGGAAATGGTATATGGCAGTGACTCCGATCAACACGACGAGGAAAGAAATATGCAAAGTGTGGTGCATCCAGAGATTTACGTTGATCGTGGGCCGTTAGACGACGTGGAACAAGTTCGCCGGCAGCCAGAATTAGAGGAAGGTGAAATGGGTTCCGCGGCTCATTTGTATAAACCGGTTCGATCTTACACAGGGGTACACGCGTTTTGGAAGGGTCAGGGTGACAAAGAAACTATAAGACACACGCAGTCAAAAATAATGCGACAATACATGGATGCTGAAGCGGACCCTTGTCATGATTTTTATCAATATGCTTGTGGAAATTGGCCAACACTCAACCCAATACCAGCTGATAAAGCTGGTTACGATACATTTGAGATGTTGAGGGAAAACTTGGATACGGTATTGAAGGACATGTTGGAGTTCTCTAAAGATGAAGAGATCCCTAGCCAGTATCCGGGGCCACATCTAGATTTCAATGATAATTTAAAACATGCTATAAATTCGCAATGCTCACAAGAATCTCATGATATCGTTGATTATATTATTACAAATTCCAAAGAAATACTCAATTTGACTGAGAGAAAAAATACTTATGACATTAAAGACGAGAGCAAAACTGAAATAATTAATCGTATCAGACGATATCTTGATATGAAAACACGTGACATGAAGAAGTCTTCATTTAAAACGAAATTTAAATTACACGAGTATTTATTCATGAACAATAAAAAGGGAAAAAATTTAAGGAGACCCAAAAGACATACTGATAACAATGACACGCGGAACCAAAGCGAAAAGAAAAAACGCAATATAATATACGATAAAAACGGATCCAACAGAGAAACACATTTTAAACGTGGTAAAAGAAAAGAAACATTGGAGCAACTTTTGGAAAATCTTAAACAGAAATATGAATTACCCAAAAACGACCCAGCAAATGGCGACGCGGCATTGAAAGCTAGATTTTTATTTAAGTCTTGTATGAACCACGATATCTTGCAGAAAAGAGGCCACGTACCTCTTCTAGATCTACTTGATATTTTAGGAGGCTGGCCGATACTAAAACCCGGATGGGATTCAAAAAATTTCGACTGGTTGGAACTTATGGCAAAACTAAGGCTATATAATAATGACATTTTAATATCTGAATGGGTTGGACCAGATATAAAGAATTCAGATGAATTCGTTATACAGTTTGATCAAACGAGTCTAGGTTTGCCTACAAGAGATTATTTTCTACAAGAGTCTAACAAGGTATATTTAGAGGGTTATAGAGCATATTTGATAAAAATAGCAACTTTACTCGGAGGAAACATTGAGCATGTAAAAGAGAGTGCAGTAAAACTGATCGATTTCGAAATCAACCTTGCTAAAATAACTTCCGCCCCAGAAGACAGGCGAAACGTATCAGAACTCTACCGCCGCATGACACTCGCCAAGCTGGAAGGACTGGTCCCCGAGATCAAGTGGAGGAAATATTTGTGCATCGTGATGAACAGGACGATTGACTCAAGCGAAACTGTAGTACTGTTCGCTCTGTCGTACGTACGGCACTTAGTTCAATTGATAAAGAAGACGGATCCTAATACTTTATCAAATTACTTATTGTGGCGTTTCGTGAGACATCGTGTCAACAATCTGGATGATCGCTTCCAATCTGCGAAACAACAATTCTATTACATTTTATTTGGACGCGAACAAGCGCCGCCAAGGTGGAAGAACTGTATATCCCAAGTGAATTCAAATATGGGCATGGCATTAGGGTCAATGTTTGTTAGGAAATACTTTGACGAGATGAGCAAAAACGACACGATGACGATGACGAGGGAAATCCAACAGGCGTTCAGAGAGTTACTGCACATGACGGATTGGATTGATGAGGAGACAAAAAAACTAGCCGCCCATAAAGTCGACTCTATGATGCTCAGAATAGGCTACCCCGACTTCATTCTGAACAAGAAAGAGCTCGACGATCGTTATAAGGAAGTGCAAATACATCCAGATAAATATTTTGAGAATATACTGAATATACTTCAACATCTCACTAAAATGGAACAGTCGCGAATCGGCCAGCCTGTTAATAAGACACTATGGAATACAGCGCCGGCGGTCGTGAACGCTTATTACAGCCGTAATAAAAATCAGATCATGTTCCCCGCTGGGATCCTACAACCACCTTTCTACCATCGACACTTCCCGAGGTCGCTGAACTTTGGAGGCATCGGAGTGGTTATTGGTCACGAAATTACCCACGGGTTTGACGACAAGGGTCGTTTGTTTGACTGCGAGGGTAACCTGCACCGCTGGTGGTCTGATTCCGCCATCGAGGCATTCCATCGTCGAGCTCAGTGCCTCATCGACCAGTACGGACGATACGTAGTGCCAGAAGTCAATATGAAACTAGACGGTGTTAACACACAGGGTGAGAATATAGCCGACAATGGTGGCGTGAAGCAGGCGTTCCACGCTTACCAACGCTGGCTGCTACAGCACGGCGCCGTTGACGAGACGCTTCCAGAACTCAACCATACCAGCACGCAGTTGTTCTTTCTCAACTTCGCCCAGGTATGGTGTGGTGCAATGCGGCCGGAAGCTATGAGAAATAAATTAAAGACAGCTGTCCACTCTCCAGGAAGGTTCCGTGTAATTGGAACCCTTTCTAATTCCCTGGATTTCGCCAGAGAATTCCAATGTCCACCGGGATCGCCCATGAATCCGATTCATAAATGTAGTGTTTGGTAG

Protein sequence:

>DPOGS210786-PA
MARVDSTPQTVSIKPKSANFCRFIIIIVLTLFCAVAYFISRRPLDTLGDPSDQFTVKNIPNIYTRLESVDPEEREVFQGFQTSFLPPEEVVLSRKGFEDSDEVLNSNVKSDIFKWEEKRRENPTRVKRGSHSTFSTQDYDQETPTQNQQNVEDIQEDDDDGNEKEMVYGSDSDQHDEERNMQSVVHPEIYVDRGPLDDVEQVRRQPELEEGEMGSAAHLYKPVRSYTGVHAFWKGQGDKETIRHTQSKIMRQYMDAEADPCHDFYQYACGNWPTLNPIPADKAGYDTFEMLRENLDTVLKDMLEFSKDEEIPSQYPGPHLDFNDNLKHAINSQCSQESHDIVDYIITNSKEILNLTERKNTYDIKDESKTEIINRIRRYLDMKTRDMKKSSFKTKFKLHEYLFMNNKKGKNLRRPKRHTDNNDTRNQSEKKKRNIIYDKNGSNRETHFKRGKRKETLEQLLENLKQKYELPKNDPANGDAALKARFLFKSCMNHDILQKRGHVPLLDLLDILGGWPILKPGWDSKNFDWLELMAKLRLYNNDILISEWVGPDIKNSDEFVIQFDQTSLGLPTRDYFLQESNKVYLEGYRAYLIKIATLLGGNIEHVKESAVKLIDFEINLAKITSAPEDRRNVSELYRRMTLAKLEGLVPEIKWRKYLCIVMNRTIDSSETVVLFALSYVRHLVQLIKKTDPNTLSNYLLWRFVRHRVNNLDDRFQSAKQQFYYILFGREQAPPRWKNCISQVNSNMGMALGSMFVRKYFDEMSKNDTMTMTREIQQAFRELLHMTDWIDEETKKLAAHKVDSMMLRIGYPDFILNKKELDDRYKEVQIHPDKYFENILNILQHLTKMEQSRIGQPVNKTLWNTAPAVVNAYYSRNKNQIMFPAGILQPPFYHRHFPRSLNFGGIGVVIGHEITHGFDDKGRLFDCEGNLHRWWSDSAIEAFHRRAQCLIDQYGRYVVPEVNMKLDGVNTQGENIADNGGVKQAFHAYQRWLLQHGAVDETLPELNHTSTQLFFLNFAQVWCGAMRPEAMRNKLKTAVHSPGRFRVIGTLSNSLDFAREFQCPPGSPMNPIHKCSVW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: