MonarchBase - Protein-coding gene

DPOGS204778
Transcript	DPOGS204778-TA	3198 bp
Protein	DPOGS204778-PA	1065 aa
Genomic position	DPSCF300231 + 536814-562611
RNAseq coverage	419x (Rank: top 29%)

Annotation
*Heliconius*	HMEL002156	1e-122	35.16%
*Bombyx*	BGIBMGA013714-TA	0.0	65.10%
*Drosophila*	Nep1-PA	2e-119	32.56%
EBI UniRef50	UniRef50_D6W7L0	0.0	57.75%	Putative uncharacterized protein n=5 Tax=Neoptera RepID=D6W7L0_TRICA
NCBI RefSeq	XP_970993.1	0.0	56.40%	PREDICTED: similar to Endothelin-converting enzyme 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91092668	0.0	56.40%	PREDICTED: similar to Endothelin-converting enzyme 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91092668	0.0	57.24%	PREDICTED: similar to Endothelin-converting enzyme 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	2e-216	proteolysis
	GO:0004222	2e-216	metalloendopeptidase activity
	GO:0008237	4.7e-81	metallopeptidase activity
KEGG pathway
InterPro domain	[380-1065] IPR000718	2e-216	Peptidase M13, neprilysin
	[849-1065] IPR024079	2e-114	Metallopeptidase, catalytic domain
	[407-799] IPR008753	4.7e-81	Peptidase M13
	[858-1062] IPR018497	1.4e-58	Peptidase M13, neprilysin, C-terminal
Orthology group	MCL17430		Insect specific

Nucleotide sequence:

>DPOGS204778-TA
ATGTATTATATAATTTCCGCGAAGGCTTTAGCGCTGTATCATTACCCTGTGCAAGCGATCAGTGACATCAAACAAGCTATTGTTAGTTGTCGGTCTGCCGCCGCAGCGCTTGCTTCGCTAGCTCAAGCTCGCACTGTGCGCTGTTCGTGGGTGGTGATCGTATCCCTGGGCTTGTCCCTGGCGGTGTTGGCGGTGTACACCACGGTCGTGGTGGTGGTAGACCTTAAAGCACCCAAACCCTGCCTCACTGAAGTGTGTGTCAATACAGCGTCGAGAGTACTAGCGGCGTTAAACAAGAGCGTGGATCCCTGCGACGACTTCTACGAGTTCGCTTGTGGCGGGTGGATCGAGAAGAACCCTGTCCCGGAGTGGGCGACCTCCTGGGATCAGCTCGCCATCCTGCGAGAGAAACTGGTCACTGACCTGAGGGAACTGCTGGAAGACAAAAACGACCACGGCCTGCCTAAGAGCGTGCTTAAAGCTAAAGCCCTCTACCGCACTTGTATGGATGTTGACAAGCTAGAGGTGTACGGAACCGCGCCCATCACGGATCTGTTGCTACAACTAGGCCTTCCTCCAACGCCCCCTTCCGTGTCCAGTGATAACTTCTCGTGGGAGCAGGTGTCTGGGCGCGCCCGCAGGACTCTCGGTCTCAGTGTTCTGCTGAGCGTTCAGGTCGCTGAGGATGTGAGGAACACTAGCAGGAACAGGGTCGTGTTGGAGCAGGTATCTCCAGGGTTCAGCGATCGTTACCTGCGCCAGGCGGACAAGTTCTCGTTCGAGTTGGAGCAGTACCGGATCTACATCACGTCAATGATCAAAGCCTTCCATCCCGACACGGACGCGGAACGCTTCGCCGACGACATTATAGAATTCAGCAAGACTCTGGCTGGCATCATGACGCCGGTGGAGGTTCGTCGCAGCGGCACTCACCTGTTCCACGAGCTGAGTGTGACTCAACTGCTGGGAGGGAACGGAGCTCCTCCTGAATGGCACCAGGTATATTTTATGGTTGCCAAACAAGATGAAAAGAAAGCTCGCACTGTGCGCTGTTCGTGGGTGGTGATCGTATCCCTGGGCTTGTCCCTGGCGGTGCTGGCGGTGTACACCACGGTCGTGGTGGTGGTAGACCTTAAAGCACCCAAACCCTGCCTCACTGAAGTGTGCGTCAATACAGCGTCGAGAGTACTAGCAGCATTAAACAAGAGCGTGGATCCCTGCGACGACTTCTACGAGTTCGCATGTGGTGGGTGGATCGAGAAGAACCCTGTCCCGGAGTGGGCGACCTCCTGGGATCAGCTTGCCATCCTGCGAGAGAAACTGGTCACTGACCTGAGGGAACTGTTGGAAGACAAAAACGACCACGGCCTGCCTAAGAGCGTGCTCAAAGCTAAAGCCCTCTACCGCACTTGTATGGATGTTGACAAGCTAGAGGTGTACGGAACCGCGCCCATCACGGATCTGTTGCTACAACTAGGCCTTCCTCCAACGCCCCCTTCCGTGTCCAGTGATAACTTCTCGTGGGAGCAGGTGTCTGGGCGCGCCCGCAGGACTCTCGGTCTCAGTGTTCTGCTGAGCGTTCAGGTCGCTGAGGATGTGAGGAACACTAGCAGGAACAGGGTCGTGTTGGAGCAGGTATCTCCAGGGTTCAGCGATCGTTACCTGCGCCAGGCGGACAAGTTCTCGTTCGAGTTGGAGCAGTACCGGATCTACATCACGTCAATGATCAAAGCCTTCCATCCCGACACGGACGCGGAACGCTTCGCCGACGACATTATAGAATTCAGCAAGACTCTGGCTGGCATCATGACGCCGGTGGAGGTTCGTCGCAGCGGCACTCACCTGTTCCACGAGCTGAGTGTGACTCAGCTGCTGGGAGGGAACGGAGCTCCTCCTGAATGGCACCAGCACGACTGGCAGAAGTATATAGACCTGGTGTTCTCCAACACGAGCGTGTCTCTGACGGACGGCGACCGAGTCATCGTGATGGACCTGCCCTACCTGCACCGCCTGGCCGGCACGCTGGCTCGTACCGACCCACTCATCACAGAGCGCTTCCTGTGGTGGAGCGTGTTCTCGACCGTGGCTCCGATGACTCGCGCCATATTTCGGACCCTCGGGTTCGAGTTCAGCCGCGCGGCCTGGGGCCTGCGGGCCCGCGTCGACCGCCACAAGGCCTGCGCCGCCAACGTCAACGCCAACTACGGCCTCGCGCTCAGCTACCTCTACGTCAATAAACACTTCGATGAACACGAACGCGAAAAGGCTATAGAAATGATCGAGGACGTCCGCGAGTCGTTCGCGGAGGCGGCTCGCTCCCTGCCCTGGATGGACGACGGCACGCGGGACACGGCGCTGCACAAGCTGAGGGCCATACGGACCTTCGTGGGCTTCCCCGCCTGGCTCATGGACACACACAAGCTGGACCGACATTACGAACACGTGGAGGTGGTGGAGGGGAACCTGTTCGAGTCATACTTGAAGCTGACCTGGGCCACCGTCAAGAAGTCACTGGAGTCTCTGAGAGAGACGCCGGACAGGAACAGGTGGGTCGCGACCGCCACCACAGTCAATGCCTTCTATTCAGCAACACTTAATTCAGTCACATTCCCGGCTGGCATCTTACAACCACCTTTTTACGGAAATGGAATCGAGGCAATAAACTACGGATCCATCGGAGCCATCATGGGTCATGAAGTGACACACGGCTTCGACGATCAAGGTCGTCGGTACGATTCAGACGGCAATCTAGCGTCGTGGTGGTCACGGGAAACGCTGGAGCAGTACCAGGCGCGGGTGAGGTGCATCGTGGAGCAATACGACCAGTACGGCCTGCCGCAGCTGGCCGGGTATAACGTGCACGGGTTCAACACGCAGGGGGAAAATATCGCCGACAACGGGGGCCTGCGGGCCGCGCTCCGGGCTTACCGCAGGCACGAGGCGCGCGCCGGGCGGGCCGCCCTCCTGCCAGGTCTCCCGGGACACACTCCCACACAACTCTTCTTCCTCGGATTCGCCCAGATATGGTGCGGGAACTCCACTACGGGGGCGCTGAAATCGAAAATGGTGGAAGGCGTCCACAGTCCTAACAAAATAAGAGTCATAGGGACCTTGAGCAATTCCAAGGAGTTCTCAGAAGCTTGGAAATGTCCTCTGGGGTCTCCCATGAACCCAGAACACAAGTGCGTTTTGTGGTAA

Protein sequence:

>DPOGS204778-PA
MYYIISAKALALYHYPVQAISDIKQAIVSCRSAAAALASLAQARTVRCSWVVIVSLGLSLAVLAVYTTVVVVVDLKAPKPCLTEVCVNTASRVLAALNKSVDPCDDFYEFACGGWIEKNPVPEWATSWDQLAILREKLVTDLRELLEDKNDHGLPKSVLKAKALYRTCMDVDKLEVYGTAPITDLLLQLGLPPTPPSVSSDNFSWEQVSGRARRTLGLSVLLSVQVAEDVRNTSRNRVVLEQVSPGFSDRYLRQADKFSFELEQYRIYITSMIKAFHPDTDAERFADDIIEFSKTLAGIMTPVEVRRSGTHLFHELSVTQLLGGNGAPPEWHQVYFMVAKQDEKKARTVRCSWVVIVSLGLSLAVLAVYTTVVVVVDLKAPKPCLTEVCVNTASRVLAALNKSVDPCDDFYEFACGGWIEKNPVPEWATSWDQLAILREKLVTDLRELLEDKNDHGLPKSVLKAKALYRTCMDVDKLEVYGTAPITDLLLQLGLPPTPPSVSSDNFSWEQVSGRARRTLGLSVLLSVQVAEDVRNTSRNRVVLEQVSPGFSDRYLRQADKFSFELEQYRIYITSMIKAFHPDTDAERFADDIIEFSKTLAGIMTPVEVRRSGTHLFHELSVTQLLGGNGAPPEWHQHDWQKYIDLVFSNTSVSLTDGDRVIVMDLPYLHRLAGTLARTDPLITERFLWWSVFSTVAPMTRAIFRTLGFEFSRAAWGLRARVDRHKACAANVNANYGLALSYLYVNKHFDEHEREKAIEMIEDVRESFAEAARSLPWMDDGTRDTALHKLRAIRTFVGFPAWLMDTHKLDRHYEHVEVVEGNLFESYLKLTWATVKKSLESLRETPDRNRWVATATTVNAFYSATLNSVTFPAGILQPPFYGNGIEAINYGSIGAIMGHEVTHGFDDQGRRYDSDGNLASWWSRETLEQYQARVRCIVEQYDQYGLPQLAGYNVHGFNTQGENIADNGGLRAALRAYRRHEARAGRAALLPGLPGHTPTQLFFLGFAQIWCGNSTTGALKSKMVEGVHSPNKIRVIGTLSNSKEFSEAWKCPLGSPMNPEHKCVLW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: