MonarchBase - Protein-coding gene

DPOGS214246
Transcript	DPOGS214246-TA	2982 bp
Protein	DPOGS214246-PA	993 aa
Genomic position	DPSCF300014 + 1248224-1255101
RNAseq coverage	727x (Rank: top 18%)

Annotation
*Heliconius*	HMEL005003	0.0	70.17%
*Bombyx*	BGIBMGA005965-TA	0.0	64.11%
*Drosophila*	CG3107-PA	4e-17	31.19%
EBI UniRef50	UniRef50_E2BTY2	0.0	40.68%	Uncharacterized protein C05D11.1 n=2 Tax=Neoptera RepID=E2BTY2_HARSA
NCBI RefSeq	XP_001653480.1	0.0	44.01%	hypothetical protein AaeL_AAEL008862 [Aedes aegypti]
NCBI nr blastp	gi\|157119998	0.0	44.01%	hypothetical protein AaeL_AAEL008862 [Aedes aegypti]
NCBI nr blastx	gi\|157119998	0.0	44.14%	hypothetical protein AaeL_AAEL008862 [Aedes aegypti]

Group
Gene Ontology	GO:0046872	5.6e-31	metal ion binding
	GO:0003824	5.6e-31	catalytic activity
	GO:0006508	4.3e-08	proteolysis
	GO:0004222	4.3e-08	metalloendopeptidase activity
	GO:0008270	4.3e-08	zinc ion binding
KEGG pathway
InterPro domain	[20-246] IPR011249	5.6e-31	Metalloenzyme, LuxS/M16 peptidase-like, metal-binding
	[22-234] IPR011237	1.2e-26	Peptidase M16, core
	[195-368] IPR007863	4.3e-08	Peptidase M16, C-terminal
	[49-133] IPR011765	5.3e-07	Peptidase M16, N-terminal
Orthology group	MCL17359		Insect specific

Nucleotide sequence:

>DPOGS214246-TA
ATGTCTCATTTTAAACTAATATCGTCAACAAAGGCTTCCGATGTGATACCTGTAAACAAATATTTGTCCGAAAAGACTGGCTTAACCGTAATTATAGCAAACGTTGAAGGACCTGTTGTAAAAGGATTTTTTTGCTTAGCAACGGAAGCTCACGATGATGACGGTTTGCCTCATACATTGGAACACTTGATCTTTTTGGGATCAGAGCGTTACCCTTACAAGGGTATTCTCGATCTTTTGGCGAACCGATGTATGGCTCACGGAACGAACGCGTGGACGGATGTAGACCACACTTGTTATACTATATACACTGCGGGAGATGCGGGTATGTTGACTCTGTTACCCATCTACCTGGACCATATACTGAGACCAACTCTTACGGATCAAGGATTTCTGACGGAGGTTCATCATGTTGATGGTGACGGAGATGACGCTGGTGTGGTGTACTGCGAGATGCAGGGTAGGGAGAATACAGCGGATAGTAAATGTGAGTTAAGAATGCTCCGTGCTATGTATCCCAATAATGGCTATTCTTCTGAAACTGGGGGTATCATGAAAAACCTGAGGGAGTCCACTGATAATACTAAAGTGCGAGATTTCCACAAGAAATTCTATAGAGCTGAAAACCTAACAATAATTCTAACAGGACAAATTGACGCCCAAGATGTTTTCAATGTTCTCACCACAGTTGAGGATGACATCATTGCTAAGCGGGAGAAGGAATCTCAGGAAGAGTGGGTGAAACCCTGGCAGACTATACCCCCACCACCAGCTTATGGAGAACTTATAGAGAAGTGGCCAGCGGATACCGAAGACTGTGGACAGGTATTGTTCGGTTGGCGTGGACCTCTGTTGATTCAGGTCGGTGCGTTGCACGAGTTGACTGCTTGTGCGGTGCTGCTGCGGTATCTATGCGACACGGCTGCGGCGCCGCTACAGCGTGCACTTGTCGAGAGAGAGGACGCGTTGGCTGGAGATGTATCATACAATCTCACAGAGAACATGGCCTCATTGATTAAGATAGAGCTGGATAATGTACCAGTTGATAAACTGACTCAAGCTAAAGAGGAGGCGCTGAAGAGTTTGAGAAGCGTCAGGTCCGGGGAGGAGGCTATCAATATGGACCGCATGAAGAGATTACTCAGGAAACAGTTGAGGGAATGTATGGCCAGCCTTGAATCTGAACCACATCATGCTGTGGCTTTTAGATGTATCGGAGATGCACTTTATTCCCAAAATGAAGACGATTTTATAAAACGGATGAATCCACAACAAACGATGCATGATCTACTAAAAGAGAGCAGTGAATTCTGGGTTGATTTGTTGAACAAGTACTTCAATGATGATCTGGTGGTCATAGTTGGATCACCTAGCATTGAGTTGCAAGCAAAAAGACTCCTTGAAAAAATCTTCTTGGTTAAGGAATTTATAGAACCTGATGTATATTATTTCCAGCGCCCTCCTCCCCCCGGGACCCTGGCGTCTGTTCCTGTACCGTCCTGTGACTTCAAGTGTCATTCCATCCGGTCATGGAGTTCCGGAGAAGACTGTCCATATCTCGACCTAAAACAAATGCCGCTGTTCACCAGACTGCACAGCCTAACAACTAATTTTGTATATGTTAGTGCTATGTGTGAAATATTATTATATACAAAATTACCTATCGGTTCTCATGCACTTGACAGTTATTGGCTCCCTCTACATATGAACGCCTTGGGCGAGTGCGGCGTCTGGCGCGGGGACACCTTGATACCCCATCAAGACGTTATATCGACAACGGAACAGCTCACTGTGTCTTTCCAGAAAGATATTGGTTTCGGCAGAAGCGGGAACTTCTCTGTGGGACAGTTCGGAAACTTTATCAATATTGACGTTAGGTGTGAACCGGCAGATTACGAGGAAGTTGTAAACCATCTCTATGAAGTTTTGTACTGTGCTGAAATTACTAAGGAGAGATTATTGGTGTTCGCCCAGAGACTGATTAATGAGGTTTCACAGACGAGAAGAAACGGGCACAAGATGGTTCACGATTTACTGAGAGATTCTCTATACAGTAAAGATAGTAATGTCCACTGGTGCACGGTGCTAAGACAACAGAAGTTCCTCAAGGAGCTCATGGAGCAGCTTAACGCTGGCGGGGACTCGGCCGACGGCGCCATCTCCGACGCCAAGAGGACGTTCAAAGACATCACAGAGAACGCCTGGCTCCACCTCGCCAGTGACTTCGACAGATACAAGCTGAGTGCTGCGCCTTGGAAGAGATTCGCCAGAGAAAATGAAATTGTACCGGCGGAACCTCGTCGCTACTTGGACAGTGAGCTGTTGAGCGAGTGTCGTGTTAAGGCGGTGGTTGGTGTTGGAGGTCTGGAGTCGTCGTTCGCGGCCCAGGCCAGCCCGGGGCCCGTCGGCTTCGATATCAAAAATAACGCCCCGCTCGCTGTAGCACTCAACTACTTCACACAACTTGAGGGTCCAATGTGGCGTCTGATCCGTGGCGGAGGTCTCTCGTACGGGTACAGCATGTGCGAGGCGTCCGCTGAAGGAAGAGTATTCTTCTCATTATATCGCGCCACCAACGCGGTCGCTGCTTACACTAAGGCCAAATCTATCGTTGAGGAGTATTTGTCTGATGGTAAATTCGATGAGGACTTGTTCGCATCAGCCAAGAGTGCGATGGTGTTCGAGACGGTGGAGGCGGAGAAGTGTCCCGCCGACGTCGTGAAGCAGTCGCTCCTGAACTACATGAGACAAGTCGGTGACGATTACAACAGGAAGCTGGTGTGTTCGCTGTCGTCGGTGTCCCCGGAACAGGCGGCGGCGGCGGCGGCTCGCTGGCTCCCGGGACTCTTCTGTCCCGAGAACGTCGCCCTGGCCCTCGTCTGCCACCCCGCCAAGGTAGCCGACATGCAGGCCGCCTTCCAAAAGATAAATATTCCGCTAGACGCATACGAGTCTATGGAGGCGTCCTACATCAACAACTAG

Protein sequence:

>DPOGS214246-PA
MSHFKLISSTKASDVIPVNKYLSEKTGLTVIIANVEGPVVKGFFCLATEAHDDDGLPHTLEHLIFLGSERYPYKGILDLLANRCMAHGTNAWTDVDHTCYTIYTAGDAGMLTLLPIYLDHILRPTLTDQGFLTEVHHVDGDGDDAGVVYCEMQGRENTADSKCELRMLRAMYPNNGYSSETGGIMKNLRESTDNTKVRDFHKKFYRAENLTIILTGQIDAQDVFNVLTTVEDDIIAKREKESQEEWVKPWQTIPPPPAYGELIEKWPADTEDCGQVLFGWRGPLLIQVGALHELTACAVLLRYLCDTAAAPLQRALVEREDALAGDVSYNLTENMASLIKIELDNVPVDKLTQAKEEALKSLRSVRSGEEAINMDRMKRLLRKQLRECMASLESEPHHAVAFRCIGDALYSQNEDDFIKRMNPQQTMHDLLKESSEFWVDLLNKYFNDDLVVIVGSPSIELQAKRLLEKIFLVKEFIEPDVYYFQRPPPPGTLASVPVPSCDFKCHSIRSWSSGEDCPYLDLKQMPLFTRLHSLTTNFVYVSAMCEILLYTKLPIGSHALDSYWLPLHMNALGECGVWRGDTLIPHQDVISTTEQLTVSFQKDIGFGRSGNFSVGQFGNFINIDVRCEPADYEEVVNHLYEVLYCAEITKERLLVFAQRLINEVSQTRRNGHKMVHDLLRDSLYSKDSNVHWCTVLRQQKFLKELMEQLNAGGDSADGAISDAKRTFKDITENAWLHLASDFDRYKLSAAPWKRFARENEIVPAEPRRYLDSELLSECRVKAVVGVGGLESSFAAQASPGPVGFDIKNNAPLAVALNYFTQLEGPMWRLIRGGGLSYGYSMCEASAEGRVFFSLYRATNAVAAYTKAKSIVEEYLSDGKFDEDLFASAKSAMVFETVEAEKCPADVVKQSLLNYMRQVGDDYNRKLVCSLSSVSPEQAAAAAARWLPGLFCPENVALALVCHPAKVADMQAAFQKINIPLDAYESMEASYINN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: