MonarchBase - Protein-coding gene

DPOGS204583
Transcript	DPOGS204583-TA	3429 bp
Protein	DPOGS204583-PA	1142 aa
Genomic position	DPSCF300400 - 105908-140429
RNAseq coverage	225x (Rank: top 44%)

Annotation
*Heliconius*	HMEL008385	5e-107	54.55%
*Bombyx*	BGIBMGA001435-TA	0.0	73.47%
*Drosophila*	CG4096-PB	3e-180	44.59%
EBI UniRef50	UniRef50_E1ZYT5	0.0	54.18%	A disintegrin and metalloproteinase with thrombospondin motifs 7 n=8 Tax=Formicidae RepID=E1ZYT5_CAMFO
NCBI RefSeq	XP_001602029.1	0.0	49.41%	PREDICTED: similar to adamts-7 [Nasonia vitripennis]
NCBI nr blastp	gi\|270002066	0.0	52.82%	hypothetical protein TcasGA2_TC001014 [Tribolium castaneum]
NCBI nr blastx	gi\|270002066	0.0	49.78%	hypothetical protein TcasGA2_TC001014 [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	4.3e-32	proteolysis
	GO:0004222	4.3e-32	metalloendopeptidase activity
	GO:0008270	4.3e-32	zinc ion binding
	GO:0008237	3.6e-18	metallopeptidase activity
	GO:0005578	3.6e-18	proteinaceous extracellular matrix
	GO:0031012	6.3e-18	extracellular matrix
KEGG pathway
InterPro domain	[405-624] IPR024079	1.5e-66	Metallopeptidase, catalytic domain
	[64-210] IPR002870	4.3e-32	Peptidase M12B, propeptide
	[411-624] IPR001590	7.5e-27	Peptidase M12B, ADAM/reprolysin
	[707-765] IPR000884	4.7e-20	Thrombospondin, type 1 repeat
	[720-738] IPR013273	3.6e-18	Peptidase M12B, ADAM-TS
	[902-1016] IPR010294	6.3e-18	ADAM-TS Spacer 1
Orthology group	MCL10258		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204583-TA
ATGGATGTGCGGTGTTCGATATTCAAACTGCTGTTGTTTCAAATTGTGATTATAAGATGTGGAGCAAAACACATACGCACAGCGAGGGTAGAGTTGGCTGGTGATGTGGAGAGGGAAGTCCAGGATAGCATAAGGAACCTTATACACACCGGTATCTATTCACACCAACACCTGGATCATTCTCAAGTGCAAGTGGTGACCCCGGTGAAGGTTTCATCAGAGGGCGAACTTATCTCTCATGAAGTTGAACATGCACACGGGCATGGTCACGCGCGCTCACGCCGTGACCTTCATGGCATAGAACATCATCTGCCCCATTCTCTTCACTACAACCTCACTGTGGATGGACGGAATCTTAGGCTGGACCTAAGGCCCTCAGTAACGTTCATCACTCCAGCGTTGGTTGTAGAGCGACACAGGGTTAACTCGAGAACTCGGGCGAGGCCTCTGGAGGCAGCTACTGCGTGCCACTACACCGGCTCCGTGAGAGGACAGCCCGGCTCGAATGTCGCACTATCAGCCTGCGATGGACTTGCAGGCATGTTGCGGACGAAATATGGAGAATATTGGATTGAGCCATCAAATCAACTAACGACCGACAGCTCGTCTGGGCGACCACATGTTATATTTAAGAGATCTGCTGTCGATAAAGTTGAGGCATTCCATAGAAGAAAGAGGGAAGTCGATAGGAGAATGACTTCTTCGTCTAGAAATAACAATGAAAAGAATTATAAAGAAAAAAATTCAAAACGAAACACGAGAAGAAAGGATAAGGAGGACATGGATCAGCGTAGACGAGCGTATATAGAAGAGAGACGGAGGAGATTAGAGGCAATGAGACGTGATCCAGCAGCATATAGAAGAAATAAAAAGAATCTACGAATGGAGCATAGAAGACCGCTGTCGGAATCAGCGTCTTCATCCGTATCGAGGAGCACATCCATGGAAAATAGTCATTCCTTGGAACAAAATTTAACAACGAGCAGGTCGAGTATTGAACAGCGACCACGAAGGATAAGAACGAGACGAAAGAGACGGAGACGTTCAAAGAACTGTGCAACAAAACAACCACCGTATCAATGGAAGTATAGAAATTTTAAAGACCTTCATTCAAAGGAAGAACGTAGCAAATCAAAATATTACAAGAGAACCAATAAAACTCAACGCAATAATGTAAACAGACGGTATCTAGAAGCATCAAAACGATCGACGCGATCCGTTAGCAAGCCGCGTCACGTTGAAGTGTTACTTGTCGCCGATAAGTCTATGACTGATTTCCACAATCAAGGCAACTTGGAAACTTATCTACTGACAATCATGAACATGGTATCATCCCTGTATATGGATCCATCAATCGGGAACTACATCAAAGTGGTGGTAGTCAAAATTATTTTGGTCGAGGAAATGCACGCGGCACCTGAGCTATCAGTGTCCACTAACGCGGACTCAACCCTCGCGTCCTTCTGTAGGTGGCAGCACCAGCTGAACCCGGACGACGACCACGATCCACACCACCATGACGTCGCCATACTCATCACACGACGGGATATATGCAGTCAGCAGGACACACCTTGTAGTACTTTGGGCGTGGCGCACGTGGCGGGCATGTGCAAGCCGGACCGCAGCTGTTCCGTCAACGAGGACAATGGCATCATGCTGGCGCACACCATCACGCACGAGCTGGGACACAATTTCGGCCTGTACCATGACACCGAGAAAATTGGTTGTCACAGACGCGATGGGGCTACTCTTCATATTATGACACCGATCTTTGAACCAGATACGGTACAAGTCGCCTGGTCACGATGCAGTAAACGGGATGTCACCAACTTTTTAGATGCCGGTTTAGGGGATTGCTTGAGCGACAGACCATCTCAGGAAGAACCGTACGTCTATCCTGAACTACCCGCAGGAGTAACATTTGACGCGGCTTATCAATGTCACTTACAATTCGGTGAGGAAGCCGTAGTGTGTTCCAAGCTGACGGAGCTTTGTGAGCATCTGTGGTGTCTCGTCAACAACACGTGCAAATCGATGTTAAGACCGGCCGCGCCGGGGACAACTTGTGGAGAGAATATGTGGTGTCAGAATCAGACGTGCGTCCCAAAGGCACCGTCCCCCGTACCACGTGACGGTGGTTGGGGCGCCTGGAGCGAGTGGAGCGAATGTTCCCGCACTTGTGGTGCAGGGGTGTCCACTCAACATCGAGAGTGCAACAATCCTGAACCACTCAACAATGGAAACTACTGCATCGGGGATAGGAGCCGGTACAAAGTTTGCAACACCGATCCGTGCCCTATCAATGAGCCGACGTTCAGGGAAGTTCAGTGCTCCAAGTTTAATAACATGACATACAAGAACGAAACCATCTCCGAATGGATACCATACATTGATCAAGATAAACCGTGCGATTTACAATGCGTGCCTCGCAATCGGAATGATATAGAGATGATCGGCAGCTTCGTAACAGACGGAACACCGTGCAGACAGGGTCTCGGAGTTCGGGACATGTGTATAGCTGGCGTGTGCTACAAAGTGGGTTGTGACTGGATCGTGGACTCTGATGCTGAAGAGGACGCGTGCGGTGAGTGCGGAGGAGACGGCTCCGCTTGCGTGTGCTACAAAGTGGGTTGTGACTGGATTGTGGACTCTGATGCTGAAGAGGACGCGTGCGGTGAGTGCGGAGGAGACGGCTCCGCGTGTAGGACAGTACAAGGGATATATAACAAGGATACTACTAGACAGTCTGGTTATAGCGAGGTTGCGGTAATACCAGCTGGTTCTAGAAATGTGAAGATTCAAGAAAAAGTCAGCCCTGGAAACTATATTTCAATCGGAAGCGCTAAATCTAGAAAGATATATCTCACTGGAGCGCGAAATGCAACATTAACTGAGTACTTCGTAGCCGGAGCTCAGGCGATCTATGAAAGGGACCGTGATTGGGAAAAAGTTAGGATCAGTGGACCCCTTGCTGAGGACATAAAGGTTTATCAACGCATCTTCCGCGGCAAGCATCGCAATCCTGGCGTGACGTATCAGTATACAGTGGACCAACCTAAATCATTGGTCCGCTATCGTCTGTCAGACTGGAGCGCCTGTTCTGTAACCTGCGGCCTCGGGCGGATGTACCGACACTACATCTGCGTGGACCAGCACAACCGTCAAGTTGACCTATCCATGTGTTACCACATGGAGCAACCTCGTCTTGGCGCGTTGGTGCAGCAGTGCCGGTCAGTCTCCTGTACACACTGGTGGGTCGGACCATGGAAACCATGCTCCATTTGCCATATGCCGGGCGAGGAAGCTACCAAGAAACGTAATGTCCACTGTGTGAACAAGACATCCAACCAGGTAGTTGACGACTCAGAATGTGATATGTCAACTAAGCCGATAGGCGTTATCAAATGCGCAGACGTACCAGCTTGTTGA

Protein sequence:

>DPOGS204583-PA
MDVRCSIFKLLLFQIVIIRCGAKHIRTARVELAGDVEREVQDSIRNLIHTGIYSHQHLDHSQVQVVTPVKVSSEGELISHEVEHAHGHGHARSRRDLHGIEHHLPHSLHYNLTVDGRNLRLDLRPSVTFITPALVVERHRVNSRTRARPLEAATACHYTGSVRGQPGSNVALSACDGLAGMLRTKYGEYWIEPSNQLTTDSSSGRPHVIFKRSAVDKVEAFHRRKREVDRRMTSSSRNNNEKNYKEKNSKRNTRRKDKEDMDQRRRAYIEERRRRLEAMRRDPAAYRRNKKNLRMEHRRPLSESASSSVSRSTSMENSHSLEQNLTTSRSSIEQRPRRIRTRRKRRRRSKNCATKQPPYQWKYRNFKDLHSKEERSKSKYYKRTNKTQRNNVNRRYLEASKRSTRSVSKPRHVEVLLVADKSMTDFHNQGNLETYLLTIMNMVSSLYMDPSIGNYIKVVVVKIILVEEMHAAPELSVSTNADSTLASFCRWQHQLNPDDDHDPHHHDVAILITRRDICSQQDTPCSTLGVAHVAGMCKPDRSCSVNEDNGIMLAHTITHELGHNFGLYHDTEKIGCHRRDGATLHIMTPIFEPDTVQVAWSRCSKRDVTNFLDAGLGDCLSDRPSQEEPYVYPELPAGVTFDAAYQCHLQFGEEAVVCSKLTELCEHLWCLVNNTCKSMLRPAAPGTTCGENMWCQNQTCVPKAPSPVPRDGGWGAWSEWSECSRTCGAGVSTQHRECNNPEPLNNGNYCIGDRSRYKVCNTDPCPINEPTFREVQCSKFNNMTYKNETISEWIPYIDQDKPCDLQCVPRNRNDIEMIGSFVTDGTPCRQGLGVRDMCIAGVCYKVGCDWIVDSDAEEDACGECGGDGSACVCYKVGCDWIVDSDAEEDACGECGGDGSACRTVQGIYNKDTTRQSGYSEVAVIPAGSRNVKIQEKVSPGNYISIGSAKSRKIYLTGARNATLTEYFVAGAQAIYERDRDWEKVRISGPLAEDIKVYQRIFRGKHRNPGVTYQYTVDQPKSLVRYRLSDWSACSVTCGLGRMYRHYICVDQHNRQVDLSMCYHMEQPRLGALVQQCRSVSCTHWWVGPWKPCSICHMPGEEATKKRNVHCVNKTSNQVVDDSECDMSTKPIGVIKCADVPAC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: