MonarchBase - Protein-coding gene

DPOGS206275
Transcript	DPOGS206275-TA	5010 bp
Protein	DPOGS206275-PA	1669 aa
Genomic position	DPSCF300290 + 8433-30591
RNAseq coverage	516x (Rank: top 24%)

Annotation
*Heliconius*	HMEL013178	76.28%
*Bombyx*	BGIBMGA010830-TA	61.59%
*Drosophila*	Neu3-PC	49.39%
EBI UniRef50	UniRef50_D6X2H8	56.76%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6X2H8_TRICA
NCBI RefSeq	XP_966486.1	56.76%	PREDICTED: similar to ADAM metalloprotease, partial [Tribolium castaneum]
NCBI nr blastp	gi\|91093697	56.76%	PREDICTED: similar to ADAM metalloprotease, partial [Tribolium castaneum]
NCBI nr blastx	gi\|270012994	56.76%	hypothetical protein TcasGA2_TC010657 [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	1.5e-54	proteolysis
	GO:0004222	1.5e-54	metalloendopeptidase activity
	GO:0008270	3.7e-18	zinc ion binding
KEGG pathway
InterPro domain	[182-379] IPR024079	1.1e-59	Metallopeptidase, catalytic domain
	[183-379] IPR001590	1.5e-54	Peptidase M12B, ADAM/reprolysin
	[473-619] IPR006586	2e-44	ADAM, cysteine-rich
	[394-472] IPR001762	1.5e-26	Blood coagulation inhibitor, Disintegrin
	[17-117] IPR002870	3.7e-18	Peptidase M12B, propeptide
Orthology group	MCL10705		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206275-TA
ATGGCGATTGGAGATATCGCTTACCCCAGGGAAGGCATCCATCATCCAGAGCTGGTTATGAAGATGAACTTTGATGGTCGCGAGCACGTCCTTGACTTGAGACTGAACGAGGATCTCATTACCAAGGATCATGTGATAGCATACCAGAAGGATGGGGAGACGGTGATACATCGACCTACATTGAAGGAGCTCGACATATGCCAGTACTCTGGCAAGGTGAGGGACAAGAAAGAATCGTGGGTCGCCGTGTCCACATGCGACGGAGTGAGGGGGATCATTCACGATGGACAGACAATGAGATATATAGAACCAGCCGATAGAAACGAAATCGACTCTCAGCACTATCTATACGAGCACTCGGATCTGAACACCGATTTCCACTGCGGGTACAGCGGAGGCATCACTACCAATGACACGTACGACCCCGAGCTCATGAAGCGACACATGCATAGCAGGAACGTGGAGAAGAGCAGAATAAGTCGGTACAAACGTGATGCGTACGAGGACACAGAGGTGAGGGGTCCGTTCAAGGTCAACAAACTGTCCCGCTTCGTGGAGTTGGTGCTCGTGGCGGACAACAGAGAGTTCAGAGCCAACGGGGAGAGCAAGGAAACGGTGCACAGACAGCTCAAGGACGTCGCTAATATTATTAATTCTGTGTACACCCCGCTTAATATCTTCATAGCGCTAGTGGGTGTTGTCGTGTGGAACGAAAGAGACGAAATACGGTTAGAGGAGGACGGAGATAAAACTCTCACAGAGTTCCTACATTACAGGAAAAGGCTGCTCCCTGTCATGCCCAACGACAACGCACACCTGTTAACCCGTCAGAAATTTAAAGATGGCGTCGTGGGGAAGGCTCTAAAAGGGCCGATATGTACGTACAATTTCTCTGGTGGTGTCGCCACAAACCATTCGGAGGTGATCGGTCTGGTGGCGACCACTATAGCCCACGAGATGGGCCACAACTTTGGCATGGAACACGACACTGAGGCCGACTGCGAGTGTCCCGATGAGAAGTGCATCATGAGCCCCTCCAGTACGTCGGTCACCCCTACCAAATGGTCGTCCTGCAGCTTGAGATCACTCGCGCTGGCGTTCGAGAGAGGCATGGATTACTGTCTGCGTAATAAGCCAAAGCGTCTATTCGAGCCTTCCACTTGCGGCAACGGATTCATTGAACCCGGCGAGCAGTGTGATTGTGGCCTGGCGGGCGATCCAGCCTGCACTGCTTGCTGTGACCCGCGGGCGTGCGTGTTACGCTCTAACGCGACCTGCGCGGCGGGAGAGTGCTGTGATACGACGACTTGTCGTCCGAAGCCGGCGGGGACGGTGTGCAGGGCGGCCGACAAGGAGTGTGATCTGGCGGAGTACTGCAGCGGACACTCGGAGTACTGTCCGCGGGATGTGTACAAGATGGACGCCACGCCCTGTGGGGGAGGGAAAGCGTACTGTGCGGGCGGGTCTTGTCGGACCCACACGGATCAATGCCGACTTCTCTGGGGTTTCTCCGGAGAGAACTCGGACGTTCAATGTTACACCAACTCTAATACTAAAGGGGATAGGAAGGGGAACTGCGGCTACCATCGCGAAGACCCGCCCGTCTACTACAAATGTTCTAAAGAAGATTCTCTCTGCGGTCTGCTGCAGTGTCGCCATCTCAATGAAAGACTCGAATTCGGCATGGAGTCCGTGTCTACACTGTCAGCTGTCTTCATTAATAATAACGGCACGATAATTCCCTGCCGCACGGCCATGGTGGACATGGGCACGAGCGATCCCGACCCGGGCTTCGTACCAGACGGCGCGAAATGTGGAGACGATAAAATGTGTATGAAACATAGATGCGTTTCAATAGCGGAAGTGACGTCAGAGATCGCTCGGAAAGAAACATCCGTCTGTCCGTCCAACTGTTCGGGCCATGGAGTGTGTAACTCAGAAGGACATTGTCACTGCGACTCGGGCTTCGCCCCTCCACTGTGTGAGCTCCCCGGGCCGGGAGGTTCCGTGGACTCCGGACCAGCCACTGACGCTTCAATTCAACGGAACTTCATGGTCGCTATGTACATAATCTTCCTGGGCATCCTGCCGTCCGTGCTGCTGGTGATGCTGCTCATGTACTACTCGCGTCACAACGTGCTGCTGTGCTGGAAGAAACCCAAAAAATCGTACGTAAATAACATTTTCAACGGCGACCGATTCAAAAGATTCAAAACATCGACCGATTCCTTCGTAAGACTAATCAGCTTTAGGCGGACACAGAAGAAAAATATGTGCAGGAAATGTCAGGACGATATATACAGTAATATATGCGAACACAAAGAAAATATAGACAGTACGTGGAGTTTTAACATTAGTTCTAAGATAATCAATATGTTGAATAGTAACAAACACGATGAAAGCAAAAAGTTTCAGAGGAAGATAAACAAAGACGACATCAAAGTCGCCGACGACTTAGATCTAGCTAACGTTAGGGTTAAAGTTGAACCGAAAATCAACAAATCAAACATAGTCATAGTTAAAACCGGCCTGGCCTCGACTACCAACGAACATGTTAAGGCCGAGATCAACACAACCAAACAGGAAGTTAGCTTAGATAGGAACAAAACCAAAAAGAACATTGTTGTGACAAATAAAATTAATACAGATGTCATATATGAAAACTGTATACCGAATAAGACTCCTTTTTCATATTTCAGTGTACAATCGCCAAAGAAGAACAGCTTGCAGCGTCGCCTGTCGCGAAGTGCGACGAAATTTGCTGCAAATTTCCAAAATAATTCACAAAACAACGCCCAGCCCGTCAACGTTCATACTCTGTCGAACTCTGACGACATGAGCTCCAGCCTCCTCAGAAGTGATTCCGATCGTAGCCCTTCAGGCAACATAAACCCCTCGGTAAATTTCTTCGGAAACTTCAAAGGATTCTCACTCACCCCGATGGATAAGAACTCACAAAACGAAACTGATGTCAAAGATAAAAAAGATAATGTACAGAAAAGCGCCAAAATTACACCCGTGCATCGAAGCGGTAGCAACAGTCAGAATATAGCACAGGGATCGAAGCCGATACTGAGATCAGCACCACCGCTGCCTGTGGTTCCGAACACGGCTAAACTAAGCCCGAAAACCAGCCCATCCATCAAAAGAACGAACAGCTCCGTTCAGAATCGCATTAAAGCTTTCATGGGAACAGAAAAGGCTGAAGAAATACCCGTGAACACAGCTCCGAGACCGACAATATCTAGTCCCATTCTGGAAGCATCGACGTGTACAGCGAAAGAACTCATCTCTCCTCTCCAGGGTTCCAAAACCTTGGGTCCTGTCCGCGCCGCTCCTACCGTTCCTAACTTCTCTCCGGACTTACCGAAGAGGCCGTTAAGCATGCACTCAGCGGGAAATGTACCACAGAAACCACTGCCGGAAGAACCGAAGAAAGTTAAAGAAGGCATATCTCTCAATAGGATTGCGTCGTTCCTGAAACAAGATAAACCAAAAGAAAAAGATAGGAACCCTGTGGAGAGAAGCCATTCGCTACCCAAAAATGGTAACAACCAATTAAAAGTCAAAACCGGTGATAAAGTCGCACTGCGCAATTTGCAAATATCTGGTCCTATTTTGCAAAAGGAAATAGATTTACCTGTTACTACTGTCCCAGTCGTTTCGGATTCAGAAGAAGCCGACGATTCGAAGGCCTTCGTAAACAGAGCGCAGAGTATGCGAGCACCTGCCAGCCAAAAGCCAGTCCTACAAAGCTTTGCATCGATGAGACAAGCGCCAGGTGTACCGCGGCCCTTATCGTGTGTGGGAAGACCAACAGCGCCCCCTCCCCCGTTACCATCACAACCGAAAAACGAAGAACAATCCATTTACCAAAATCCGAAAGTGCAAAATGACATCAAATCGACTGATTATGTTGATTGCATAGAGGAAAAACAGGTCCCATTGGCGCACATCGATGAAGAATCTGGGGACAATATTTACGCCATCATAGAAGAAAGTCCCGAAAAGCATTTCAAACCGATGCCGGGACGTCCTCCTAAATCTACACAGGCGCCGTTCGAAGAATACAATGTACCAAAACCTATTACTTCCAATTCGGGAAGCTCTGAAAGTTTAGGTCTACTCGGAGAAATTGTCAATGAAATACAAAACCGCAATTTCGACTCCATTTACTGCACCAATTCTTTGGCGAGAATGAAAGATAAGAACAAAAATACGGATAGTAACAGAGATAGCACGTACATGAACACAGACTATAAAAGCCCGGAGAGCGTTTACAGCAACTCTGAGACAAAATCTAGTGCAGCCTCCACAACTAGCAGCGGCTACCTTCACCCGTCCGCCGTGAACGTACCGACTTACATGCAAAAAGACAGCGATGAACTAGAAATTGAAAAGCCTCCGTCCCCCACATTAAAAACTAATTCGAAAATACCTACGTTTACCAGACAAGTCACCCCGCCGGGGTTAAGAACTTTCAAAAATATACCGCAATCACCGAAGACGACAACGAGGAGTAATCTTAAAACGATTCCGAACAGTCCCGACCTAGTATCGAGCTGTGCTGTTCCCGAAACACAGAATGCTAAAGCTCCGGATGTTATAAACAATAATAAAACAGAACCACCTAAATTAGCGACTAAACCGAATACGACCAAGACGACCGATAACCGACCCCCACTCAAACCGGTTCCGTCGGAGAAGAAACCTAACGTCAAACCAACACCGGTCCCAAAAACTAATTCTGCCTTAAGTATGAACAAAACAGATAAAAATCCTCCCCTCAACAGAACCACTTCTAAGACAGACTCCAACGTTAAGGCGATAGCTGACAGTTTGAACAAAAATCGACCAAAAATTGTCCCAAAGCCTAACAACATACAGAAGACTGAAGCTGTGAAAACAAACGCTACCAAATTATCAGCGAAACCGTCAAACGTTGCAAGTTTGCAGCAAAAATTTGAAAACAGGAAGTCATTAGGAAAAGAAATAAGTGTCAAAAAATAA

Protein sequence:

>DPOGS206275-PA
MAIGDIAYPREGIHHPELVMKMNFDGREHVLDLRLNEDLITKDHVIAYQKDGETVIHRPTLKELDICQYSGKVRDKKESWVAVSTCDGVRGIIHDGQTMRYIEPADRNEIDSQHYLYEHSDLNTDFHCGYSGGITTNDTYDPELMKRHMHSRNVEKSRISRYKRDAYEDTEVRGPFKVNKLSRFVELVLVADNREFRANGESKETVHRQLKDVANIINSVYTPLNIFIALVGVVVWNERDEIRLEEDGDKTLTEFLHYRKRLLPVMPNDNAHLLTRQKFKDGVVGKALKGPICTYNFSGGVATNHSEVIGLVATTIAHEMGHNFGMEHDTEADCECPDEKCIMSPSSTSVTPTKWSSCSLRSLALAFERGMDYCLRNKPKRLFEPSTCGNGFIEPGEQCDCGLAGDPACTACCDPRACVLRSNATCAAGECCDTTTCRPKPAGTVCRAADKECDLAEYCSGHSEYCPRDVYKMDATPCGGGKAYCAGGSCRTHTDQCRLLWGFSGENSDVQCYTNSNTKGDRKGNCGYHREDPPVYYKCSKEDSLCGLLQCRHLNERLEFGMESVSTLSAVFINNNGTIIPCRTAMVDMGTSDPDPGFVPDGAKCGDDKMCMKHRCVSIAEVTSEIARKETSVCPSNCSGHGVCNSEGHCHCDSGFAPPLCELPGPGGSVDSGPATDASIQRNFMVAMYIIFLGILPSVLLVMLLMYYSRHNVLLCWKKPKKSYVNNIFNGDRFKRFKTSTDSFVRLISFRRTQKKNMCRKCQDDIYSNICEHKENIDSTWSFNISSKIINMLNSNKHDESKKFQRKINKDDIKVADDLDLANVRVKVEPKINKSNIVIVKTGLASTTNEHVKAEINTTKQEVSLDRNKTKKNIVVTNKINTDVIYENCIPNKTPFSYFSVQSPKKNSLQRRLSRSATKFAANFQNNSQNNAQPVNVHTLSNSDDMSSSLLRSDSDRSPSGNINPSVNFFGNFKGFSLTPMDKNSQNETDVKDKKDNVQKSAKITPVHRSGSNSQNIAQGSKPILRSAPPLPVVPNTAKLSPKTSPSIKRTNSSVQNRIKAFMGTEKAEEIPVNTAPRPTISSPILEASTCTAKELISPLQGSKTLGPVRAAPTVPNFSPDLPKRPLSMHSAGNVPQKPLPEEPKKVKEGISLNRIASFLKQDKPKEKDRNPVERSHSLPKNGNNQLKVKTGDKVALRNLQISGPILQKEIDLPVTTVPVVSDSEEADDSKAFVNRAQSMRAPASQKPVLQSFASMRQAPGVPRPLSCVGRPTAPPPPLPSQPKNEEQSIYQNPKVQNDIKSTDYVDCIEEKQVPLAHIDEESGDNIYAIIEESPEKHFKPMPGRPPKSTQAPFEEYNVPKPITSNSGSSESLGLLGEIVNEIQNRNFDSIYCTNSLARMKDKNKNTDSNRDSTYMNTDYKSPESVYSNSETKSSAASTTSSGYLHPSAVNVPTYMQKDSDELEIEKPPSPTLKTNSKIPTFTRQVTPPGLRTFKNIPQSPKTTTRSNLKTIPNSPDLVSSCAVPETQNAKAPDVINNNKTEPPKLATKPNTTKTTDNRPPLKPVPSEKKPNVKPTPVPKTNSALSMNKTDKNPPLNRTTSKTDSNVKAIADSLNKNRPKIVPKPNNIQKTEAVKTNATKLSAKPSNVASLQQKFENRKSLGKEISVKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: