MonarchBase - Protein-coding gene

DPGLEAN08682 in OGS1.0

New model in OGS2.0	DPOGS212771
Genomic Position	scaffold3:+ 546057-556751
	See gene structure
CDS Length	4194
Paired RNAseq reads	1864
Single RNAseq reads	4211
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA013218 (2e-108)
Best Drosophila hit	CG8334 (4e-140)
Best Human hit	ubiquitin carboxyl-terminal hydrolase 32 (3e-90)
Best NR hit (blastp)	PREDICTED: similar to ubiquitin specific protease [Tribolium castaneum] (0.0)
Best NR hit (blastx)	hypothetical protein TcasGA2_TC015078 [Tribolium castaneum] (0.0)
GeneOntology terms	GO:0004843 ubiquitin-specific protease activity GO:0005509 calcium ion binding GO:0004221 ubiquitin thiolesterase activity GO:0006511 ubiquitin-dependent protein catabolic process
InterPro families	IPR001394 Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2 IPR006615 Peptidase C19, ubiquitin-specific peptidase, DUSP domain IPR018200 Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2, conserved site
Orthology group	MCL17264

Nucleotide sequence:

ATGGTTAATATATCCATCAAGAACCAGGACTCGAGATCGTCCACGCCCTCGGACGGGGAG
TCGGAGGGGGACAGGGGCTTCGACCCGGAGCTGGTGCTGAAGAACCTCAAAGAGAAACTG
GTCTCCGTGCCCGCGGACGCCAGGAAACCGATGTTCCAACTAGGACCCACTGATGCTGAG
AGAACCGTCACAACGACTGAGGACACGTTCAAACAATGCTTTAGAATAGACAGACCAGAG
ACGAAACCTCTTAGCATTCAATCCATCGCGTTGCAGGGAGAGGAGCTTCAACAGTGCCTG
GGACTTGCGACCCAGGGTCAGGACTATGGACCCGGTCTCCGTCTCGAGGAGTTCCTCATC
TGGAGCGTGGAGAGTGCCGGGGCGCTGGTGACGCCGTGCCGGGAACTGTTACTGGAGCTA
TGCCACGTGGTGCTGGGTCTCCGGCCCGAGTGTCGACATCGCGAGAGAGACATCGTCCTG
GGCTGGTTGCGTCGCGAGACTTGCCGCGGTCTGTCTGTGGGTCAGTTCTGGTACCTGGTG
TCGGCGTCCTGGTGGCGCGCCTGGCTCCAGTACTGCGGCTCGCCCGGCTCGTGCTGCCGC
CGGGACGACATCGTACCGGACGACAGTTTCACTACTAATTCAACCGAGTCAATGGGTTCC
TTGTTATGGCCAGCGGAAAGCGCGTCTCTTGGCAGCGCTGGTGGCAGCGCGGGTAGCGCC
AGCAGCGGCGTGGGCAGCGTCAGGGCCGCGCCTCATCCGGGGCCCGTGGACAACTCCCCG
CTCCTGGGGGGCGGAGGACCAGCGGTGCGGGCGCTCACCGGCGAGGGCGGCACCCTCCGC
CGTGACGTCACCCTGGCGCAGCATCGCGACTTCGAGCTGGTCCCGGACGCTCTGTGGCAC
GCGCTCGCCCTGTGGTACGGAGCGGCTGACCCCCTACCGCGACAGGTTATCAGGCCGCTA
CACGCGGACGTGGAGTTGGAACTGTATCCGCTGCAGATGAGGATCTACAGACACGTGCCA
GGACCGCAGATGGATGTGTCTGCGTCAGGAGCGACCACCTTGGGTCTGTTGGGGGCGGGT
GCGGCGGGGGCGGGCGTGGGGGCGGGCGCCCTGTACGCCGCGCCACCCGACAGGCAGCTC
GCATACACAGCGGCCTTCTCTAGGCTGGCCACCATCAAACAGGTGACCGAATTTCTCTGC
GGGGCCCTGGGCCTGGCGCGGGAGGACGTGCGGCTGTGGGCCCTGGGGACCGGCGCTTTG
TTGCTGGATGACGAGCGACCGACGCTACAGGCGCTCAGGTTGGATGAGCGGTCCAAGCTA
CTGTTGGAGGTGCGCAACCCTGATCTGACCTGGCCCGAGGAAATAGGCGCGCTCGGAGCA
CAATCAGCGTGCGGCGTGACGGGGGCGGCGCGATGGGCCGAGCGACGGGAAACATTGACG
GCGCCCCAGCTGCCAGGGGCTACAGGGCTCCACAATCTCGGCAACACGTGCTACATGAAC
GCCGCACTGCAGAGCGTTTGGAACACGGGCCCGCTGGCGCGCTACTTCAATTCGGGTCTC
CATCTGTACGAAGTGAACTCCGCCAATCCACTGGGTACCGGCGGCTCGCTGGCGTTACGC
TTCGGCGAGCTGTGCAAGGAGGTGTGGTCTTCGAGCGCTCGGTCCATAGCGCCGGTGAGG
CTGCGGTGGTGCGTGTCTCGTTACGCGCGCGACCTGGCGGGTGGCGGCCAGCACGACGCC
CAGGAGCTCCTGGCCTGGCTGCTCGACGCACTGCACGAGGATTTAAATCGTGCTTCGCCG
CCCGCCCCCGCCCCCTCTCCCGCCCCGCCCAACCAGCCTGCCGGCCCCCGTGCGGACCGT
GAGTCAGCCGCCGAGGCCTGGGCCGCTCACACCGTTCGCAACGACTCCATCATATCGGAG
CTGTTCTACGGTCAGCTCAAATCGAAGGTTCGCTGCAGCGTGTGCGCCAGTGAGTCGGTG
CGGTTCGACACCTTCAACATGCTCAGTCTTCCGTTGCCGATGGAGTCGTACGTGTGCGCC
ATCGTGAGAGTGGTCCTGTTGGATGGTTCGGTTCCGACGAAGTATGGCGTGAGAGTGAAC
TCGGAGGGCACTTACATGGATCTAAAGGAGAAGCTGTCGGAACTGTGCGGCCTGTCGCCG
GACTTGATGCTCCTGGTGGCGTTGTCGGGAGCCACGATAGGGCGCGTCCTCGAGTCCGAT
AACAAAGTGAGTGCGGCCATCGCGAGAGAGCTGGTCGCATATGAGCTGCCCTCGGACAAT
GGAAACGACGGCAGCGACCAGGACGAGTGGTCTAGTGATGTAGAGGAGAGTGACTCGGGC
GTGACGGAGGGCATGCTGTCCGACGAGGACGAGAGGATCCGACCGCCGGCTGACGAGCGT
GACGGACGTGACGCACGTGACGCACGTGACGGCCGCGACGACAGCGACGACCGGGACGGA
CGACTGGCGGGCTCGGTGAGTGTGGCGCGCGGCCGGACATCCTCCTCGCTCTGCATGCCT
GCACTCTTCTGCTTTAAGCGTTCCCGCTCCGAACTGCTGATGTCGGCCTCACCGACGGCA
CTGTACGAGCGGCACACGCTGCCGCGGGCGATGTCCGCGCCCACCTCCCGCACGCACACG
CACAACGCTCAACTCGCCCATCACGCCCACGTCTCCAATCAGACAACGTACGAGGAAGGG
GACAGCTATCTGATAGCTGTTCACAGGAAGCAGGTGTCCGGCGAGGGTTACCTAGTGGGG
GGCGGAGGTCGTGCGGCGTTGTTCGGCTCCCCGTTGGTGGTGTGCACTCGGCCCGGGACC
TCCGGCAGAAGAGTGTACGGTCGCGTGTGGACCCAGCTGGCGAGATTGCTATCCGCTCGA
CCAGCCCCTCGGCCGCACACCAGGCACAACCATGCTACCGACTGTGACGACAGTCTCGGC
TACGAGTTCCCCTTCACGCTGCGTTTGGTCGGCGCGAGCGGCTTGTGGTGCGCTCTCTGT
CCCTGGCCGGCGCTCTGTAGGGGCTGCGTGCTTCCTGCCACAGACGACGTGCTCATAAGA
GACGGAGCTTGTCGTCCTAGAAGGAGGACGGAGCCCCGTGACGAGGGTCCCGACACGGAC
TCGCCCATAGCAAGAGCGAAACTACAGAGGCAAGCCAGCTCACGACTCGGCAACCATACT
GGTTCCCACCAGTCTTCCGAGGGTGTGGTCCGCCGTCTTGACTTGTCAGGGCTGCGTCGA
GGAGGTGTGAGGGTCATGCTCGCCATTGACTGGGATCCCACAGCACTGCATCTCAGATAC
CAGTCCACCAGGGAGAAGGTTTTCGTGGAGCACGGTTCGGTGCAGGCGTGCCTGTCAGCC
GGTTCCCAGCCCGTGGACCTGGCCAGCTGTCTGCGGGCCTTCACCTCGGAGGAGCGGCTC
GAGGCTCGCTACCACTGCGGCCCGTGTTCCGCCCTCCAACCAGCTACAAAGAAACTACAG
ATGTGGAGACTGCCACCTGTACTGATCATACACCTCAAGCGGTTCCAGTACGTGAACAAC
AAGTGGATCAAGTCCCACAAGGTGGTCGACTTTCCCTTCGAGGACTTCGACCCGACGCCC
TACCTCGCATCAGTTCCGCAGGAGACGATCCTGCGACACGAGGAACTGAACCAAAAACGA
AGATCATCGAACTTCATAGATATAGAAGACAGAATATCAGAGAGCGACGCCGAAACCGAG
GAGGAAATAGAAATAACAGGCGACGAGGCTGCGAAGAGACGGAGCAAAGAGAGGAGAAGA
AGGGAGTCTGTAGAGGTGAAGGGCAGGAGACGGCTGGAGTCCACCAGCCTGATCACGACC
CCGGTGGTGGACGACAACCTGATGGACTACCACCAGCACCGCCTGCTGCCGGAGCGAGAC
GTGTTCGACCTGAAGTACAGGCTGTATGCGGTCGTGTCTCACTCGGGCCAGCTGTCAGGT
GGTCACTACGTGTCTTACATCCGTCATTCCTCGGGCTCCTGGCTGTGTTACAACGACAGC
TCGTGCCGCGAGCTGGGATCAGCGCCTACGCTGGACGCGGCCGCAGCCTACCTACTGTTC
TACGAGCGCGTAGGCCTCCGCTACGACGCCTACCTGCCCTCACCACCGGACCGCCCCCCT
CCACCCCCGCCCGCCGACGACCCCGACCTCAAGAACGTCTGCAGCATCGTGTAG

Protein sequence:

MVNISIKNQDSRSSTPSDGESEGDRGFDPELVLKNLKEKLVSVPADARKPMFQLGPTDAE
RTVTTTEDTFKQCFRIDRPETKPLSIQSIALQGEELQQCLGLATQGQDYGPGLRLEEFLI
WSVESAGALVTPCRELLLELCHVVLGLRPECRHRERDIVLGWLRRETCRGLSVGQFWYLV
SASWWRAWLQYCGSPGSCCRRDDIVPDDSFTTNSTESMGSLLWPAESASLGSAGGSAGSA
SSGVGSVRAAPHPGPVDNSPLLGGGGPAVRALTGEGGTLRRDVTLAQHRDFELVPDALWH
ALALWYGAADPLPRQVIRPLHADVELELYPLQMRIYRHVPGPQMDVSASGATTLGLLGAG
AAGAGVGAGALYAAPPDRQLAYTAAFSRLATIKQVTEFLCGALGLAREDVRLWALGTGAL
LLDDERPTLQALRLDERSKLLLEVRNPDLTWPEEIGALGAQSACGVTGAARWAERRETLT
APQLPGATGLHNLGNTCYMNAALQSVWNTGPLARYFNSGLHLYEVNSANPLGTGGSLALR
FGELCKEVWSSSARSIAPVRLRWCVSRYARDLAGGGQHDAQELLAWLLDALHEDLNRASP
PAPAPSPAPPNQPAGPRADRESAAEAWAAHTVRNDSIISELFYGQLKSKVRCSVCASESV
RFDTFNMLSLPLPMESYVCAIVRVVLLDGSVPTKYGVRVNSEGTYMDLKEKLSELCGLSP
DLMLLVALSGATIGRVLESDNKVSAAIARELVAYELPSDNGNDGSDQDEWSSDVEESDSG
VTEGMLSDEDERIRPPADERDGRDARDARDGRDDSDDRDGRLAGSVSVARGRTSSSLCMP
ALFCFKRSRSELLMSASPTALYERHTLPRAMSAPTSRTHTHNAQLAHHAHVSNQTTYEEG
DSYLIAVHRKQVSGEGYLVGGGGRAALFGSPLVVCTRPGTSGRRVYGRVWTQLARLLSAR
PAPRPHTRHNHATDCDDSLGYEFPFTLRLVGASGLWCALCPWPALCRGCVLPATDDVLIR
DGACRPRRRTEPRDEGPDTDSPIARAKLQRQASSRLGNHTGSHQSSEGVVRRLDLSGLRR
GGVRVMLAIDWDPTALHLRYQSTREKVFVEHGSVQACLSAGSQPVDLASCLRAFTSEERL
EARYHCGPCSALQPATKKLQMWRLPPVLIIHLKRFQYVNNKWIKSHKVVDFPFEDFDPTP
YLASVPQETILRHEELNQKRRSSNFIDIEDRISESDAETEEEIEITGDEAAKRRSKERRR
RESVEVKGRRRLESTSLITTPVVDDNLMDYHQHRLLPERDVFDLKYRLYAVVSHSGQLSG
GHYVSYIRHSSGSWLCYNDSSCRELGSAPTLDAAAAYLLFYERVGLRYDAYLPSPPDRPP
PPPPADDPDLKNVCSIV