MonarchBase - Protein-coding gene

DPOGS212771
Transcript	DPOGS212771-TA	4974 bp
Protein	DPOGS212771-PA	1657 aa
Genomic position	DPSCF300012 + 909702-927544
RNAseq coverage	291x (Rank: top 38%)

Annotation
*Heliconius*	HMEL014157	1e-124	46.60%
*Bombyx*	BGIBMGA013218-TA	0.0	54.08%
*Drosophila*	CG8334-PA	0.0	47.68%
EBI UniRef50	UniRef50_D2A608	0.0	46.07%	Ubiquitin carboxyl-terminal hydrolase n=2 Tax=Tribolium castaneum RepID=D2A608_TRICA
NCBI RefSeq	XP_001811202.1	0.0	46.32%	PREDICTED: similar to ubiquitin specific protease [Tribolium castaneum]
NCBI nr blastp	gi\|189238385	0.0	46.32%	PREDICTED: similar to ubiquitin specific protease [Tribolium castaneum]
NCBI nr blastx	gi\|189238385	0.0	46.44%	PREDICTED: similar to ubiquitin specific protease [Tribolium castaneum]

Group
Gene Ontology	GO:0006511	4.4e-61	ubiquitin-dependent protein catabolic process
	GO:0004221	4.4e-61	ubiquitin thiolesterase activity
	GO:0005509	8.3e-17	calcium ion binding
KEGG pathway
InterPro domain	[746-1621] IPR001394	4.4e-61	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
	[430-580] IPR006615	3.6e-21	Peptidase C19, ubiquitin-specific peptidase, DUSP domain
	[188-280] IPR011992	8.3e-17	EF-hand-like domain
Orthology group	MCL16746		Patchy

Nucleotide sequence:

>DPOGS212771-TA
ATGGGTGCGAAGGATTCAAAGCTTAGTTTTATATCATACGACGACGCTGTGAAACGAGTGTCTGAGAGTGAGTTGAGGCGTATACGTGAAGCGTTTAAGAGATGTGCTGGAGCTAACGGTTCCGTGTTGAGCTTCGAAGCGTTCGTGCAGGAGGTGCTCTGCGATGGAGTCCCCCTCGAAGTGGCGGAGTGGTTATACCAGGCTTGCGGAGGCACCAAGCGAGGGATCACCTTCAAGGACCTTTTACGTGGGGTTGTCGTTCTTACAAAGGGAAATATAGAAGAGAAAATCAAGTTCCTGTGGACATTGTATGTGAATAATCAAAATGACAATGGCACATACATATACAAACGAGAGTTTGCTAGAGCACTTCACCTTGAAAATTCATCCTTACCAGAAAACGAATCTCAGAGAACTCTGGACATATTGACCAGTCTGTTTGGTTCCTGTGAGAGGGTCACCTTTGATCAGTTCAGATCGTGGCTGCTCATACACAAAGATGCTACGGTTCTATCAAAATGGTTGTTATTTGATAGAAATAGTACACCACAGGATTTAGATACACCCACATTTTACCAGAGCTTAGCTGGAGTCACACATCTGGATGAACGGGATATAATAGAATTGGAGAAATGCTTCTGGTGTCTTCGAAACTCCGCTCCCACTGGAGAGTTGGATGTACAGAGTATGAGGGGACTGTTGTCACCTCCTCTGCCGAGAGCAGCCGTCGAGGGTACCTTCCTGGCCTTCGATGAGAACAGAGATGGTCACATAGACTTTAAAGAGCTTTGCTGCGGACTCAGCGCCGCCTGCAGGGGACCTACAACAGAGAGGCTCAAATGTAAGAACAATCACTGTACATATAACAAATTACACGTAATACGGGGCCTTGTTAATGTTCGTATATATATAACTAACCAGGACTCGAGATCGTCCACGCCCTCGGACGGGGAGTCGGAGGGGGACAGGGGCTTCGACCCGGAGCTGGTGCTGAAGAACCTCAAAGAGAAACTGGTCTCCGTGCCCGCGGACGCCAGGAAACCGATGTTCCAACTAGGACCCACTGATGCTGAGAGAACCGTCACAACGACTGAGGGTCAGGACTATGGACCCGGTCTCCGTCTCGAGGAGTTCCTCATCTGGAGCGTGGAGAGTGCCGGGGCGCTGGTGACGCCGTGCCGGGAACTGTTACTGGAGCTATGCCACGTGGTGCTGGGTCTCCGGCCCGAGTGTCGACATCGCGAGAGAGACATCGTCCTGGGCTGGTTGCGTCGCGAGACTTGCCGCGGTCTGTCTGTGGGTCAGTTCTGGTACCTGGTGTCGGCGTCCTGGTGGCGCGCCTGGCTCCAGTACTGCGGCTCGCCCGGCTCGTGCTGCCGCCGGGACGACATCGTACCGGACGACAGTTTCACTACTAATTCAACCGAGTCAATGGGTTCCTTGTTATGGCCAGCGGAAAGCGCGTCTCTTGGCAGCGCTGGTGGCAGCGCGGGTAGCGCCAGCAGCGGCGTGGGCAGCGTCAGGGCCGCGCCTCATCCGGGGCCCGTGGACAACTCCCCGCTCCTGGGGGGCGGAGGACCAGCGGTGCGGGCGCTCACCGGCGAGGGCGGCACCCTCCGCCGTGACGTCACCCTGGCGCAGCATCGCGACTTCGAGCTGGTCCCGGACGCTCTGTGGCACGCGCTCGCCCTGTGGTACGGAGCGGCTGACCCCCTACCGCGACAGGTTATCAGGCCGCTACACGCGGACGTGGAGTTGGAACTGTATCCGCTGCAGATGAGGATCTACAGACACGTGCCAGGACCGCAGATGGATGTGTCTGCGTCAGGAGCGACCACCTTGGGTCTGTTGGGGGCGGGTGCGGCGGGGGCGGGCGTGGGGGCGGGCGCCCTGTACGCCGCGCCACCCGACAGGCAGCTCGCATACACAGCGGCCTTCTCTAGGCTGGCCACCATCAAACAGGTGACCGAATTTCTCTGCGGGGCCCTGGGCCTGGCGCGGGAGGACGTGCGGCTGTGGGCCCTGGGGACCGGCGCTTTGTTGCTGGATGACGAGCGACCGACGCTACAGGCGCTCAGGTTGGATGAGCGGTCCAAGCTACTGTTGGAGGTGCGCAACCCTGATCTGACCTGGCCCGAGGAAATAGGCGCGCTCGGAGCACAATCAGCGTGCGGCGTGACGGGGGCGGCGCGATGGGCCGAGCGACGGGAAACATTGACGGCGCCCCAGCTGCCAGGGGCTACAGGGCTCCACAATCTCGGCAACACGTGCTACATGAACGCCGCACTGCAGAGCGTTTGGAACACGGGCCCGCTGGCGCGCTACTTCAATTCGGGTCTCCATCTGTACGAAGTGAACTCCGCCAATCCACTGGGTACCGGCGGCTCGCTGGCGTTACGCTTCGGCGAGCTGTGCAAGGAGGTGTGGTCTTCGAGCGCTCGGTCCATAGCGCCGGTGAGGCTGCGGTGGTGCGTGTCTCGTTACGCGCGCGACCTGGCGGGTGGCGGCCAGCACGACGCCCAGGAGCTCCTGGCCTGGCTGCTCGACGCACTGCACGAGGATTTAAATCGTGCTTCGCCGCCCGCCCCCGCCCCCTCTCCCGCCCCGCCCAACCAGCCTGCCGGCCCCCGTGCGGACCGTGAGTCAGCCGCCGAGGCCTGGGCCGCTCACACCGTTCGCAACGACTCCATCATATCGGAGCTGTTCTACGGTCAGCTCAAATCGAAGGTTCGCTGCAGCGTGTGCGCCAGTGAGTCGGTGCGGTTCGACACCTTCAACATGCTCAGTCTTCCGTTGCCGATGGAGTCGTACGTGTGCGCCATCGTGAGAGTGGTCCTGTTGGATGGTTCGGTTCCGACGAAGTATGGCGTGAGAGTGAACTCGGAGGGCACTTACATGGATCTAAAGGAGAAGCTGTCGGAACTGTGCGGCCTGTCGCCGGACTTGATGCTCCTGGTGGCGTTGTCGGGAGCCACGATAGGGCGCGTCCTCGAGTCCGATAACAAAGTGAGTGCGGCCATCGCGAGAGAGCTGGTCGCATATGAGCTGCCCTCGGACAATGGAAACGACGGCAGCGACCAGGACGAGTGGTCTAGTGATGTAGAGGAGAGTGACTCGGGCGTGACGGAGGGCATGCTGTCCGACGAGGACGAGAGGATCCGACCGCCGGCTGACGAGCGTGACGGACGTGACGCACGTGACGCACGTGACGGCCGCGACGACAGCGACGACCGGGACGGACGACTGGCGGGCTCGGTGAGTGTGGCGCGCGGCCGGACATCCTCCTCGCTCTGCATGCCTGCACTCTTCTGCTTTAAGCGTTCCCGCTCCGAACTGCTGATGTCGGCCTCACCGACGGCACTGTACGAGCGGCACACGCTGCCGCGGGCGATGTCCGCGCCCACCTCCCGCACGCACACGCACAACGCTCAACTCGCCCATCACGCCCACGTCTCCAATCAGACAACGTACGAGGAAGGGGACAGCTATCTGATAGCTGTTCACAGGAAGCAGGTGTCCGGCGAGGGTTACCTAGTGGGGGGCGGAGGTCGTGCGGCGTTGTTCGGCTCCCCGTTGGTGGTGTGCACTCGGCCCGGGACCTCCGGCAGAAGAGTGTACGGTCGCGTGTGGACCCAGCTGGCGAGATTGCTATCCGCTCGACCAGCCCCTCGGCCGCACACCAGGCACAACCATGCTACCGACTGTGACGACAGTCTCGGCTACGAGTTCCCCTTCACGCTGCGTTTGGTCGGCGCGAGCGGCTTGTGGTGCGCTCTCTGTCCCTGGCCGGCGCTCTGTAGGGGCTGCGTGCTTCCTGCCACAGACGACGTGCTCATAAGAGACGGAGCTTGTCGTCCTAGAAGGAGGACGGAGCCCCGTGACGAGGGTCCCGACACGGACTCGCCCATAGCAAGAGCGAAACTACAGAGGCAAGCCAGCTCACGACTCGGCAACCATACTGGTTCCCACCAGTCTTCCGAGGGTGTGGTCCGCCGTCTTGACTTGTCAGGGCTGCGTCGAGGAGGTGTGAGGGTCATGCTCGCCATTGACTGGGATCCCACAGCACTGCATCTCAGATACCAGTCCACCAGGGAGAAGGTTTTCGTGGAGCACGGTTCGGTGCAGGCGTGCCTGTCAGCCGGTTCCCAGCCCGTGGACCTGGCCAGCTGTCTGCGGGCCTTCACCTCGGAGGAGCGGCTCGAGGCTCGCTACCACTGCGGCCCGTGTTCCGCCCTCCAACCAGCTACAAAGAAACTACAGATGTGGAGACTGCCACCTGTACTGATCATACACCTCAAGCGGTTCCAGTACGTGAACAACAAGTGGATCAAGTCCCACAAGGTGGTCGACTTTCCCTTCGAGGACTTCGACCCGACGCCCTACCTCGCATCAGTTCCGCAGGAGACGATCCTGCGACACGAGGAACTGAACCAAAAACGAAGATCATCGAACTTCATAGATATAGAAGACAGAATATCAGAGAGCGACGCCGAAACCGAGGAGGAAATAGAAATAACAGGCGACGAGGCTGCGAAGAGACGGAGCAAAGAGAGGAGAAGAAGGGAGTCTGTAGAGGTGAAGGGCAGGAGACGGCTGGAGTCCACCAGCCTGATCACGACCCCGGTGGTGGACGACAACCTGATGGACTACCACCAGCACCGCCTGCTGCCGGAGCGAGACGTGTTCGACCTGAAGTACAGGCTGTATGCGGTCGTGTCTCACTCGGGCCAGCTGTCAGGTGGTCACTACGTGTCTTACATCCGTCATTCCTCGGGCTCCTGGCTGTGTTACAACGACAGCTCGTGCCGCGAGCTGGGATCAGCGCCTACGCTGGACGCGGCCGCAGCCTACCTACTGTTCTACGAGCGCGTAGGCCTCCGCTACGACGCCTACCTGCCCTCACCACCGGACCGCCCCCCTCCACCCCCGCCCGCCGACGACCCCGACCTCAAGAACGTCTGCAGCATCGTGTAG

Protein sequence:

>DPOGS212771-PA
MGAKDSKLSFISYDDAVKRVSESELRRIREAFKRCAGANGSVLSFEAFVQEVLCDGVPLEVAEWLYQACGGTKRGITFKDLLRGVVVLTKGNIEEKIKFLWTLYVNNQNDNGTYIYKREFARALHLENSSLPENESQRTLDILTSLFGSCERVTFDQFRSWLLIHKDATVLSKWLLFDRNSTPQDLDTPTFYQSLAGVTHLDERDIIELEKCFWCLRNSAPTGELDVQSMRGLLSPPLPRAAVEGTFLAFDENRDGHIDFKELCCGLSAACRGPTTERLKCKNNHCTYNKLHVIRGLVNVRIYITNQDSRSSTPSDGESEGDRGFDPELVLKNLKEKLVSVPADARKPMFQLGPTDAERTVTTTEGQDYGPGLRLEEFLIWSVESAGALVTPCRELLLELCHVVLGLRPECRHRERDIVLGWLRRETCRGLSVGQFWYLVSASWWRAWLQYCGSPGSCCRRDDIVPDDSFTTNSTESMGSLLWPAESASLGSAGGSAGSASSGVGSVRAAPHPGPVDNSPLLGGGGPAVRALTGEGGTLRRDVTLAQHRDFELVPDALWHALALWYGAADPLPRQVIRPLHADVELELYPLQMRIYRHVPGPQMDVSASGATTLGLLGAGAAGAGVGAGALYAAPPDRQLAYTAAFSRLATIKQVTEFLCGALGLAREDVRLWALGTGALLLDDERPTLQALRLDERSKLLLEVRNPDLTWPEEIGALGAQSACGVTGAARWAERRETLTAPQLPGATGLHNLGNTCYMNAALQSVWNTGPLARYFNSGLHLYEVNSANPLGTGGSLALRFGELCKEVWSSSARSIAPVRLRWCVSRYARDLAGGGQHDAQELLAWLLDALHEDLNRASPPAPAPSPAPPNQPAGPRADRESAAEAWAAHTVRNDSIISELFYGQLKSKVRCSVCASESVRFDTFNMLSLPLPMESYVCAIVRVVLLDGSVPTKYGVRVNSEGTYMDLKEKLSELCGLSPDLMLLVALSGATIGRVLESDNKVSAAIARELVAYELPSDNGNDGSDQDEWSSDVEESDSGVTEGMLSDEDERIRPPADERDGRDARDARDGRDDSDDRDGRLAGSVSVARGRTSSSLCMPALFCFKRSRSELLMSASPTALYERHTLPRAMSAPTSRTHTHNAQLAHHAHVSNQTTYEEGDSYLIAVHRKQVSGEGYLVGGGGRAALFGSPLVVCTRPGTSGRRVYGRVWTQLARLLSARPAPRPHTRHNHATDCDDSLGYEFPFTLRLVGASGLWCALCPWPALCRGCVLPATDDVLIRDGACRPRRRTEPRDEGPDTDSPIARAKLQRQASSRLGNHTGSHQSSEGVVRRLDLSGLRRGGVRVMLAIDWDPTALHLRYQSTREKVFVEHGSVQACLSAGSQPVDLASCLRAFTSEERLEARYHCGPCSALQPATKKLQMWRLPPVLIIHLKRFQYVNNKWIKSHKVVDFPFEDFDPTPYLASVPQETILRHEELNQKRRSSNFIDIEDRISESDAETEEEIEITGDEAAKRRSKERRRRESVEVKGRRRLESTSLITTPVVDDNLMDYHQHRLLPERDVFDLKYRLYAVVSHSGQLSGGHYVSYIRHSSGSWLCYNDSSCRELGSAPTLDAAAAYLLFYERVGLRYDAYLPSPPDRPPPPPPADDPDLKNVCSIV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: