MonarchBase - Protein-coding gene

DPOGS210564
Transcript	DPOGS210564-TA	1182 bp
Protein	DPOGS210564-PA	393 aa
Genomic position	DPSCF300911 - 557-5554
RNAseq coverage	23x (Rank: top 78%)

Annotation
*Heliconius*	HMEL008419	1e-155	84.23%
*Bombyx*	BGIBMGA009941-TA	4e-164	88.26%
*Drosophila*	CG12082-PA	2e-108	62.29%
EBI UniRef50	UniRef50_E3X289	3e-110	64.65%	Ubiquitin carboxyl-terminal hydrolase n=9 Tax=Pancrustacea RepID=E3X289_ANODA
NCBI RefSeq	XP_001847129.1	4e-116	65.10%	ubiquitin carboxyl-terminal hydrolase 5 [Culex quinquefasciatus]
NCBI nr blastp	gi\|307192538	8e-119	67.45%	Ubiquitin carboxyl-terminal hydrolase 5 [Harpegnathos saltator]
NCBI nr blastx	gi\|307192538	5e-118	67.45%	Ubiquitin carboxyl-terminal hydrolase 5 [Harpegnathos saltator]

Group
Gene Ontology	GO:0008270	1.4e-23	zinc ion binding
	GO:0006511	6.2e-08	ubiquitin-dependent protein catabolic process
	GO:0004221	6.2e-08	ubiquitin thiolesterase activity
KEGG pathway
InterPro domain	[121-176] IPR001607	1.4e-23	Zinc finger, UBP-type
	[102-215] IPR013083	4.2e-21	Zinc finger, RING/FYVE/PHD-type
	[249-280] IPR001394	6.2e-08	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
Orthology group	MCL10894		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210564-TA
ATGTCGGAAATCCCGGAGCCAGAACAAACAGGAGATGGTCCAGAGAAGAAAATAACTCGCCTGGCGATCGGTGTGGAGGGTGGCTTCGACCCTGACTGTGGCAAACCAAAGTACACTTACACAGAACACTACAGCGTTGTGGTGCTGCCGGGGTTTCACACATTCCCCTGGCCTAATGACGCTTTACCTGACGTGGTAAAGAAATCTGTTCAGGCTGTGCTAGATGCGGATTCTCCATTCAAGCTCGCTGAGGCGGAGGCTTTACACGGCACCTGGGATGGGGAGAAGCGAGAAGTATCCGTCCACTCGGTTAACTTGAAGCAGTTAGATAACGGCGTTAAAATACCACCTTCCGGCTGGAAATGTGCCAAGTGTGATCTGACGAACAACTTGTGGTTGAATCTGACCGACGGGTCCATATTGTGTGGGAGGAGATTCTTCGATGGCTCCGGCGGAAACGATCACGCGGTGGAGCATTTCCGCGCGACCGGATATCCGCTCGCTGTGAAGCTTGGCACGATAACAGCTGACGGTACTGGCGACGTGTACTCGTACGCCGAAGACGATATGGTCGAGGACCCCTACCTGGCGGAACACCTCAAACACTTCGGCATCAACGTCCAGCAGTTACAGAAGACGGAGAAGTCGATGGTGGAGTTGGAGCTGGAACTGAACCGCCGTACGGGCGAGTGGAACACCATCCAGGAGTCTGGAAGTGAGCTGCGACCGCTGCACGGACCAGCACTCACAGGTGTCAACAACCTCGGCAACTCCTGTTACATCAATAGTGTGGTCCAGGTGCTCTTCCGTATGCCGGACTTCATACGTCGCTACGTGGAAGGCGCGCCAGAGATATTCTCGACCTTCCCCGAGGATCCTGCTAACGATTTCAACGTGCAGACAGATCCGTCCGAAGTGGTCCGTCCCCTGATACCGTTTCAAGCGTGTTTAGACGCGTTCATGAAGGAGGAACTCATTGAACAGTTCTTTAGTTCAGCTCTCAATAAGAAAGTTACTGCTCGCAAAATAACCCGGCTGGCGACTTTCCCCGATTACCTTTGGATCCAGTTAAAGAAATTCACTATCAAAGAAGATTGGACACCCGCCAAGCTAGATGTGGCCGTGGACATGCCGTGGGAGGTCGGTGTCATTGTCATCGTCCCAAAACAAACGTTTTTTTAA

Protein sequence:

>DPOGS210564-PA
MSEIPEPEQTGDGPEKKITRLAIGVEGGFDPDCGKPKYTYTEHYSVVVLPGFHTFPWPNDALPDVVKKSVQAVLDADSPFKLAEAEALHGTWDGEKREVSVHSVNLKQLDNGVKIPPSGWKCAKCDLTNNLWLNLTDGSILCGRRFFDGSGGNDHAVEHFRATGYPLAVKLGTITADGTGDVYSYAEDDMVEDPYLAEHLKHFGINVQQLQKTEKSMVELELELNRRTGEWNTIQESGSELRPLHGPALTGVNNLGNSCYINSVVQVLFRMPDFIRRYVEGAPEIFSTFPEDPANDFNVQTDPSEVVRPLIPFQACLDAFMKEELIEQFFSSALNKKVTARKITRLATFPDYLWIQLKKFTIKEDWTPAKLDVAVDMPWEVGVIVIVPKQTFF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: