MonarchBase - Protein-coding gene

DPOGS210469
Transcript	DPOGS210469-TA	1497 bp
Protein	DPOGS210469-PA	498 aa
Genomic position	DPSCF300062 + 380759-386921
RNAseq coverage	651x (Rank: top 20%)

Annotation
*Heliconius*	HMEL012771	3e-141	66.67%
*Bombyx*	BGIBMGA002759-TA	0.0	81.70%
*Drosophila*	CG5384-PA	2e-158	55.90%
EBI UniRef50	UniRef50_Q9VKZ8	3e-156	55.90%	Ubiquitin carboxyl-terminal hydrolase n=46 Tax=Bilateria RepID=Q9VKZ8_DROME
NCBI RefSeq	XP_969056.1	0.0	65.19%	PREDICTED: similar to ubiquitin specific peptidase 14 [Tribolium castaneum]
NCBI nr blastp	gi\|91086685	0.0	65.19%	PREDICTED: similar to ubiquitin specific peptidase 14 [Tribolium castaneum]
NCBI nr blastx	gi\|91086685	2e-179	65.19%	PREDICTED: similar to ubiquitin specific peptidase 14 [Tribolium castaneum]

Group
Gene Ontology	GO:0006511	2e-50	ubiquitin-dependent protein catabolic process
	GO:0004221	2e-50	ubiquitin thiolesterase activity
	GO:0005515	3.1e-05	protein binding
KEGG pathway
InterPro domain	[105-466] IPR001394	2e-50	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
Orthology group	MCL14316		Single-copy universal gene

Nucleotide sequence:

>DPOGS210469-TA
ATGCCCAAAGTTTCAGTGAAAGTAAAATGGGGTAAGGAGATGTATCCCGGCGTTGAAGTTAACACAGACGACGATCCCGTTTTGTTCAAAGCTCAGATCTTTGCCCTCACAGGAGTACAGCCGGAAAGACAGAAAGTTGTATGCAAAGGGGTCACCCTCAGAGATGACGCTTGGGGCAATTTCAAATTAACAAATAATGCCCTAGTTCTGGTAATGGGTAGTAAAGAGGAAGATGTACCGGCTGCTCCTGTTGAACAGACTCGATTTGTGGAAGACATGAATGAATCGGAATTAGCTACGGCTCTCGACCTCCCAGAAGGTCTCATCAACTTGGGCAACACCTGCTATATGAATGCTACAGTACAATGTCTGAAGACTGTTCCCGAATTGAAAAATGCATTACTTAATTATGATCCAACATCAGGTGGAGGCACAGCAGGAGGCCTGACATCGGCCTTGAGCGAAACAATGAGGTCTCTGGAGGGGGGCGGGGCAGGGGCGTGTGCTGCGGCCGCGGCACGGCTTCTACACGCTCTGCACGCTGCAGCGCCACGTCTGGCCGAGCGGGGAGCTGGAGGACAACTGGCCCAACAAGATGCCTCTGAGTGCTGGACCGAAATCATACGAGCTCTGAGTATGAGGCTGCAATCCACACCTGAAAGTCACAGCAAGCCATTGATAGAGCAGTACTTCGGTGGAACTCTGGATGTAGAGTTAGTGTGCAGTGAGGCAGACGAGCCACCAACTCGGTCCACAGAGACCTTCCTGCAGCTCTCCTGCTTCATATCACAGGACGTCAAGTATCTACAGTCCGGACTCAGATCTAAAATGTCTGAACAAATTACAAAGATGTCAGAAACGTTGGGTAGAGATGCTGTTTACACTAAAACTAGCAAAATTAGTCGCCTGCCCGCCTACCTGACGGTCCAGTTCGTGAGGTTCTACTACAAAGAGAAGGAATCCATCAACGCCAAAATTCTCAAAGACGTCAAATTTCCTCTCGAGCTCGATGTTTACGAACTCTGCTCACCAGAACTGCAGGAGCGTCTCACCCCGATGCGGACCAAGTTTAAGGAACTCGAGGAAGCGTCGGTGGAAGCGGCTCTGAGCTCCAAGAATAAAAATCACGGAGACAGTAAAAAGGAGATCAAGAGGAAGGCGACGCTGCCGTACTGGTTCGAGAATGACGTGGGCAGCAACAACAGCGGCTACTACCGTCTGCAGGCGGTGCTGACTCACCGCGGCCGCTCGTCCTCGTCCGGTCACTACGTGGCGTGGGTCGCGCGCGGGGACGGCTGGCTCCGCTGCGACGACGACGCCGTGTCGCCCGTCACCGAGGAGGAGGTGCTCAAACTGAGCGGCGGAGGTGACTGGCACTGCGCGTATCTCTTGCTGTACGGACCAAAGATCCTGGAGCTATCTCAGGAGGGAGACAGTCCTGAGCCGATGATAACCGATGAGGCCTCCGGGCCCGACCCGCCGACGGCGCTCGCCTAA

Protein sequence:

>DPOGS210469-PA
MPKVSVKVKWGKEMYPGVEVNTDDDPVLFKAQIFALTGVQPERQKVVCKGVTLRDDAWGNFKLTNNALVLVMGSKEEDVPAAPVEQTRFVEDMNESELATALDLPEGLINLGNTCYMNATVQCLKTVPELKNALLNYDPTSGGGTAGGLTSALSETMRSLEGGGAGACAAAAARLLHALHAAAPRLAERGAGGQLAQQDASECWTEIIRALSMRLQSTPESHSKPLIEQYFGGTLDVELVCSEADEPPTRSTETFLQLSCFISQDVKYLQSGLRSKMSEQITKMSETLGRDAVYTKTSKISRLPAYLTVQFVRFYYKEKESINAKILKDVKFPLELDVYELCSPELQERLTPMRTKFKELEEASVEAALSSKNKNHGDSKKEIKRKATLPYWFENDVGSNNSGYYRLQAVLTHRGRSSSSGHYVAWVARGDGWLRCDDDAVSPVTEEEVLKLSGGGDWHCAYLLLYGPKILELSQEGDSPEPMITDEASGPDPPTALA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: