MonarchBase - Protein-coding gene

DPOGS205326
Transcript	DPOGS205326-TA	2769 bp
Protein	DPOGS205326-PA	922 aa
Genomic position	DPSCF300322 + 230244-236561
RNAseq coverage	1141x (Rank: top 11%)

Annotation
*Heliconius*	HMEL016007	0.0	74.69%
*Bombyx*	BGIBMGA007386-TA	0.0	65.72%
*Drosophila*	CG4165-PC	2e-64	60.10%
EBI UniRef50	UniRef50_B3MR17	6e-125	37.64%	Ubiquitin carboxyl-terminal hydrolase n=5 Tax=Drosophila RepID=B3MR17_DROAN
NCBI RefSeq	XP_001607172.1	2e-127	37.80%	PREDICTED: similar to CG4165-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|380025651	4e-149	37.61%	PREDICTED: ubiquitin carboxyl-terminal hydrolase 45-like [Apis florea]
NCBI nr blastx	gi\|91088981	8e-178	42.81%	PREDICTED: similar to CG4165 CG4165-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0006511	6.7e-39	ubiquitin-dependent protein catabolic process
	GO:0004221	6.7e-39	ubiquitin thiolesterase activity
	GO:0008270	1.4e-17	zinc ion binding
KEGG pathway
InterPro domain	[244-918] IPR001394	6.7e-39	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
	[25-147] IPR013083	2.1e-19	Zinc finger, RING/FYVE/PHD-type
	[54-129] IPR001607	1.4e-17	Zinc finger, UBP-type
Orthology group	MCL10828		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205326-TA
ATGGTCAAGAAAAAGAGACAAAGCGATCCCAGTGAAAACGGAGACGACTCGACAGAATCTTGCGATGAAACCGTCAAATCCGCATGTCCTCATGTAGCCAAAGCTGTTGACCTTACTAGATTAAAGAAGGCTTTAAAAACCGGAGGTTTCGAAAAGGAATGTTCGGAGTGCAAAAAAAGTCCGAAAACCGAAATTGCTGATTCAAATTATGAAGAAGATGTCACTCTCTGGATGTGTCTGCGTTGCGGAACTCAGTTGTGCGGCAGAGCGAGAAACAAGCATGCCCTTAACCATTTCCACACGCCACATTCTGATTGCCATGCATTGACAGCGAACACCACAACCTGGGAGATCTACTGTTATAACTGTAACAATGAAATCACAGCCTCCAGCGCTAAAAAACTACATGAATGCATAGAATATTTGAAAAAGCAATCTTCAAATAACCCTAAGTTGCCTCCTATAGCATTACCCCTCGGCTCGTTAGAATCTAAGTTAGAGTTGCCAATGCCACTTGAACCTATCTCAAGAAATGACAAAGGTAAAGATAAAGCTATGGCACTAAACCTGCCGAGGACCCCTTATTTATTAGAAGTTTTGCAAGAAATGTCATCACCCGGTGAGAAGTTCACTCTACCTGGTGGTAAATTAAAAATTAAAGGTGATCAGAGTGGGGATGAGGGTGTGGAAATGGAACTTCCTCCGATCACAGGACAGTTAGCAGAATGGGGCACATTAACAAAAACTTTAGCTGAGACTTTAGCCGAGTTGCAAGCGGGTGAAGGAGGTGTGTATAATCCTCGGCGTTTGCTGTCGGCATTAGTCACCAAGCTCCCACAATTTGGTGGCGGGGACCAACATGATGCTCATGAACTCTTGAGGCATCTACTTGAAGCTGTCAGATCTGAAGATCTCCGTCGCTACCAGTCAGTGATACTCAGCAGCCTCGGTATGAATTCAAAAGTTGATCCCGCCAAAGTTAATGGGGAAGTTAAGCAAAAAGTCAAATTCTACGGGCAGCAGGCCTCCGACACTATGCTCAGACCTGAACAGGTTTTCCGTGGTTTTCTGGTGTCAACCCTGGAGTGTCAGGAGTGTTATTCCCATTCTGACCGGGCGGAATACTTCTTGGACCTGTCTTTACCCGTGGCCGCATTTCGTCCGCAGCCACCAGCCATCGTCCGTAGGAAGACTAACGAGGAAAACAATACTAATACCCAAGAAGAGAAGCCATCTAAACATCAGTTGAAGAAAGAGAGATATGCTAATCGAAGAGTAGCCAGAAAGAGCCATAAAGGCACTTCCAAAGATAAAGAAACAAATGGACCAAAGGAGGACGAAAAATCATCATCCGAGTCGGATGCTGATGTTGAAGATAACTTGGAAGATCAGCCTCGACAGACGGACGCGTCGACATCCGTTGGCACGCAAGCCGTCGCACACACGGCCGCCAACTTCGCAGCCTACCACATGGAATCTGGTTATAACTCCGAAAAAGTTATCAGCTCAGACTCGATACGCACCAGCCCCGTGGATTTGGATAAAGAAAAGACGGACAACACGCCGGAGTCGACGGAAAAGGATAAGGAATTCGTTGAAAACTCCACCTCCACGAACATCATACCCTCAGAGTATAAACCTTTAATACCATTAGAGAATTTCTCCAACCCGGACTCCGGTGTCGCGAGTCCGGAGGCGACGAAGCATAATTCAACGGAAACCGTGGACAACGTCGACTCGCCTCTGAATGGGAAAGAGCTCGGCAGTCACAGTTCATTGTCCAGCGAGATCAACTTGGACCTTTCGAGCCCCCAGCACAACAAACTGTCACCGGTCAAGAGCGTCTTCGAAAGACCGGTATCACGAATATCTTTCGCGCCAGAATACTCGAACGAGGTTGTGTCGAGGGGTATCAGCGCACAGGGCTGTCGTGAGCTCTTCGACAACAGCTGGGAGGTGAACACCCTGGAGGAGGCCGTGTTCCAGGAAGAAATCGCTCTTGATAAACTTAAAATTGAACCTGAAGCGAAACCTCCACCTCCGTCGTCCCCGGCGGCAGTGCCTCCACCGCCCGCCCCCAAACCGAAGCTTCCGGAAGCGGAGCCGGAGAGCGTCGTGAACAGAGATCTCATGTCCTTCTCCCGCCAGAGCCCGTCGTCCCCGCGTTACGTATGCGATGAAGACGAATGCAGCGTGCAGTCCTGTCTCAGCCAATTCACAGCGCTCGAGCTGCTCACCGGCAATAATAAAGTCGGCTGCGACACGTGCACCGAACGCATCAACGGCAAGGGCGGCAGGACCGTGTACACGAACGCGACCAAGCGGTTCCTGGTGTCGAAGCCGCCCGCGGTTCTCATCCTACACCTAAAGCGCTTCCAGCTGGGACCCCGCTGCATGTTCCGCAAGATGACCAAGCACGTGGACTTCCCCATACTACTGGACCTGGCGCCTTTCTGCGCCGCGGACAAGTCGAGACGCCGCGGTCGGCTGTTGTATTCTCTGTACGGGGTCGTGGAACATTCTGGTGGTATGCACGGTGGACATTACGTGGCGTACGTGAAGACACGGTCCTCGCCCGCCGGCCGCCGCTTCCTGCCGGGGCGGGTCCGCGACGACGATTCTGAACTATCGGGGTACGAATCGGGCGAGGCGCCGCCGCCGCCCGCCGCTCGCTGGTATTATGTATCCGACAGTATGGTGTCGGAGGTCAGCGAGGAAAAGGTGCTCCGCGCTCAAGCCTACCTTCTGTTCTACGAGCGCGTGCTGTAG

Protein sequence:

>DPOGS205326-PA
MVKKKRQSDPSENGDDSTESCDETVKSACPHVAKAVDLTRLKKALKTGGFEKECSECKKSPKTEIADSNYEEDVTLWMCLRCGTQLCGRARNKHALNHFHTPHSDCHALTANTTTWEIYCYNCNNEITASSAKKLHECIEYLKKQSSNNPKLPPIALPLGSLESKLELPMPLEPISRNDKGKDKAMALNLPRTPYLLEVLQEMSSPGEKFTLPGGKLKIKGDQSGDEGVEMELPPITGQLAEWGTLTKTLAETLAELQAGEGGVYNPRRLLSALVTKLPQFGGGDQHDAHELLRHLLEAVRSEDLRRYQSVILSSLGMNSKVDPAKVNGEVKQKVKFYGQQASDTMLRPEQVFRGFLVSTLECQECYSHSDRAEYFLDLSLPVAAFRPQPPAIVRRKTNEENNTNTQEEKPSKHQLKKERYANRRVARKSHKGTSKDKETNGPKEDEKSSSESDADVEDNLEDQPRQTDASTSVGTQAVAHTAANFAAYHMESGYNSEKVISSDSIRTSPVDLDKEKTDNTPESTEKDKEFVENSTSTNIIPSEYKPLIPLENFSNPDSGVASPEATKHNSTETVDNVDSPLNGKELGSHSSLSSEINLDLSSPQHNKLSPVKSVFERPVSRISFAPEYSNEVVSRGISAQGCRELFDNSWEVNTLEEAVFQEEIALDKLKIEPEAKPPPPSSPAAVPPPPAPKPKLPEAEPESVVNRDLMSFSRQSPSSPRYVCDEDECSVQSCLSQFTALELLTGNNKVGCDTCTERINGKGGRTVYTNATKRFLVSKPPAVLILHLKRFQLGPRCMFRKMTKHVDFPILLDLAPFCAADKSRRRGRLLYSLYGVVEHSGGMHGGHYVAYVKTRSSPAGRRFLPGRVRDDDSELSGYESGEAPPPPAARWYYVSDSMVSEVSEEKVLRAQAYLLFYERVL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: