MonarchBase - Protein-coding gene

DPOGS201954
Transcript	DPOGS201954-TA	2934 bp
Protein	DPOGS201954-PA	977 aa
Genomic position	DPSCF300384 - 52334-64678
RNAseq coverage	1401x (Rank: top 9%)

Annotation
*Heliconius*	HMEL009134	0.0	77.57%
*Bombyx*	BGIBMGA011368-TA	0.0	90.24%
*Drosophila*	CG14619-PC	8e-89	49.42%
EBI UniRef50	UniRef50_D2A5H2	6e-155	73.67%	Ubiquitin carboxyl-terminal hydrolase n=4 Tax=Coelomata RepID=D2A5H2_TRICA
NCBI RefSeq	XP_001599439.1	1e-158	75.89%	PREDICTED: similar to ubiquitin specific protease 41 [Nasonia vitripennis]
NCBI nr blastp	gi\|345490133	3e-158	75.82%	PREDICTED: hypothetical protein LOC100114408 [Nasonia vitripennis]
NCBI nr blastx	gi\|345490133	1e-149	71.58%	PREDICTED: hypothetical protein LOC100114408 [Nasonia vitripennis]

Group
Gene Ontology	GO:0006511	1.3e-71	ubiquitin-dependent protein catabolic process
	GO:0004221	1.3e-71	ubiquitin thiolesterase activity
KEGG pathway
InterPro domain	[641-973] IPR001394	1.3e-71	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
Orthology group	MCL14940		Single-copy universal gene

Nucleotide sequence:

>DPOGS201954-TA
ATGCCAGTCGTATCACCGTCTCGTTACACACCAACATCTTCAACGCTCACCGGATCCTATCGATCTACCCTCACATCCTCGTCCAGCATCGACAAGCCATACTATAGGAGTTCCAGCGGCACGTACGTCACGTCCACACTCAGAAGCAGCTACGGTGACAGAACAACAGAGTATAGATCGAGATACAGCGATGTGGACGGGAAGAGAGAGAGGAAGACGTCACTCGTAGAATATTCTAGAAGCTCTAGAGCACCGAGCGCTACCGACTCGGATAGCGGTATATCCAGTCGTTATAGATCTGACAGAAGCGAATCTAGATCTAGAGATGTTTCTACAACTAGAAGCGAGAGTTCAAGGAATGATAGGGGAAAGAGGAACATAATTAGCACAGCGGCGCTGGCTATGTCGACAGCGGAGTTATACAATAAGTACAGTCCAGCGAATTACGTGCCCCTGACGCAGAGGATACAGCAGCAGAGTCAGAACAACTACAGCGAAATATCTAGATCCAAATCCATATCCAACGATATAGGAAGACCACCAGCACCGGAATGCAGGGTCAGGAAACCGAGGAACTCAGCGGCGACTATATCAGAGAAACCGGAAAACAGAAGATACAAGGACGGCTCGCCGACGCCGAGCTACAGCAAGAGAGCGTCCATGACGAACGGGTCAAGGGACAGCAACGGGAACGAAGTGCCTTCCGTCAGTGACATAAAGAAACGGTTCGATCCCAAAATGACCGTCACTAAACTACCAGCTAACGACGTCAGGTACACCAAGACCATGGAGCATTACCTGAACCAGCTGAAAGATTGCGAGAACGGTGTTGGTTACGCGAAAACCAATCCCAAAGACGAAAAACCAGTGCCTATTCACTTGCCATACGCTGATAAGAATGGTGTCAACAGATATGAAGGCTCCCCCACCTCCAGGAACAGCTCGAATTCAGATCTCACCATCAGCAAGACGCTATCTGAACCAGTTTCCTTAGCTAAAACTTCCGTAGATAAGAATAATATGATGTCCTCGTCACTAACCACCAAGCTTCCATCCGAACGACTAGCCAGCATCAAGAGCCAATTAGACCCGAACAATCCGATAGGTAAAATATTAGAAAAATCAACAGTCATCCAGGTTGAAAACGGCGATGCAGATTACAATGAACGGAACAGGATACGCTACAGTCCGGAAGTCAAAATAAAAGAATTGAAAAATGACATCGAGAAGCAAACAAAGACGCCAAAACATACCACGAACTTCGCTTCGTACATACAAATATCTCAACCGGTGGCGTCCGGAGCCACACCAAAGAAACACCTCGATGCCAACGAGGACGCCAAGAAAGAGAGGAAATCAATAAAATACATAGACTCAGAGGAGGATAGACTAGTTCTAGAGAATGATATAGAATCTCCCAGCGGCACGGGCTTCGAGAACAAAACGTTCGAGCACGAGAACTTCATAAAGAAGAGAACGGAGAAGAATGAGACAGAAGACAAAGAAGACGGCATCAAGTCGATGGAAACTAGCACTGAGAGCACCATCAGTGAGTCCACAGAGGACTCCAGTCCCGAAACGCCCTCTGCAAGAAGAAATCTCCTCGACTTAAAGGACTATGATTACATAAAGACGTTAAAAGTGGAACTGCTGGACTGTATGCTCGTACTGCTGGAGCTGGTTGTGCTGGCATGCGTGGCCACGGGCATGCTGTCCGCCTTAAGACATGAGGTGCGGGTGCCGGCGTTGCTACGAGCCGCGGGCGAGGGTCCGACCGAAGCCAGCCTATGGCCTCCAATACCATCAGGTCCATGTATAAAATTAGTGGAGTTGGCCGGCGGTAAAAGCGGTCCCAGCGGATTACGACGCAGCCTCGAACGGGAAGTCAGCGAGAAATCTGAGAAGTCCAGTCAGACGAGCGGTCTGAACGGCCTCAGGAACATCGGCAACACCTGCTTCATGAACAGCGTGCTTCAGTGCCTGTCGAACACTCGGCCGCTGTTGGAATACCTCGTGGATGACAAATACAATTCCGACATTAACACTACACTGTCTTGTATGAAAGGAGCGCTCATTAAAGCGTTCGCTAGCGTGATAAAGGAGCTGTGGCGCAGTGGGGACAGGGACTGCGTGGTGAACACCACCGCGCTCAAGTCGCAGGTGCAGCGGTTCGCGCCCAGGTTCATGGGATACAGCCAGCAGGACGCGCAGGAGTTCCTCCGTTATCTGCTGGAAGGTCTGCACGAGGACGTGAACAGGGTCACCGTGAAGCCGAAGCCGATACTCACAGAGATAGATGATAGTCTCAGTGACTCTGCGAAGGCGGCTGAAGCTTGGAGTCGTTATTTACGAACTGAGGATTCTCGTGTGGGGGACATCTTCGTCGGTCAGCTCAAGTCCACATTAAGATGCACCCACTGCCTGCATGACAGTGTGACCTTTGACCCATTTTGGGACCTCAGTCTGCCGATCCCCTCTCGCACTGGCAATTTAAAGCTGCAGCAGTGCTTGCAGCACTTCGTCCGGGAAGAAGAGCTGGACGGAGACGAGAAGCCGACGTGCTCCAAATGCGGCGTCCGTCGCAAGTGCCTCAAATGGTTCACAGTACACAAGTTCCCTCAAGTGCTGGTCCTGCATCTGAAGCGCTTCTCACCAACTGAACGCTTCCGCGGCAAGTTGTCTGTTGTGGTGGAGTTCCCTCTGTCTGGTCTCGACATGTCACCGTTCGCTGCCTCGCCGACACACGCCACGTACAACCTGTACGCGGTCAGCAATCATTCAGGCACCACCTACTCCGGACACTACACAGCGTACTGCAAACATCCCTACACCGGTGACTGGCACGAGTACAACGACTCCAGGGTGACTCCCATCCGGTCCCGTGACATTGTCTCAGCGGAGGCTTATGTTCTATTCTACGAGCTGGCCACGTAG

Protein sequence:

>DPOGS201954-PA
MPVVSPSRYTPTSSTLTGSYRSTLTSSSSIDKPYYRSSSGTYVTSTLRSSYGDRTTEYRSRYSDVDGKRERKTSLVEYSRSSRAPSATDSDSGISSRYRSDRSESRSRDVSTTRSESSRNDRGKRNIISTAALAMSTAELYNKYSPANYVPLTQRIQQQSQNNYSEISRSKSISNDIGRPPAPECRVRKPRNSAATISEKPENRRYKDGSPTPSYSKRASMTNGSRDSNGNEVPSVSDIKKRFDPKMTVTKLPANDVRYTKTMEHYLNQLKDCENGVGYAKTNPKDEKPVPIHLPYADKNGVNRYEGSPTSRNSSNSDLTISKTLSEPVSLAKTSVDKNNMMSSSLTTKLPSERLASIKSQLDPNNPIGKILEKSTVIQVENGDADYNERNRIRYSPEVKIKELKNDIEKQTKTPKHTTNFASYIQISQPVASGATPKKHLDANEDAKKERKSIKYIDSEEDRLVLENDIESPSGTGFENKTFEHENFIKKRTEKNETEDKEDGIKSMETSTESTISESTEDSSPETPSARRNLLDLKDYDYIKTLKVELLDCMLVLLELVVLACVATGMLSALRHEVRVPALLRAAGEGPTEASLWPPIPSGPCIKLVELAGGKSGPSGLRRSLEREVSEKSEKSSQTSGLNGLRNIGNTCFMNSVLQCLSNTRPLLEYLVDDKYNSDINTTLSCMKGALIKAFASVIKELWRSGDRDCVVNTTALKSQVQRFAPRFMGYSQQDAQEFLRYLLEGLHEDVNRVTVKPKPILTEIDDSLSDSAKAAEAWSRYLRTEDSRVGDIFVGQLKSTLRCTHCLHDSVTFDPFWDLSLPIPSRTGNLKLQQCLQHFVREEELDGDEKPTCSKCGVRRKCLKWFTVHKFPQVLVLHLKRFSPTERFRGKLSVVVEFPLSGLDMSPFAASPTHATYNLYAVSNHSGTTYSGHYTAYCKHPYTGDWHEYNDSRVTPIRSRDIVSAEAYVLFYELAT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: