MonarchBase - Protein-coding gene

DPOGS206464
Transcript	DPOGS206464-TA	1428 bp
Protein	DPOGS206464-PA	475 aa
Genomic position	DPSCF300070 + 124259-129866
RNAseq coverage	116x (Rank: top 58%)

Annotation
*Heliconius*	HMEL012940	0.0	73.17%
*Bombyx*	BGIBMGA005342-TA	0.0	72.50%
*Drosophila*	calypso-PA	1e-111	71.53%
EBI UniRef50	UniRef50_Q17N72	9e-130	55.45%	Ubiquitin carboxyl-terminal hydrolase calypso n=13 Tax=Bilateria RepID=CALYP_AEDAE
NCBI RefSeq	XP_001651006.1	2e-130	55.45%	ubiquitin c-terminal hydrolase x4 [Aedes aegypti]
NCBI nr blastp	gi\|380015599	1e-129	67.16%	PREDICTED: ubiquitin carboxyl-terminal hydrolase calypso-like [Apis florea]
NCBI nr blastx	gi\|157110219	3e-125	55.68%	ubiquitin c-terminal hydrolase x4 [Aedes aegypti]

Group
Gene Ontology	GO:0006511	3.3e-161	ubiquitin-dependent protein catabolic process
	GO:0005622	3.3e-161	intracellular
	GO:0004221	3.3e-161	ubiquitin thiolesterase activity
KEGG pathway
InterPro domain	[5-440] IPR001578	3.3e-161	Peptidase C12, ubiquitin carboxyl-terminal hydrolase 1
Orthology group	MCL15612		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206464-TA
ATGCCCGTGGAATTAAATAGTCTTACAGAGGGATGGCTAGAATTAGAAAGTGATCCGGGTCTATTCACTTTACTCCTTGAAGATTTCGGCGTAAAGGGAGTCCAAGTGGAGGAAATATATGATTTACACAAACCTCTAGAAAGCCCGGTTTATGGGTTTATTTTTTTATTTCGCTGGATTGAAGAAAGACGATCACGTCGTAAATTTGTCGAACAGATTGAAAGCTTCGTGCGTGATGAAGAAACAATAAATAATATATTTTTCGCCCAACAAATGGTTCCGAACAGTTGTGCTACACATGCACTACTGTCCATATTACTTAATTGTCCAAATCTCCATTTAGGAGAAACACTGAGCCGATTAAAGCATCATACACTAGGTATGAATCCTGAGAACAAAGGTTGGGCCATAGGAAACACGCCTGAATTAGCTTGTGCACACAATTCCCATGCTATACCACAAGCTCGCAAAAAGACTGATAAAAATGCTGGAGTTCCTACTGGTCGCTTTACAGGTGAAGCGTACCATTTTGTAAGTTTTGTGCCCATAAATGGTCATTTATTTGAATTGGATGGCTTAAAGCCCTTTCCAACTGACCATGGTCCATGGGCCTCTGACGAAGATTGGACTGACAAGTTTCGAAGAGTCATGGCTGAGAGACTAGGAAGAGATGCCGGAGAACAAGTACATGATATAAGATTTAATCTCATGGCGGTAGTACCAGATAGACGAATAGCATTGACTCAAAGATTAAGTGCTTTGGAATTAAACCAAAGGAGACTCAAAGAGGCCATCTCTAAAATAGGCAAACATCTAAGACATTTATTGAACAAGAATAGAGATTTTAACGAAGATTCACTGTCCAGCATGAACAATGTTGATGGATCAAATGAAAGTTCCATTCAAATATGCGAGGACGCAATTCTCAATGCCTTAGAGGCTTCAGAGGTGTCATCCTTGAATATAAATATAACAGATGCCATTACAATCGAAATTGGTGCCTCGGACAGTGCGTATGATAGCACTATAACCTTAGCTGATCCTATTGATCAAACTGCTGTTGTCAAATTTGTGACAATTAATGGTGAAAACGAGATATTGTCAGATATATACCCCACATCTACGACCGCACTCATCAAGAGTAACAACATGCCAGTTGTATTGTGTTGTGAAGTGGTCCCGGAACAGCCTTACAGGATGAGGAAGCTTCTGTTCACTCACGCCGAGCTGAACTCACTCATGAACAGCATCATGAGTGAGGTCCAGGCGTGCCAACAGGCGCTCAATGATGAGAATGATAAAAGAGATATGTACAAGGTCATGTCGGCAGTAGCACCAGTATTATCAGCGATTCCTCTGGCTCACAACCAAAACTTGCCGCTATCACTAAAAACCACAGCTCTACTCTGGGTGTCCGTGGACCTTTAG

Protein sequence:

>DPOGS206464-PA
MPVELNSLTEGWLELESDPGLFTLLLEDFGVKGVQVEEIYDLHKPLESPVYGFIFLFRWIEERRSRRKFVEQIESFVRDEETINNIFFAQQMVPNSCATHALLSILLNCPNLHLGETLSRLKHHTLGMNPENKGWAIGNTPELACAHNSHAIPQARKKTDKNAGVPTGRFTGEAYHFVSFVPINGHLFELDGLKPFPTDHGPWASDEDWTDKFRRVMAERLGRDAGEQVHDIRFNLMAVVPDRRIALTQRLSALELNQRRLKEAISKIGKHLRHLLNKNRDFNEDSLSSMNNVDGSNESSIQICEDAILNALEASEVSSLNINITDAITIEIGASDSAYDSTITLADPIDQTAVVKFVTINGENEILSDIYPTSTTALIKSNNMPVVLCCEVVPEQPYRMRKLLFTHAELNSLMNSIMSEVQACQQALNDENDKRDMYKVMSAVAPVLSAIPLAHNQNLPLSLKTTALLWVSVDL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: