MonarchBase - Protein-coding gene

DPOGS203393
Transcript	DPOGS203393-TA	1323 bp
Protein	DPOGS203393-PA	440 aa
Genomic position	DPSCF300003 + 873479-876941
RNAseq coverage	602x (Rank: top 21%)

Annotation
*Heliconius*	HMEL016624	1e-74	81.21%
*Bombyx*	BGIBMGA012292-TA	1e-148	73.95%
*Drosophila*	Uch-L3-PA	9e-110	59.87%
EBI UniRef50	UniRef50_Q9XZ61	1e-107	59.87%	26S proteasome regulatory complex subunit p37A n=35 Tax=Eumetazoa RepID=Q9XZ61_DROME
NCBI RefSeq	XP_002431967.1	6e-120	62.23%	ubiquitin carboxyl-terminal hydrolase isozyme L5, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|183979268	1e-137	71.96%	similar to CG3431-PA [Papilio xuthus]
NCBI nr blastx	gi\|183979268	6e-134	71.96%	similar to CG3431-PA [Papilio xuthus]

Group
Gene Ontology	GO:0006511	2.4e-157	ubiquitin-dependent protein catabolic process
	GO:0005622	2.4e-157	intracellular
	GO:0004221	2.4e-157	ubiquitin thiolesterase activity
KEGG pathway
InterPro domain	[1-342] IPR001578	2.4e-157	Peptidase C12, ubiquitin carboxyl-terminal hydrolase 1
Orthology group	MCL12912		Single-copy universal gene

Nucleotide sequence:

>DPOGS203393-TA
ATGGAGTCTGCGGGTGACTGGTGCCTGATCGAAAGTGATCCTGGCGTCTTTACGCAACTGATTAAGAAATTTGGTGTTAAGGGTGTCCAAGTGGAAGAGATGTGGACTTTTGATGACAGCATTTTTGATAACCTAAGACCCGTTCATGGATTGATATTCTTGTTCAAATATTTGCAACATGATGAACCTCCTCATCCCGTAGTCAAGGACAACAGGCTGGAGAAAATATATTTTGCTAAACAGGTGATAAACAATGCATGTGCGACACAAGCTGTTGTAAGTCTCCTTTTGAATTGCAACCATCCAGATGTCATATTAGGGCCGGAGTTGACAAAGTTAAAGGAATTCAGTATGTCATTTGATCCAAGGATGCGCGGTCTCACACTAAGCAACTCTCAGACTATAAGAAGTGCACATAACTCTATGTCCCAACAAGCTCTGTTTGAATTTGATCCAAAAGTCCCCACAAAGGATGAGGATGCTTACCATTTCATTGGATATATGCCAATTGATGGACGGCTGTATGAACTAGATGGACTCCGCGAGGGACCCATCGATCATGGACCGATTGCTCCGGAACAAGATTGGTTGGATGTCGTACGTCCTATTATTGTGTCTCGCATTAATGTATACACGGAAGGCGAAATACATTTTAACCTAATGGCTCTTGTATCAGATAGAAAAATGATATACGAGAGACAAATACAGGCGCTCATGAGTGAGACCAGGATGCTTGGCATGGAAACAGATGACGTGGACGTTGAAATAAGAAGATTGCGTATGCTAATAGAATACGAAGACGCCAAAATGTTGAGATACAACCAGGAGATGTTGAGGAGACGGCATAATTACTTGCCGTTCATCATCACACTGCTCAAGATATTGGCGGAGGAGAAGAAGTTGTCGCCTCTCTTGGAAAAGGCGAAGGAGCGCGCGCTCAAGAAGGGGCCTAAGAAAGTGAAATCCAGCCCCTCGCGGGTGCTGCCGCCCTCCGAGCACATGCAATATTCTTTAGCAGATTTAGATTCTATATTTAGAGAGCCTCAAGAGCCTCCGAGCCAGTTGGAGCCGCAGGACGTTTTGCAGCAGAGCTTATTAGAACCGCCAGCTGACATGGACATGTTGGCCACCGACGACTTCCTCAAAGACGTCGTCCTGGACACCGGCTTCGAGCACGACCTCATAGACGTTCATGATATATTTGACGAAAATATGATACCAACCGAAGAATTCCCACACGACGACATCTTAGACCCCGATGAACTGCTCATCAGAGACTACATGCGCAATCCCGGAAACGAAGAAGAACGCGATGCGGAATAG

Protein sequence:

>DPOGS203393-PA
MESAGDWCLIESDPGVFTQLIKKFGVKGVQVEEMWTFDDSIFDNLRPVHGLIFLFKYLQHDEPPHPVVKDNRLEKIYFAKQVINNACATQAVVSLLLNCNHPDVILGPELTKLKEFSMSFDPRMRGLTLSNSQTIRSAHNSMSQQALFEFDPKVPTKDEDAYHFIGYMPIDGRLYELDGLREGPIDHGPIAPEQDWLDVVRPIIVSRINVYTEGEIHFNLMALVSDRKMIYERQIQALMSETRMLGMETDDVDVEIRRLRMLIEYEDAKMLRYNQEMLRRRHNYLPFIITLLKILAEEKKLSPLLEKAKERALKKGPKKVKSSPSRVLPPSEHMQYSLADLDSIFREPQEPPSQLEPQDVLQQSLLEPPADMDMLATDDFLKDVVLDTGFEHDLIDVHDIFDENMIPTEEFPHDDILDPDELLIRDYMRNPGNEEERDAE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: