MonarchBase - Protein-coding gene

DPOGS203238
Transcript	DPOGS203238-TA	1464 bp
Protein	DPOGS203238-PA	487 aa
Genomic position	DPSCF300210 - 111323-117607
RNAseq coverage	105x (Rank: top 60%)

Annotation
*Heliconius*	HMEL005827	3e-154	98.46%
*Bombyx*	BGIBMGA007073-TA	0.0	90.69%
*Drosophila*	not-PB	1e-171	56.78%
EBI UniRef50	UniRef50_B0W7A5	2e-178	57.51%	Ubiquitin carboxyl-terminal hydrolase n=3 Tax=Culicidae RepID=B0W7A5_CULQU
NCBI RefSeq	XP_395389.2	0.0	65.60%	PREDICTED: similar to Ubiquitin carboxyl-terminal hydrolase 22 (Ubiquitin thioesterase 22) (Ubiquitin-specific-processing protease 22) (Deubiquitinating enzyme 22) [Apis mellifera]
NCBI nr blastp	gi\|307207001	0.0	65.93%	Ubiquitin carboxyl-terminal hydrolase 22 [Harpegnathos saltator]
NCBI nr blastx	gi\|156549078	0.0	64.71%	PREDICTED: ubiquitin carboxyl-terminal hydrolase 22-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0006511	3.5e-60	ubiquitin-dependent protein catabolic process
	GO:0004221	3.5e-60	ubiquitin thiolesterase activity
	GO:0008270	4.2e-13	zinc ion binding
KEGG pathway
InterPro domain	[156-474] IPR001394	3.5e-60	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
	[46-105] IPR001607	4.2e-13	Zinc finger, UBP-type
	[33-116] IPR013083	2.9e-12	Zinc finger, RING/FYVE/PHD-type
Orthology group	MCL11014		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203238-TA
ATGAATGACACTGGATGTATACATTTGAACAATTTTAAAGCAGCAAAGGGCACAAATCCCTACAAAATAGTACATGCATTTTTTGTGTCATGCACTTCCTACGAAGCTAGAAGATATAAGGCTACATCATGTCTATGCTTTACTTGTGGAAAGGCAGGTCCCAGAATGCATTCATGCCTGCATTGTATTTTTTTTGCTTGTTACAATGGACACATTCAGGATCATTCCAAGTCTAAAAAACACTTCCTATATGTTGATCTCAGTTATGGTAATGTGTTTTGTGCTCAGTGCCAAGATTACATTTATGACAGAGAATTGACTGAGCTATCAAGGAATTACAGGTTAAAAGAAGCTAAAGCTTTAGGAATCAGTGTGCCATACACACCATGGCTGCCTAACAATAATGAGGTAATGGCTCTGAGAAGATTGCGTAAGAGACGTCTCATAAGTCCTCACACCACCATCGGCCTTCGTGGATTACAGAACCTTGGATCAACATGCTTCATGAATTGCATTGTTCAGACTTTAATCCATACACCTCTGTTACGAGATTATTTCCTGGGCGAGAAGCACAAATGCAAAACCCAGGGCTCCGGTAAATGTCTCGTTTGCGAGGTTTCGAAGCTTTTCCAGGAGTTCTACTCCGGCGCGAAGACCCCTCTGACGTTACACCGTTTACTTCATCTTATCTGGACCCACGCGCGTCACCTCGCCGGCTACGAACAGCAAGACGCTCACGAGTTCTTCATAGCGACGCTTGACGTCTTACATAGACATTGCATGAACGGCGTCGAGGACACTGAGAAGAAGGAGAACGGTCGCTGTAACTGCATCATAGATCAGATATTCACTGGCGGGTTGCAGAGCGACGTCGTGTGTACCTCGTGCTCAGGGGTCTCGACCACCATCGACCCCTTCTGGGACATAAGTCTAGACGTGGCCGGCCCCGGCTCGCTGCAAGCCTGCCTCGAGCGCTTCACCAGAGCCGAACACCTCGGCTCGGCTGCCAAGATAAAATGCTCCAACTGCCGGGCGTACCGCGAATCGACCAAACAGCTGACGCTGGAGACACTGCCGATAGTAGCCAGCTTCCACCTCAAGAGATTCGAACATTCCTCACAGATAGACAGGAAGATATCCGCCTTTGTGTCCTTCCCGGCTGAACTAGATATGACGCCGTTCATGTCCACTCACAGGAGAGCTGTGGAGGCGGCCGATAATAACAACGCCCCCGAGGGCGTGTTTGAGGATAATCGTTACTCGTTGTTCGCGGTCGTCAACCACCTGGGGTCACTGGACGCTGGTCACTACACCGCCTACGTGAGACAGATGAAGGGCAGCTGGTTCAAGTGTGACGATCACATGATAACACGCGCCTCCTTGAGGGAAGTTCTCGATAGTGAAGGGTACCTTCTGTTCTATCACAAGACTGTGTTGGAGTACGAGTGTGAGGTCTCGAGCTAA

Protein sequence:

>DPOGS203238-PA
MNDTGCIHLNNFKAAKGTNPYKIVHAFFVSCTSYEARRYKATSCLCFTCGKAGPRMHSCLHCIFFACYNGHIQDHSKSKKHFLYVDLSYGNVFCAQCQDYIYDRELTELSRNYRLKEAKALGISVPYTPWLPNNNEVMALRRLRKRRLISPHTTIGLRGLQNLGSTCFMNCIVQTLIHTPLLRDYFLGEKHKCKTQGSGKCLVCEVSKLFQEFYSGAKTPLTLHRLLHLIWTHARHLAGYEQQDAHEFFIATLDVLHRHCMNGVEDTEKKENGRCNCIIDQIFTGGLQSDVVCTSCSGVSTTIDPFWDISLDVAGPGSLQACLERFTRAEHLGSAAKIKCSNCRAYRESTKQLTLETLPIVASFHLKRFEHSSQIDRKISAFVSFPAELDMTPFMSTHRRAVEAADNNNAPEGVFEDNRYSLFAVVNHLGSLDAGHYTAYVRQMKGSWFKCDDHMITRASLREVLDSEGYLLFYHKTVLEYECEVSS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: