MonarchBase - Protein-coding gene

DPOGS213475
Transcript	DPOGS213475-TA	2736 bp
Protein	DPOGS213475-PA	911 aa
Genomic position	DPSCF300100 - 55006-68573
RNAseq coverage	842x (Rank: top 15%)

Annotation
*Heliconius*	HMEL016858	0.0	72.25%
*Bombyx*	BGIBMGA004500-TA	0.0	63.48%
*Drosophila*	CG8494-PA	7e-175	44.73%
EBI UniRef50	UniRef50_F4WH96	0.0	47.03%	Ubiquitin carboxyl-terminal hydrolase n=3 Tax=Formicidae RepID=F4WH96_ACREC
NCBI RefSeq	XP_001122214.1	0.0	48.89%	PREDICTED: similar to CG8494-PA [Apis mellifera]
NCBI nr blastp	gi\|380015099	0.0	47.62%	PREDICTED: ubiquitin carboxyl-terminal hydrolase 20-like [Apis florea]
NCBI nr blastx	gi\|322800359	0.0	46.59%	hypothetical protein SINV_03789 [Solenopsis invicta]

Group
Gene Ontology	GO:0006511	3.8e-64	ubiquitin-dependent protein catabolic process
	GO:0004221	3.8e-64	ubiquitin thiolesterase activity
	GO:0008270	2e-11	zinc ion binding
KEGG pathway
InterPro domain	[144-576] IPR001394	3.8e-64	Peptidase C19, ubiquitin carboxyl-terminal hydrolase 2
	[598-681] IPR006615	4.2e-17	Peptidase C19, ubiquitin-specific peptidase, DUSP domain
	[6-97] IPR013083	1.2e-16	Zinc finger, RING/FYVE/PHD-type
	[30-93] IPR001607	2e-11	Zinc finger, UBP-type
Orthology group	MCL11399		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213475-TA
ATGGACAAAGGTGTGACGTGTGAACATTTAAATAAACTTGTGGATTTCCTTGGAAAAGAGCTATGGCAGTCGAAAGAGAGTCTGAACTGTTTCGACTGTGGATGTCCCGGCCCCAATCTCTGGATTTGTTTGCAACCTGATTGTCACCATATAGGCTGTTCTGAAGTTAAAAATGATCACAGCACAATACACCAAAAGAACTTTCCATCTCATTGTGTTCATATGAATGTTACAACTGAGAGGATATGGTGTTACTTGTGTGAGAAAGAGGTTCACATCAGAACAGCCATCGCAAAGGCAAAGATGAAGCCAGACTCCACGACTGTGGAGGAGATGCTGGTGTCACGTACGGGGTCTGTGGGGATCAGCGTCAACTCGGACGAGGACCTCGACCCTGATGACATGGAATACGAGGACCAGAGACCCAGAGGTCTAGTTGGTCTGCAGAACATGGGCAACACCTGCTACATGAATGCGGCGCTGCAGGCCCTCAGCAACACGCAGCCGCTGACGTCATACTTCCTGGAGTGTTCCGCAGCTGTGGCCTTGCTGGTGGGCGACAAGAAACCAGGGATTAGTCGAGCATACCAAAAATTAATTAGAGAAATGTGGAGTAGGAAAACTAGAGGCTATGTTGTACCAAATGGTATTCTGTATGGGATAAGGAATGTACATCCGATGTTCCGTGGGTACCAGCAACATGATACACAGGAATTCCTGCGCTGTTTCATGGACCAGTTACACGAGGAACTCAAAGAACCGGTGTGGGATAGCGTGTCTGATGATAAACTGGCGTCAGAGGTCGAAGGTGACCAAGAGACGAGGAACATTCACACAAGAAGACGGGCAGCTTCATCAGGAGAAGTGATATCGCCATCAGCCGTAGCTTATTCAGCAATTGATGAACAAAGAACTAGTCGACTGGACGTGGGTTCCGAGTCGGAGTTGTCCAGCGAGGCGGAGGAGAGGTACGAGACGTGCTCCAGCGGCGCCAGTGAAGCACCCGACGCTCATGAGAACACTTCCCCGTCCTGGAGTGGTGGTGGAGGTGACGGTGGGGGTGGTGCGAGGTACCGCAGCATCATCTCGGACGTGTTCGATGGGAAGCTGCTGTCGTCAGTACAGTGTCTCATCTGTGATAGGGTGTCGACCCGTGTTGAGACATTCCAGGACCTTTCATTGCCCATTCCATCCCGGGAACACCTCGCCATGTTACATCACACACCGCACACCGATCAGGACTCGTGGCTGTGGTGGTTGTTTTCGTGGTTCCGCTCGTGGCTGTACGGCCCGGCCGTGTCGCTGCAGGACTGCCTGGCGGCTTTCTTCAGCGCGGACGAACTCAAAGGCGACAACATGTATAGTTGTTCGAGATGCAACAAACTCCGTAACGGTGTGAAGATGTCGGGCGTGATCAGGCTCCCGGAGGTGCTGTGTGTACATCTGAAGCGGTTCCGTCACGAGCTCATGTTCAGTGCCAAAGTGGCGGCGAGAGTGTCGTTTCCGATCAACGATTTAAATATGGCCCCTTATTGTCATAAAGAGTGCACGTCATCCGTGTCCCGCTACTCTCTCTGTGCTGTTATATGTCACGCGGGCACGGCGGGCGGTGGTCACTACACGTGCGTCGCCCGCGTCGACGACAGGTGGTACTCGTTCGACGACGCGTCCGTGACGCCGCTCACCACCCACCACCTAGCATCCTGCGAGGCCTACGTACTGTTCTACAGAAAAATAAATCCACAAATGGCAACCCTGAGACAAAAGGCGGCCGAAATATTAGAATCGTCCAACTCGGAACCGAACGACATTAAGTTTTACATCTCCAAGCAGTGGATTAATAAATTCAACACGTGGGCGGAGCCTGGGCCCATAGACAATAGTGACTTCGTGTGCGTCCACGGCGGGGTTCGTCCTGAGCGGGCGCCTCATCTGCCAGCCCTGGCTGCCCGTCTCCCGCAACCACTATGGGACTTCCTCTACCATCAGTTCGGCGGTGGACCGGCGGTGTCTCACGCCCACGAGTGTGGAGTGTGTGCGCGAGCTCAGCATAGACTCAGGGCGAGGAGAGCCAGGGAACTCACAGCCTTCGCTGAACTACACGCCATGTTCCAGGACCAGGAGCGCCCTCTAGCGGTGTTCGCTATCAGTATGGCGTGGTTCAGACAGTGGCAGGCGTTCGTCCGGGACAAGGCGAGACACCCGCCGCCACCCGTCGACAACACGTCCATCGTTGTTAAACAGGAAATCGAGGGGATCGTGTCATATGTACTGAAGCCGGGTTCGGATCACGCGCAGCTCAGCGAGGAGTTGTGGAGGTTCTTCACCGATATATACGGCGGAGGTCCCGAGGTCCGGCTGTCAGCACCGCCGCCGCCGCGGGTCACACGATCCTCCAGGAACTACTCCGAATCGGACAGAGAGGAATACTGCACTAAATCCTCGTCCGAGGTCAACCTGTGGCTGCAGAAGAATCGCTCGCTTCAGAACATCAGCAGGCGGTACAAGGCGGACTCCGACGAGGAGATATACAGGAAGTACAAGCGGCATCCCACCAGCTACGACTCCGACGACGGCATGGAGATCAGCCCGACGCACAGCCACAACACTATCAGGATGGAGAACGGCCTGTCGGAGCACGCCGCCCCCGACGACCTGAACCTAGACAGCATATCACTAAAGAATACACCAAAAACATGTAAAGTTAGAAAGACGAAACGCAGGACGGTCAAGTGA

Protein sequence:

>DPOGS213475-PA
MDKGVTCEHLNKLVDFLGKELWQSKESLNCFDCGCPGPNLWICLQPDCHHIGCSEVKNDHSTIHQKNFPSHCVHMNVTTERIWCYLCEKEVHIRTAIAKAKMKPDSTTVEEMLVSRTGSVGISVNSDEDLDPDDMEYEDQRPRGLVGLQNMGNTCYMNAALQALSNTQPLTSYFLECSAAVALLVGDKKPGISRAYQKLIREMWSRKTRGYVVPNGILYGIRNVHPMFRGYQQHDTQEFLRCFMDQLHEELKEPVWDSVSDDKLASEVEGDQETRNIHTRRRAASSGEVISPSAVAYSAIDEQRTSRLDVGSESELSSEAEERYETCSSGASEAPDAHENTSPSWSGGGGDGGGGARYRSIISDVFDGKLLSSVQCLICDRVSTRVETFQDLSLPIPSREHLAMLHHTPHTDQDSWLWWLFSWFRSWLYGPAVSLQDCLAAFFSADELKGDNMYSCSRCNKLRNGVKMSGVIRLPEVLCVHLKRFRHELMFSAKVAARVSFPINDLNMAPYCHKECTSSVSRYSLCAVICHAGTAGGGHYTCVARVDDRWYSFDDASVTPLTTHHLASCEAYVLFYRKINPQMATLRQKAAEILESSNSEPNDIKFYISKQWINKFNTWAEPGPIDNSDFVCVHGGVRPERAPHLPALAARLPQPLWDFLYHQFGGGPAVSHAHECGVCARAQHRLRARRARELTAFAELHAMFQDQERPLAVFAISMAWFRQWQAFVRDKARHPPPPVDNTSIVVKQEIEGIVSYVLKPGSDHAQLSEELWRFFTDIYGGGPEVRLSAPPPPRVTRSSRNYSESDREEYCTKSSSEVNLWLQKNRSLQNISRRYKADSDEEIYRKYKRHPTSYDSDDGMEISPTHSHNTIRMENGLSEHAAPDDLNLDSISLKNTPKTCKVRKTKRRTVK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: