MonarchBase - Protein-coding gene

DPOGS210043
Transcript	DPOGS210043-TA	4023 bp
Protein	DPOGS210043-PA	1340 aa
Genomic position	DPSCF300017 - 1228420-1251304
RNAseq coverage	219x (Rank: top 45%)

Annotation
*Heliconius*	HMEL005907	85.71%
*Bombyx*	BGIBMGA000473-TA	80.70%
*Drosophila*	pcm-PB	52.98%
EBI UniRef50	UniRef50_G6CU56	100.00%	Putative 5-3 exoribonuclease 1 n=4 Tax=Eukaryota RepID=G6CU56_DANPL
NCBI RefSeq	XP_001603129.1	63.67%	PREDICTED: similar to 5-3 exoribonuclease 1 [Nasonia vitripennis]
NCBI nr blastp	gi\|156537119	63.67%	PREDICTED: 5'-3' exoribonuclease 1-like isoform 1 [Nasonia vitripennis]
NCBI nr blastx	gi\|345479163	64.02%	PREDICTED: 5'-3' exoribonuclease 1-like isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0004527	3.9e-101	exonuclease activity
	GO:0005622	3.9e-101	intracellular
	GO:0003676	3.9e-101	nucleic acid binding
KEGG pathway	nvi:100119339	0.0
	K12618 (XRN1, SEP1, KEM1)	maps->	RNA degradation
InterPro domain	[1-228] IPR004859	3.9e-101	Putative 5-3 exonuclease
Orthology group	MCL11199		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210043-TA
ATGGGGGTACCGAAGTTTTTTAGATACACCAGTGAACGGTATCCTTGTCTTAATGAGTTAGTTAAGCAGTATCAGATTCCAGATTTTGACAACATGTACCTGGATATGAATGGAATCATACACAACTGTTCTCATCCTGATGATTCCAATCCACATTTCCGTATCACGGAAGAGAAAATATTCAAAGACATATTCCATTACATCAGCATTTTGTTTCAAATTATTAAGCCCAAGAAGCTATTTTTTATGGCTATCGATGGTGTAGCCCCAAGAGCTAAAATGAATCAGCAGAGGGGAAGGAGGTTCCGATCAGCAAGGGAAGCTGAAAAGTTAGAGGAAACTGCTAAAGAAAAGGGTGAGGCTCTACCGACGGAAAAGAGGTTTGATAGCAACTGTATCACTCCCGGAACAGTGTTCATGGCTCGTCTTCATGAACAGCTCAAATATTTTATCAAAGAGAAGATATCAACGGACCCTCTTTGGTCCAAAGTTAAAGTTATTCTGTCCGGACATGAGACGCCCGGTGAAGGAGAACACAAAATAATGGATTACATTCGCTGGGCTCGCTCGCAGCCCGACTATGATCCCAGCACCAGACACTGCTTGTATGGACTCGATGCAGACCTCATTATGTTAGGAGTTTGCACACACGAACCACACTTTGCCTTGCTGCGAGAAGAGGTTAAATTTGGCAAAACAACTCAAAGGGCAACCAGCCCCGAAGAAACTAATTTCTACTTGCTCCACCTATCACTACTAAGGGAATATTTGGAGCAGGAATTCATATCCATCAAGGATAATCTGCCATTCCCTTACGATATTGAAAATATTATTGACGATTGGGTTCTCATGGGGTTCTTAGTGGGCAATGATTTTATACCAAACTTGCCCAACATGCATATCAGCAATGACGCTCTGCCGCTCCTGTACAAAACATACATGACTGTCCTGCCTACTTTGGACGGCTATATAAATGAATCGGGAGATTTGAATTTAGGGAGGTTTGAAGTATTCATGCAGGAGCTGGCTAAGATTGATAAAGAGAAATTTCAAGACACTTATGCCGACTTGAAATACTTTGAAGCCAAAACTGGCAGACGGCCCAACGCTAACGAGAGGAGAGATTACAAGCCCAACAATGACGACACATTCAATGTCAACTTGGACGATATCAAAGCCAACAAGCCAGATGACGAACTGCAGGCTCTTATTGATGCTACACAGGAAATGTTTATGGATGACATGAAGAGCGATGAAGACTATGAAGAAACTAGTGATGAGGAAGCGAACATGGAGATGGAATTCATTCTACATAAGAAAGACTATTACATGAACAAGTTGGACTATTCAAAGGTTACCGACGAGGTGCTATCAGACCAAGCCGAGTGTTATGTCCGAGCCATCCAGTGGAATCTGTGGTACTACTACCGAGGCTGCCCCTCCTGGTGTTGGTACTACCCTCACCACTACGCTCCATACATCTCGGATATCAAGGACTTCGGGAACATGAATATGGAGTTTGAGCTGGGAGAACCGTTCAAGCCCTTCGAGCAGTTGTTGGCGGTGTTGCCAGGCGCCAGTAAGCACCTCCTGCCGACTCCGTTCCACGACCTGATGACGGACGAGGACTCGCCCATAGTCCACTACTACCCGGTCTCCTTCGAGACCGACCTCAACGGGAAGAAGAACGACTGGGAAGCTGTCGTCCTTCTGCCCTTCATCGACGAGACGAACCTGCTATCGGCCATGTCTCCTTGCTACCAGCGACTCACTGAAGAGGAATTGAAGAGAAATTCTCACGGACCGATGTTAGTTTACAACTGGACAGCTGACAGTTTAGGACCAATAATATCCCCGGAATATTTCCCATCGATAAAAGAAAATCACGCCGTGGAAAAGGCTGTGTGGCGACACGAGCTCGACGTGCCGCTGCATCTGTTGAAGCGGGGGATGCTGCCCGACGCCGACAAGGACGTGCTGTACCCGGGCTTCCCCACCATGCGCCACCTGAAGTACAAGACGAGTATAAAGAAGTGCAAGGTGAAGGTTTTCGACCAGCCGTCGCGCAATGAGAATATGATGCTGCAAATTGTACCCACTGCCACAACTGACCCCGCGCTAGAGGAACTGGCCGCCAAGATACTGGGCCAGGTCGTGTGGGTCGGCTGGCCGCATTTAACACGGGCCAAAATTAATAATATAGGTTTAATTGTTATATGGGTAGGGTATGCAGTGCTTATTTGCGTCTATGGTGTGCACGCCACTGATATCCCGATCCCTGTAGGTCAAGTGCTGAGTTCAGAGTCTATTCGTAGCGGTCGTATAAAGGTGTCCGTCCGCGAATGTACGGAGCCGGTAGTGGCCAGCCAGTGTTTCGTGAGCCCCTACCGCACCACTCACCACGCGGCCGCTTCATGCGGGATATCTAATCAGCTATTGTCCCGTATAACGGGAACAGTCCTCGTCATACCCGGAGAGAGAAACGATCTCCCCACTGAGACGCAGAACAAAATAAACGTCGGACTAAATCTTAAGTTCAATAAGAAGAACCAGGAGGTGTCGGGTTACAGTCGTCGGAGTGCGAACGGCTGGGTGTATTCCCCCCGGTGTGTGGCGCTCGTGCAGGAGTACGCGGCCAAATATCCTGAATTGTTCGACGCCCTCGCCAACGCTCATAGAGACGTGTTCTTTGAAAGCGATTTATGGCCCGGGGATTTGGGCAAGAACAAAGTTCAAGATATAGCGGCCTGGTTGAAGTCCCAGCCTCACAGCAGCGCGCCGAGGCGAGAGTGCGGCTCCGAGGCCTTGGAACCGGAAGAGATGAGGGCTCTCTACAACACGCTGGAGACACAGATACGCGACCTCAAGGACAAGGAGAAGAACGTCACGCTGCACGTCAAATGGAGCCTGCTTTATAAGTGTGAACTCCACGAGGGGAACATCCAGCCGGATGTCAAAGCTGACTACCGGATGTACGACCGCGTGGTGTGCGTGGCCAGCAATATAACTGTGCCTCTGGGGTCAAAGGGCACCATCACCGCCATCTATCAGCCGTCCAACGGAAACACCGTCCGCCTATCTGACAAGTTGAACGCCTCGCCCAGCTACCAGGTCATGTTTGACGAACCCTTCCCTGGCGCCATGAAGGAAGATCTGTTCGAGGAGGCCAGGTTCTATAGGATGCAGCCCGCTCATATATTGAATATATCATACGGGCGGAAATTACGCACCGCGAGCGAGCCCCAGGGCTTCGAGTACAACCAGTCGGCACAACATAACTACACTTGTAACTCACAACCGCCCACCGTACTACGGAGAGATGACGGACACTACTCTGCCTTCGCCAGCTACAGCCCCCCGCGAGAGATCAAGACACCAGTGATTGAACATAAGCCTATCGTTAACAACAACGTTAAAAACGGCCAGACGCCGGACAGCGCCACCAACCTGCTGAGAAGTCTGTTGAGGATCAGCGAGGGAGAGGCGGACGGATCCAGGAGCAATAAGAATGTTCCAGAGACGAACAGCAACTGGCGTTCAAGAAGTGACAAAGCGACCTCGCCGAATAAAACAACTCAAAACAACTGGCGAAGAGAGGCAAATACATACAGTCAGGGAGAGTGGAGCAACACACAGAGACAGAAGCCTATCGGGATGCCATCTATGCCGTACCCGTGTTTCGGCGCCTCGCCCCCTCGCCCGCACCAGCCCCAAAGCTTCCCCAAACACTTACCGGACAACATAAAATCCGTTCCGCAGCCGGCTCAGCAAACAAACAGACAAGTCAACAACGGGGAGAAGTACAGCAATCCATTTGTTCCGCTGCAAGTTCAAACCAGCCGGAGGCGCGTCCAAAACTCAAGTGGTTCATCACAGAGACGTGATCTCGAAGGACTACCGACACCGAAGGTCATTCACCCCACACCAAATAACACCTTGTTTAATGTTCAGCCGCAGCAGAATCGTCCTCAGAGGAAGAAAAAACCAAGAATAGCTGCCAACTTGCCCTTCCAGATGGACTAA

Protein sequence:

>DPOGS210043-PA
MGVPKFFRYTSERYPCLNELVKQYQIPDFDNMYLDMNGIIHNCSHPDDSNPHFRITEEKIFKDIFHYISILFQIIKPKKLFFMAIDGVAPRAKMNQQRGRRFRSAREAEKLEETAKEKGEALPTEKRFDSNCITPGTVFMARLHEQLKYFIKEKISTDPLWSKVKVILSGHETPGEGEHKIMDYIRWARSQPDYDPSTRHCLYGLDADLIMLGVCTHEPHFALLREEVKFGKTTQRATSPEETNFYLLHLSLLREYLEQEFISIKDNLPFPYDIENIIDDWVLMGFLVGNDFIPNLPNMHISNDALPLLYKTYMTVLPTLDGYINESGDLNLGRFEVFMQELAKIDKEKFQDTYADLKYFEAKTGRRPNANERRDYKPNNDDTFNVNLDDIKANKPDDELQALIDATQEMFMDDMKSDEDYEETSDEEANMEMEFILHKKDYYMNKLDYSKVTDEVLSDQAECYVRAIQWNLWYYYRGCPSWCWYYPHHYAPYISDIKDFGNMNMEFELGEPFKPFEQLLAVLPGASKHLLPTPFHDLMTDEDSPIVHYYPVSFETDLNGKKNDWEAVVLLPFIDETNLLSAMSPCYQRLTEEELKRNSHGPMLVYNWTADSLGPIISPEYFPSIKENHAVEKAVWRHELDVPLHLLKRGMLPDADKDVLYPGFPTMRHLKYKTSIKKCKVKVFDQPSRNENMMLQIVPTATTDPALEELAAKILGQVVWVGWPHLTRAKINNIGLIVIWVGYAVLICVYGVHATDIPIPVGQVLSSESIRSGRIKVSVRECTEPVVASQCFVSPYRTTHHAAASCGISNQLLSRITGTVLVIPGERNDLPTETQNKINVGLNLKFNKKNQEVSGYSRRSANGWVYSPRCVALVQEYAAKYPELFDALANAHRDVFFESDLWPGDLGKNKVQDIAAWLKSQPHSSAPRRECGSEALEPEEMRALYNTLETQIRDLKDKEKNVTLHVKWSLLYKCELHEGNIQPDVKADYRMYDRVVCVASNITVPLGSKGTITAIYQPSNGNTVRLSDKLNASPSYQVMFDEPFPGAMKEDLFEEARFYRMQPAHILNISYGRKLRTASEPQGFEYNQSAQHNYTCNSQPPTVLRRDDGHYSAFASYSPPREIKTPVIEHKPIVNNNVKNGQTPDSATNLLRSLLRISEGEADGSRSNKNVPETNSNWRSRSDKATSPNKTTQNNWRREANTYSQGEWSNTQRQKPIGMPSMPYPCFGASPPRPHQPQSFPKHLPDNIKSVPQPAQQTNRQVNNGEKYSNPFVPLQVQTSRRRVQNSSGSSQRRDLEGLPTPKVIHPTPNNTLFNVQPQQNRPQRKKKPRIAANLPFQMD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: