MonarchBase - Protein-coding gene

DPOGS212864
Transcript	DPOGS212864-TA	2553 bp
Protein	DPOGS212864-PA	850 aa
Genomic position	DPSCF300086 + 388840-395255
RNAseq coverage	1340x (Rank: top 9%)

Annotation
*Heliconius*	HMEL008188	4e-177	65.93%
*Bombyx*	BGIBMGA000808-TA	0.0	95.24%
*Drosophila*	Rat1-PA	0.0	64.61%
EBI UniRef50	UniRef50_Q29JY3	0.0	65.03%	GA10268 n=2 Tax=Arthropoda RepID=Q29JY3_DROPS
NCBI RefSeq	XP_392371.2	0.0	67.53%	PREDICTED: similar to CG10354-PA [Apis mellifera]
NCBI nr blastp	gi\|383854346	0.0	68.48%	PREDICTED: 5'-3' exoribonuclease 2 homolog [Megachile rotundata]
NCBI nr blastx	gi\|383854346	0.0	68.36%	PREDICTED: 5'-3' exoribonuclease 2 homolog [Megachile rotundata]

Group
Gene Ontology	GO:0005634	0	nucleus
	GO:0004534	0	5'-3' exoribonuclease activity
	GO:0006139	0	nucleobase, nucleoside, nucleotide and nucleic acid metabolic process
	GO:0004527	3.1e-112	exonuclease activity
	GO:0005622	3.1e-112	intracellular
	GO:0003676	3.1e-112	nucleic acid binding
KEGG pathway	ame:408840	0.0
	K12619 (XRN2, RAT1)	maps->	RNA degradation
InterPro domain	[1-851] IPR017151	0	5'-3' exoribonuclease 2
	[1-256] IPR004859	3.1e-112	Putative 5-3 exonuclease
Orthology group	MCL12602		Single-copy universal gene

Nucleotide sequence:

>DPOGS212864-TA
ATGGGAGTACCAGCATTCTTTCGATGGCTAAGTCGTAAATACCCTAGCGTTATTGTCGAATGTGTTGAACAGAGGCCAACCGACGTAGATGGCCAGCTCATATATGCAGACTCCTCATTACCAAATCCTAATGGGATCGAATTTGATAACCTATATTTGGATATGAATGGAATCATCCATCCCTGCACACATCCTGAAGATAAGCCGCCTCCCAAGGATGAAGACGAGATGATGGTGGCTATCTTCGAATGTATTGACAGGTTGTTTCGCATCGTAAGGCCGAGAAAACTGTTGTACATGGCTATTGATGGAGTTGCACCTAGAGCTAAAATGAACCAACAAAGGTCTCGGCGTTTTAGAGCGTCTAAAGAGACACAGGAAAAAATAGATGAGATAGCCCGGATCAGAAACGAGCTCCAAGTCAAGGGGGCATACTTACCACCAGAGAGACCCAAAGAGGCACATTTTGACTCCAACTGTATCACTCCAGGAACGCCATTCATGGATCGGTTGAGCAAGTGCCTGCATTACTATATTCATGACAGATTAAACAATGACCCTGGCTGGAAGGGAGTCAAGGTTATACTATCGGATGCAAATGTGCCCGGGGAGGGCGAGCACAAAATAATGGATTACATCAGGAGACAAAGGGCCCAGCCAGATCATGACCCCAACACTCAGCATGTGCTGTGCGGAGCTGATGCGGACCTCATCATGTTAGGTCTGGCGACCCACGAGCCGAACTTCACCATAATCCGTGAGGAGTTCAAACCCAACAAGCCCAGGCCATGTGATGTCTGTGGCCAGCTAGGTCATGAAATGAAGGAGTGTACAGGAACTACACCGGACGCCTCACTGGTGCGATCCGATCCCTCCTTCGGTAACCAGGACAGCTTCATCTTCGTGAGGTTGACGGTACTGCGAGAGTATCTCGAGAAGGAGCTGAGCATGCCGAATCTTCCGTTCAAGTACGACTTCGAGCGCGCCCTGGACGACTGGGTGTTCATGTGCTTCTTCGTGGGGAACGACTTCCTGCCGCACCTGCCCTCGCTGGAGATACGGGAGGGCGCGGTGGACCGGCTCGTCAACTTGTACAAGAAATGCGTCTACAAAACTAGGGGTTGGATCACGGACTCGGGCGACGTGAACCTGGACCGGGTGCAGGTCATCATGGACGAACTGGGGCGCGTCGAGGACGAGATCTTTAGGCGGCGGCATCAGAACGAGCTCAGCTTTAAGGCGAGGGAAAAGAACAAGAAGCAGCAGAAGATCAACTTTGAACTGCTGGAGAAGACGCAGTTCGCACCAGTGAAAGTGGGAGAGGAGTCCAAAACAGTGGAGAACGCTCGCAAGGAGGCGGCCAACATCCGCCTGGCGGGGATGCAGGCTGTGGCGGAGGCGGAAAAGGAGCAGCGCGGCCAGAAGCGGTCGGCGGAGCAGGCGGGGCTGGACGACGACGACGCTCATGATGAAGTGAGGCTCTGGGAGGAAGGCTTCAAAGAGAGATACTACGAGAGCAAGTTCGAGGTGGCCAGGGACAACCTGGAGTTCAGGTACCGCGTGGCGCTGCAGTACGTGCGCGGCCTCTGCTGGGTGCTCCGCTACTACTACCAGGGCTGCGCCAGCTGGAAGTGGTACTTCCCGTATCACTACGCACCGTTCGCCTCCGACTTCGTCAACATCCAGGGCCTGTCCACCAAGTTCGAGAGAGGCACGCAACCGTTCCGTCCCCTGGAGCAGCTGATGGGCGTGTTCCCGGCCGCCAGCTCGCAGCACGTGCCTCGCCCCTGGGCCACGCTCATGTCGGACCCGTTCTCCCCCATCATCGACTTCTACCCCACGGACTTCAAGATAGACCTCAACGGGAAGAAGTTCGCGTGGCAGGGGGTCGCCCTGCTGCCCTTCGTCGACGAGACCAGGCTGTTCAAGGCCCTGGAGCCGTACTACGACGACCTCACACAGGCCGAGAGTCAGTATTGTTGGACTCTACGTGGCGCCGGCCAACAAGAGCTACGAGTTCCTGTCGGCCCTGTACTCGGAGGCCGGGGACGACCAGCACAGGCTCATACACGCGGACCAGAAGTACCCCTTCAGTATCTAGTCGCCGCAGCGGACGGCCCGTGTGCGGTGGACAGGCTTAAGCTAATTATAAAATCCATGGTCCTTAGCCAGCTACCGTCGCCAGTGGTGGGTCTGGAGCCGGTGACGGACAACCGGGTGGTGTGTGTGAGGTACCAGGACCCGCAGTTCCCCGAGGAGTTCGTGTTCCCGGCCAGGAGGCTGCGCGGGGCCGTCGACCCGCCCAGGGTGCTGAAGCCAGGGAACCTCAGCCATCAGGAGAACAGGAACTGGCGTCCACAGATAGGAATGGTCCGCTCGCACACGGTGGCGTCCCTGGAGGTGGCCGGCCACCGCATGCTGGGTCACCAGCTGTCCCGGAACCCGCGCGCCGCCGGGCCGCCGTCGCAACACAGCGGAGGCGGAGGTGACGTCACGCCGCGCGCCGGTCACGTGGCCGGGGACGTGTGTGTAAACAAATTTGACGACTATTAA

Protein sequence:

>DPOGS212864-PA
MGVPAFFRWLSRKYPSVIVECVEQRPTDVDGQLIYADSSLPNPNGIEFDNLYLDMNGIIHPCTHPEDKPPPKDEDEMMVAIFECIDRLFRIVRPRKLLYMAIDGVAPRAKMNQQRSRRFRASKETQEKIDEIARIRNELQVKGAYLPPERPKEAHFDSNCITPGTPFMDRLSKCLHYYIHDRLNNDPGWKGVKVILSDANVPGEGEHKIMDYIRRQRAQPDHDPNTQHVLCGADADLIMLGLATHEPNFTIIREEFKPNKPRPCDVCGQLGHEMKECTGTTPDASLVRSDPSFGNQDSFIFVRLTVLREYLEKELSMPNLPFKYDFERALDDWVFMCFFVGNDFLPHLPSLEIREGAVDRLVNLYKKCVYKTRGWITDSGDVNLDRVQVIMDELGRVEDEIFRRRHQNELSFKAREKNKKQQKINFELLEKTQFAPVKVGEESKTVENARKEAANIRLAGMQAVAEAEKEQRGQKRSAEQAGLDDDDAHDEVRLWEEGFKERYYESKFEVARDNLEFRYRVALQYVRGLCWVLRYYYQGCASWKWYFPYHYAPFASDFVNIQGLSTKFERGTQPFRPLEQLMGVFPAASSQHVPRPWATLMSDPFSPIIDFYPTDFKIDLNGKKFAWQGVALLPFVDETRLFKALEPYYDDLTQAESQYCWTLRGAGQQELRVPVGPVLGGRGRPAQAHTRGPEVPLQYLVAAADGPCAVDRLKLIIKSMVLSQLPSPVVGLEPVTDNRVVCVRYQDPQFPEEFVFPARRLRGAVDPPRVLKPGNLSHQENRNWRPQIGMVRSHTVASLEVAGHRMLGHQLSRNPRAAGPPSQHSGGGGDVTPRAGHVAGDVCVNKFDDY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: