MonarchBase - Protein-coding gene

DPOGS204565
Transcript	DPOGS204565-TA	3114 bp
Protein	DPOGS204565-PA	1037 aa
Genomic position	DPSCF300300 - 235080-240127
RNAseq coverage	955x (Rank: top 13%)

Annotation
*Heliconius*	HMEL008384	96.57%
*Bombyx*	BGIBMGA001540-TA	95.27%
*Drosophila*	Upf1-PA	76.62%
EBI UniRef50	UniRef50_Q9VYS3	76.62%	Regulator of nonsense transcripts 1 homolog n=40 Tax=Eukaryota RepID=RENT1_DROME
NCBI RefSeq	XP_001604124.1	76.19%	PREDICTED: similar to nonsense-mediated mrna decay protein 1 (rent1) [Nasonia vitripennis]
NCBI nr blastp	gi\|345491348	75.93%	PREDICTED: regulator of nonsense transcripts 1-like isoform 3 [Nasonia vitripennis]
NCBI nr blastx	gi\|345491348	75.84%	PREDICTED: regulator of nonsense transcripts 1-like isoform 3 [Nasonia vitripennis]

Group
Gene Ontology	GO:0003677	1.5e-73	DNA binding
	GO:0005524	1.5e-73	ATP binding
	GO:0008270	1.5e-73	zinc ion binding
	GO:0000184	1.5e-73	nuclear-transcribed mRNA catabolic process, nonsense-mediated decay
	GO:0004386	1.5e-73	helicase activity
	GO:0005737	1.5e-73	cytoplasm
	GO:0016787	4.5e-06	hydrolase activity
KEGG pathway
InterPro domain	[101-252] IPR018999	1.5e-73	RNA helicase UPF1, UPF2-interacting domain
	[464-529] IPR006935	4.5e-06	UvrABC complex, subunit B
Orthology group	MCL14304		Single-copy universal gene

Nucleotide sequence:

>DPOGS204565-TA
ATGAGTGTCGACGCGTATGGCCCAAGTTCTCAAACACTCACATTCTTAGAAACCGAAGAAGCAGATCTAATCGGTGCTGACACACAAGGATCTGAGTTTGAATTTACAGACTTTACATTACCATCTCAGAGCCAAACACAAGCATCACAACACGATCATGGAATAACTTCATCCAACCAAATTAATGGACTCGGTCGTGGAGACCTTCATTCGAAAGTATCAAGTGTAGCTAATGCAATTGCGGAACTACAATTCGAAGAGGAGGATGAAGCCTTGTATAGTAGCAAGGAACTGCCAGAACATGCTTGCAAGTATTGTGGCATTCACGATCCCGCCACAGTTGTTATGTGTAACATCTGCAACAAGTGGTTTTGCAATGGGCGCGGAAACACTTCTGGATCTCATATCATTAATCATCTAGTGAGAGCTAAACATAAAGAAGCAGCACTTCATAGAGATGGCCCATTGGGAGAAACATTATTGGAATGCTACTCATGTGGGGCTCGTAATGTTTTTGTTCTCGGTTTTATACCAGCAAAAGCCGACTCAGTTGTTGTCCTTCTGTGCCGACAGCCATGTGCCGCCCAAAGCTCTCTTAAGGATATGAACTGGGATCAAGAGCAATGGAAGCCACTAATTTCTGACCGTGCATTTCTGTCTTGGCTTGTAAAAGTGCCTTCTGAAGCTGAACAAATGAGGGCAAGACAAGTGACTCCTCAACAAATTGGACGTCTTGAAGAACTATGGCGTGATAATGTCGATGCTACTTTCCAAGATTTAGAAAAACCGGGTGTAGACGAGGAGCCCCATCAAGTACTCCTGAGATATGAGGATGGATATCAATATCAGAATATATTTGGTCCTCTCGTTAAACTAGAAGCTGATTACGACAAGAGGCTCAAAGAGTCACAAACCCAGGAAGGCATAGAGGTGCGTTGGGATGTGGGTCTCAATAAGAAAACTATTGCATATTTCACCCTGGCCAAAACAGATAGTGACATGAAACTTATGCATGGAGACGAACTGAGATTGAGATATGTTGGTGAGCTACATAAAGCATGGTCTGGTGTTGGCCATGTCATTAAAGTTCCTGATAATTATGGTGACGACGTCGGTTTAGAACTGAAGAGTGGGGCCGGAGCACCCCTTGAATGTACTTCCAACTTTGTTGTTGATTTTATATGGAAGAGTACATCATTTGACAGAATGCAACTAGCTCTACGTAAATTTGCAGTAGACGATTCCTCAGTCTCTGGGTACATCTATCGTCGTCTGCTAGGTCATGAGGTAGAAGAGGTATTGTTCCGCGTACACCTGCCGAAACACTTCAGCGCACCGAACTTACCCGATCTTAACAGATCTCAGGTGTATGCAGTCAAGCACGCACTCCAACGTCCATTGTCTCTGATCCAAGGTCCTCCGGGTACTGGGAAAACCGTTACATCTGCGACCATTGTATACCAGCTCGTACGCCAAAACGGTGGTCCTGTACTCGTATGCGCTCCGTCCAACACTGCCGTAGACCAACTGACTGAGAAAATACATCGAACCGGTCTGAAAGTCGTTCGTCTCTGTGCTAAATCCAGGGAGGCTATGGAATCTTCAGTTTCCTTCTTGGCCTTACACGAACAGGCACGGGCCTTGGGCTCCGCTGATAGTGAACTTCGCAAGTTAACTAGGCTGAAGGAGGAGGCTGGTGAATTGTCTGCGGCTGATGAGAGGAGGTACCGTGCGCTCCGTAGAGCGGCCGAGAGAAGATTGCTTGACGCGGCCGATGTCGTATGTACTACCTGCGTCGGTGCTGGCGATCCCAGGGTTGCACGGATGAGGTTCCAGTCCATCCTCATCGATGAAGGCATGCAGTCTACGGAACCTGAGTGTATGGTGCCCGTAGTGCTTGGAGCGAGGCAATTAATCCTCGTCGGTGACCATTGTCAGTTAGGTCCAGTGGTTATGTGCAAAAAAGCCGCCAAAGCCGGTCTCAGTCAGAGTCTTTTTGAACGGCTCGTAGTTCTAGGCATTCGCCCCTTCCGCTTAGAAGTGCAATATCGTATGCACCCAGAGCTCTCCCGCTTTCCGTCAGACTTCTTTTACGAAGGATCACTTCAGAATGGAGTAAGTGCGGAGGAGAGACGATTGCACAAAATCGATTTCCCATGGCCAAGACCCGATAGGCCTATGTTCTTTTACGTTACTCAGGGTCAAGAGGAAATAGCTGGATCGGGAACATCGTACCTAAATCGAACGGAAGCCGCTAATGTTGAAAAGTTGACGACTCGCTTCTTGAAAGCTGGTGTTCGTCCAGAACAAATCGGGATCATCACTCCGTACGAGGGTCAAAGGTCATACCTCGTTCAGCATATGCAGTATCAAGGCAGTCTGCACGCTAAGCTATATCAAGAGATCGAAGTCGCCAGTGTGGACGCTTTCCAGGGCCGGGAAAAAGATATCATAATAATGTCCTGCGTCCGGTCCAACGAACATCAAGGAATCGGGTTTTTGAGCGATCCGCGTCGCTTGAACGTGGCATTAACACGCGCCAAGTACGGCTTAATTGTGGTCGGGAATCCGAAAGTTCTCAGCAAACAGCCGCTGTGGAACCACCTGCTAGCCTTCTACAAGGAGCGACGTGTGCTAACAGAGGGACCTTTGTCTAATCTGAAAGAGTCGGCGATACAGTTCGCAAAGCCGAAGAAGTTGGTGAACGCTCAGAATCCTGGCTCGCATTTCATGTCGACGTCGATGTTCGACGCTCGCGAGGCGATGGTCCCGGGATCCGTGTACGATCGTGCCCGTCCTCCACGCGACCCGCTCGCCTACGTCGGCCACGAGCACGCGGCGTCGCTTCACGCTCCCGTCCCGCCGGCAGCTTTCGCCGCTCACCGTCCGCAGCAACGCGCCCCGCCAGACGCGACGCGTTCCCGCCGTCGGCCGCCGCGTCTCTCACAGGAGCCGTTGTCTCAACAGCCGCCGCTGTCACTGTCACAGGGAGCGTCGCAGCCGGACTTCAGCCAGGAATCGTCCGCCCCGGACTGCCCGTCGCAGCCGGACGGGTTGCTGTCCCAGGACTCCACGTACCAGGGAGGGTTCCGCGCGCGCTGTGCCCAGTACTGA

Protein sequence:

>DPOGS204565-PA
MSVDAYGPSSQTLTFLETEEADLIGADTQGSEFEFTDFTLPSQSQTQASQHDHGITSSNQINGLGRGDLHSKVSSVANAIAELQFEEEDEALYSSKELPEHACKYCGIHDPATVVMCNICNKWFCNGRGNTSGSHIINHLVRAKHKEAALHRDGPLGETLLECYSCGARNVFVLGFIPAKADSVVVLLCRQPCAAQSSLKDMNWDQEQWKPLISDRAFLSWLVKVPSEAEQMRARQVTPQQIGRLEELWRDNVDATFQDLEKPGVDEEPHQVLLRYEDGYQYQNIFGPLVKLEADYDKRLKESQTQEGIEVRWDVGLNKKTIAYFTLAKTDSDMKLMHGDELRLRYVGELHKAWSGVGHVIKVPDNYGDDVGLELKSGAGAPLECTSNFVVDFIWKSTSFDRMQLALRKFAVDDSSVSGYIYRRLLGHEVEEVLFRVHLPKHFSAPNLPDLNRSQVYAVKHALQRPLSLIQGPPGTGKTVTSATIVYQLVRQNGGPVLVCAPSNTAVDQLTEKIHRTGLKVVRLCAKSREAMESSVSFLALHEQARALGSADSELRKLTRLKEEAGELSAADERRYRALRRAAERRLLDAADVVCTTCVGAGDPRVARMRFQSILIDEGMQSTEPECMVPVVLGARQLILVGDHCQLGPVVMCKKAAKAGLSQSLFERLVVLGIRPFRLEVQYRMHPELSRFPSDFFYEGSLQNGVSAEERRLHKIDFPWPRPDRPMFFYVTQGQEEIAGSGTSYLNRTEAANVEKLTTRFLKAGVRPEQIGIITPYEGQRSYLVQHMQYQGSLHAKLYQEIEVASVDAFQGREKDIIIMSCVRSNEHQGIGFLSDPRRLNVALTRAKYGLIVVGNPKVLSKQPLWNHLLAFYKERRVLTEGPLSNLKESAIQFAKPKKLVNAQNPGSHFMSTSMFDAREAMVPGSVYDRARPPRDPLAYVGHEHAASLHAPVPPAAFAAHRPQQRAPPDATRSRRRPPRLSQEPLSQQPPLSLSQGASQPDFSQESSAPDCPSQPDGLLSQDSTYQGGFRARCAQY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: