MonarchBase - Protein-coding gene

DPOGS212497
Transcript	DPOGS212497-TA	3225 bp
Protein	DPOGS212497-PA	1074 aa
Genomic position	DPSCF300222 + 157132-160356
RNAseq coverage	157x (Rank: top 52%)

Annotation
*Heliconius*	HMEL009508	0.0	67.58%
*Bombyx*	BGIBMGA010155-TA	9e-177	74.87%
*Drosophila*	CG12877-PC	3e-102	37.63%
EBI UniRef50	UniRef50_E2ABA9	1e-177	37.18%	RNA exonuclease 1-like protein n=1 Tax=Camponotus floridanus RepID=E2ABA9_CAMFO
NCBI RefSeq	XP_392195.3	1e-172	36.46%	PREDICTED: similar to transcription elongation factor B polypeptide 3 binding protein 1 isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|307181945	5e-177	37.18%	RNA exonuclease 1-like protein [Camponotus floridanus]
NCBI nr blastx	gi\|307181945	0.0	36.95%	RNA exonuclease 1-like protein [Camponotus floridanus]

Group
Gene Ontology	GO:0004527	7.3e-37	exonuclease activity
	GO:0005622	7.3e-37	intracellular
	GO:0003676	8.1e-26	nucleic acid binding
KEGG pathway
InterPro domain	[913-1072] IPR006055	7.3e-37	Exonuclease
	[896-1069] IPR012337	8.1e-26	Ribonuclease H-like
	[916-1063] IPR013520	2e-22	Exonuclease, RNase T/DNA polymerase III
Orthology group	MCL10954		Single-copy universal gene

Nucleotide sequence:

>DPOGS212497-TA
ATGTTACCATCGACGGGATATTTTAAGGGAATAAATTGTCCTTTCTACGATAGTGGTATCTGTGAACGACCCTATTGTCATTTTCGTCATGTTAAAAAAGAAACCAATAATATTTCTGGAGAAGGGATAGAAAGCGGAAATGCACTTTTAAAGCTTGTGTCCGCTGCCGTCCAAAAGGTTCTTCAACAAACGGACTCTGCAGCGGGATCGCCGTCGTCGAATAATACATTCGAAACCGAAAGTGTTCAATGTTTACCAGCTTCGTCGAAAGTTACTTACAATCCCACTCCAATAGCGGAACTCAACAAAATTAATAGTGAACCTGAAATCGGCGAGGAAATCAATGAACAAAAACGAAGACATATTCCAGTGCCATACACGCCGCGAAAACCGGCCAGTCTATGCATTAAGCGGCCTGTTGATACGAATAGTTCAAAACTTACATATGTAGCACCAGTTTTATACACACCAGGTTCTGAAAGCGCTCCAGATCCATACTCACCACAAGGGTCAACGGAATCAAATGAAAAATATTTGCCAGGTGTTGAAATAGCAGTACAAGAATATGCACCAAAAGAAACACAGAACTCAAACTCCAAAGTTAATTATATCCCTTCCGATAAAAATGTAAATAGAAAGAAACTGTTAGAATATAAACCTACCAAAGTTAAAAGCCAACCTTCTTCTGTATCATACCAACCAACACCTAGATCGCTAGTTCCTTGCTTTTCTAGTGATGAAGACGAACCTGATACTAAAAAAAGGAAACTCTCTAGTGATCTTAATGGATTGGATGAATTAGGACCAGAATTTGATATATTAGATCAAATCTTAGATGAAGAAAAATCAGAGAAATGTTCCAATAATCATAAAAATGATTCTTCAATAGAATGTAAGGAGAATAAGAAGAGTCTAGAAGTTAATAGTAGTCATAAGGAAAAAGATGATAAAAGTCATAGTAAAACTGATAAAATTAATAAAGAAAAATCTGATAAAGATAAATCTGAGAAGAAACATGACAAAGTAGATAAGACTAAGAAGAAAGAAAAAAGCGAAAAGTCTGATCAAAATGGGAAAGACTGTAAACGCAGGAGTTCCAGTACTGATAAGAAAAGTTCCCACAAAAGTTCTAATCAAGATAAAAAGAGACATAGTAGCAGTGAAAGTAAGTCAGAAAAAAGATCAAGTTCAAAAAGTTCAAGTAGTAGTTCAAAGCATTCAAGAAATGATTCATTGAGGCATTCTAAACATAGCTCCAGTGACAAAACAGATAGTAAGAAAAGTAAGAGTAATAGTAGCCACCACAAGACACACAAACATTCTAAGGAATCTAAAGACAGGAAAGACAAACATAAAAAGCACAATTCGAAGAGCAATTCGGAAGACGATGACCATAAATTTGAAAACTTCATTGAAGATATTGAGGATGTCTCAGAGCCAGATGAAGAGGATATCGCTTTAGAATGTAAAAGAATATTTGAGGAATATGTTCCATCTGAAAAACCAGAAGCAAAAGATGAACCCAATGAACCTGACATTTCAATGACAGATAATGATGAATATATACCATCAAAGAAAAGGGTATCAAGAACTACTGATAAGAATATCAAAGTCACTCCTAAGGCTCCAATAAGACCAGATTTCAAACTTAATGCAGCTCAAGCCATGGCAGAACGACTTGCTAAAGTGAGAGAATTTCACGCCAAAATTACACCAGACGCAACTCCTCCTGCAAGCAATTCCAAACCAGATTCGAAGCCATTTGTACCACCTGTTACTAATCATTCCAAAATTAGAATAGCTCATGTCCCTTACGCATCAACCATGTTAACTGCAAAAAAGACTATTCCACCTAAACCTAGCTCTGCACCAAACAATAATCCTTCAACAAGCTGCACAGTGACACAAACAGTGAAAAAAGGGACTCAAAGAGTTGCACACTTGCCTAGTGAGAAGTTTATAGATAGACCAGGAGTACTTGAACCTTTGGGATCAAAAATACCAGTTAACATCAGGTCAACCTATTTAAACTTGATGATAGACAATTGCTTGAATATTTATTTACTACCATCTGATGCTTATGCAAGGGCACAAAACGAAGAATTGACAACAAGCAAAAAGTGTTCTTCAGTACCAATTTATAAAAATTCAGCAGTCCTTGCTATTAGTAGATTGAAAAAGGAAGTCATAGAATGCAATGGGGTAAAAAAATCTGGTAATGATAGTTCAGGAGCTAAATTTGTACAGGGTACAGTCACGAATGCAGCTAGTGCTGGCTCCTGGAGTATTGAAAGTAAACATAAAAAGAATTTCGAAGACTCTAAACAATTTGTTGGTGCTAACTTGTATAACAATATTAAGAAATGGATATTAACTGATGAGCAGTTAAAAGAGAATGGTTTTCCTAGACCACATACTAACGGGGAGAAGGGTAGAGCTATTATATATGGTCAAAACAAACAAAAACCTCCTAAAGGTTTTATAAGGACTTGTTGTAGATGTAAAAAAGAATATACGGTAGACAAAAAAGGCTTTCCTGTTATAAAACAAGATTGCATTTATCATCCTAATAACAAGTACAGGTTTCGGGGTGAGGTTAAATATCAGTGTTGCAGCCAAGATGAATCATCTGATGGCTGTTGCATAGCGTCAACTCATGTTTATGAATACGTAGACTTTGAAAATTTAAAAGGTTATGTTAAAACTCTAGCGCCGGACACTTTGATGGACGATTATGGTGTTTATTCCCTAGATTGCGAAATGTGTTACACTACACAAGGCCTGGATTTAACAAGGGTTACAGTTATCAATAGTTCCTGTAAAGTAGTGTATGAGACACTTATTAAACCCCTCCATCCCATCATAGATTATAATACAAGGTATTCTGGTATAACTGAGGAACAAATGGCCGATGTTAAAACTACACTTCTTGATGTGCAAGCAACACTACTTACAATGTTCAATAGTAAAACAATCTTAATAGGACATAGTTTAGAATCTGATTTCAAAGCACTGAAATTGATTCATGATACGGTAATTGATACAAGTGTGCTATTTCCTCATAAAATGGGTCCTCCATATAAAAGAGCATTAAGAAATTTATCATCCGAGCATTTGAAGAAGATTATCCAGAACTCGGTTGATGGTCATGACAGTGCAGAAGACGCTACAGTGTGTATGGAACTCTTGATGTACAAAGTTAAAGAGGATTTAAAAACAAGGTGA

Protein sequence:

>DPOGS212497-PA
MLPSTGYFKGINCPFYDSGICERPYCHFRHVKKETNNISGEGIESGNALLKLVSAAVQKVLQQTDSAAGSPSSNNTFETESVQCLPASSKVTYNPTPIAELNKINSEPEIGEEINEQKRRHIPVPYTPRKPASLCIKRPVDTNSSKLTYVAPVLYTPGSESAPDPYSPQGSTESNEKYLPGVEIAVQEYAPKETQNSNSKVNYIPSDKNVNRKKLLEYKPTKVKSQPSSVSYQPTPRSLVPCFSSDEDEPDTKKRKLSSDLNGLDELGPEFDILDQILDEEKSEKCSNNHKNDSSIECKENKKSLEVNSSHKEKDDKSHSKTDKINKEKSDKDKSEKKHDKVDKTKKKEKSEKSDQNGKDCKRRSSSTDKKSSHKSSNQDKKRHSSSESKSEKRSSSKSSSSSSKHSRNDSLRHSKHSSSDKTDSKKSKSNSSHHKTHKHSKESKDRKDKHKKHNSKSNSEDDDHKFENFIEDIEDVSEPDEEDIALECKRIFEEYVPSEKPEAKDEPNEPDISMTDNDEYIPSKKRVSRTTDKNIKVTPKAPIRPDFKLNAAQAMAERLAKVREFHAKITPDATPPASNSKPDSKPFVPPVTNHSKIRIAHVPYASTMLTAKKTIPPKPSSAPNNNPSTSCTVTQTVKKGTQRVAHLPSEKFIDRPGVLEPLGSKIPVNIRSTYLNLMIDNCLNIYLLPSDAYARAQNEELTTSKKCSSVPIYKNSAVLAISRLKKEVIECNGVKKSGNDSSGAKFVQGTVTNAASAGSWSIESKHKKNFEDSKQFVGANLYNNIKKWILTDEQLKENGFPRPHTNGEKGRAIIYGQNKQKPPKGFIRTCCRCKKEYTVDKKGFPVIKQDCIYHPNNKYRFRGEVKYQCCSQDESSDGCCIASTHVYEYVDFENLKGYVKTLAPDTLMDDYGVYSLDCEMCYTTQGLDLTRVTVINSSCKVVYETLIKPLHPIIDYNTRYSGITEEQMADVKTTLLDVQATLLTMFNSKTILIGHSLESDFKALKLIHDTVIDTSVLFPHKMGPPYKRALRNLSSEHLKKIIQNSVDGHDSAEDATVCMELLMYKVKEDLKTR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: