MonarchBase - Protein-coding gene

DPOGS201905
Transcript	DPOGS201905-TA	1644 bp
Protein	DPOGS201905-PA	547 aa
Genomic position	DPSCF300191 + 602701-607218
RNAseq coverage	1136x (Rank: top 11%)

Annotation
*Heliconius*	HMEL014025	0.0	92.27%
*Bombyx*	BGIBMGA006085-TA	0.0	87.37%
*Drosophila*	nop5-PA	0.0	77.70%
EBI UniRef50	UniRef50_E2B215	5e-176	65.54%	Nucleolar protein 5 n=10 Tax=Eukaryota RepID=E2B215_CAMFO
NCBI RefSeq	XP_395309.3	0.0	77.21%	PREDICTED: similar to nop5 CG10206-PA [Apis mellifera]
NCBI nr blastp	gi\|195471633	0.0	78.02%	GE18393 [Drosophila yakuba]
NCBI nr blastx	gi\|91078900	0.0	70.14%	PREDICTED: similar to nop5 CG10206-PA [Tribolium castaneum]

Group
KEGG pathway	nve:NEMVE_v1g193135	8e-29
	K12844 (PRPF31)	maps->	Spliceosome
InterPro domain	[254-401] IPR002687	1.2e-57	Pre-mRNA processing ribonucleoprotein, snoRNA-binding domain
	[162-214] IPR012976	1.1e-29	NOSIC
	[1-66] IPR012974	3.6e-21	NOP5, N-terminal
Orthology group	MCL13607		Single-copy universal gene

Nucleotide sequence:

>DPOGS201905-TA
ATGTTGGTGCTATTCGAAACGCCGGCGGGATACGCTATATTTAAGTTACTTGATGAGTCAAAATTATCACAAATAGATGATCTGTACCAGGAGTTCAACACGCCTGAAGGGGCTTCATCAGTAGTGAAACTGAAGAATTTTATTAAATTTGAAGACACTACGGAAGCTTTAGCAGCAACTACCGCCGCTATTGAAGGCAAGCTTTCAAAGACATTGAAGAAAGGTTTGAAGAAGCATCTGCTCAAAGATGTTCAGGATCAGCTGTTAGTCGGGGACGCCAAGCTAGGCAGTGCCATCAAAGAGAAGTTTGACTTACAATGTGTATCAAATTCAAATGTACAAGAATTGTTGAGATGTATCCGTTCCCAAATGGACAGTTTGCTGACGGGCCTGCCCAAGAAAGAAATGACAGCTATGGCTTTAGGTCTTGCCCATTCACTGTCCAGATATAAACTGAAATTCTCTCCAGACAAAATTGATACTATGATAGTACAAGCTCAATGTCTATTGGATGATTTGGATAAGGAATTGAACAACTACGTCATGAGATGCCGGGAATGGTACGGCTGGCACTTCCCGGAGCTCGGGAAGATTATAACAGACAATACTTCATTCGTGAAGATCGTTAAGCTCATGGGTACCCGAGATCACGCGGCCACGACTGATATGTCGGACATTCTTCCGGAAGATCTGGAAGAGAAAGTCAAAGAAGCAGCCGAGATATCCATGGGAACGGAGATCTCTGATGACGATATTATTAATATACAGAACTTATGTGATGAGATTGTATCTATCACGGACTATAGAGCACATCTGACGGACTATTTAAAGGCGAGGATGATGGCCATGGCACCGAACCTGACAGTTCTGATCGGGGAGCATATAGGAGCTAGACTAATAGCCCACGCTGGTTCATTAATGAATCTAGCTAAACATCCGGCTTCCACTTTGCAAATATTCGGTGCTGAGAAAGCTTTATTCAGAGCTTTGAAGACTAAGAAGGATACTCCAAAGTACGGTCTCATATACCACGCTCAGCTGATTGGACAATGTAGCACCAAAAACAAGGGCAAAATGTCGAGAATGTTGGCGGCCAAGGCGGCGCTGGCGACACGTGTCGACGCCTTCGGTGATGATGTGACATTCGAGTTGGGAGCGAAACACAAAGTGAATCTTGAGAATAAGCTGCGGTTACTAGAAGAAGGTAACTTGAGGAGAATCAGCGGCACGGGCAAGGCGAAGGCCAAGTTCGAGAAATATCACAGTAAATCTGAAGTGTTCTCGTACCCGACGGCAGCGGACAGCACCTTGAAGGCAGTGAAGAGGGAACACGAGCCGGAAGAAGAAGCCGCTCCGGCCAAGAAGATGAAGCTGGAGAACGATGTCAAAGTAAAGAAAGTGAAATCAGAACCGTCAGATGAAGTGGACGGACAAGAGAACGGTGATTCAGAGCTGACTGAGAAGAAGAAGAAGAAAAAGAAGAAGTCCATGGAACCAGAACTGGCACAGGCTGGAGAACAATCTCCGGTCAGTGAGAAGAAAAAGAAAAAGAGCATGGAACCAGAACTAGCACAGAGCGAAGAAGCACCCGCGAGCGAAAAGAAGAAAAAGAAGAAAAGACAATCTCAGCCCCAAGAAGAATGA

Protein sequence:

>DPOGS201905-PA
MLVLFETPAGYAIFKLLDESKLSQIDDLYQEFNTPEGASSVVKLKNFIKFEDTTEALAATTAAIEGKLSKTLKKGLKKHLLKDVQDQLLVGDAKLGSAIKEKFDLQCVSNSNVQELLRCIRSQMDSLLTGLPKKEMTAMALGLAHSLSRYKLKFSPDKIDTMIVQAQCLLDDLDKELNNYVMRCREWYGWHFPELGKIITDNTSFVKIVKLMGTRDHAATTDMSDILPEDLEEKVKEAAEISMGTEISDDDIINIQNLCDEIVSITDYRAHLTDYLKARMMAMAPNLTVLIGEHIGARLIAHAGSLMNLAKHPASTLQIFGAEKALFRALKTKKDTPKYGLIYHAQLIGQCSTKNKGKMSRMLAAKAALATRVDAFGDDVTFELGAKHKVNLENKLRLLEEGNLRRISGTGKAKAKFEKYHSKSEVFSYPTAADSTLKAVKREHEPEEEAAPAKKMKLENDVKVKKVKSEPSDEVDGQENGDSELTEKKKKKKKKSMEPELAQAGEQSPVSEKKKKKSMEPELAQSEEAPASEKKKKKKRQSQPQEE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: