MonarchBase - Protein-coding gene

DPOGS213208
Transcript	DPOGS213208-TA	3528 bp
Protein	DPOGS213208-PA	1175 aa
Genomic position	DPSCF300114 + 226694-230308
RNAseq coverage	166x (Rank: top 51%)

Annotation
*Heliconius*	HMEL010302	0.0	64.36%
*Bombyx*	BGIBMGA007401-TA	3e-95	67.73%
*Drosophila*	CG12499-PA	1e-30	22.96%
EBI UniRef50	UniRef50_E2BQV3	2e-65	27.42%	Nucleolar pre-ribosomal-associated protein 1 n=3 Tax=Formicidae RepID=E2BQV3_HARSA
NCBI RefSeq	XP_971852.2	9e-60	29.21%	PREDICTED: similar to GA11665-PA [Tribolium castaneum]
NCBI nr blastp	gi\|383858916	1e-71	24.21%	PREDICTED: LOW QUALITY PROTEIN: nucleolar pre-ribosomal-associated protein 1-like [Megachile rotundata]
NCBI nr blastx	gi\|383858916	2e-87	23.44%	PREDICTED: LOW QUALITY PROTEIN: nucleolar pre-ribosomal-associated protein 1-like [Megachile rotundata]

Group
KEGG pathway
InterPro domain	[109-398] IPR021714	3.1e-34	Ribosome 60S biogenesis N-terminal
Orthology group	MCL13720		Patchy

Nucleotide sequence:

>DPOGS213208-TA
ATGGGCAAAAGAAAATACGAAGATAATTCAACTAGCGACAATAAGAAAACAAAGACCGAAAATAATTCAGAAAATATAAATGACACTGAAAATGATGTTGAGCAACCTCAAAAAGAACAAAATGTTAAGAGCCAGAATAGAAATATTAGTAAAAATGCATTATTTGATATTAAGCATTTCCGTAAAGAGTTAACAGCAAAGCAGGGCCAGACCATGGCATTAACTCAGTTCCTGCAAGTCTGCCTCAATCCAGACAGTGATGCAGACTATATGCTCGAATATTTAAAAGTCGGTGGTAACTCCCATGAGCTTCTCCGACAGATATCTCAAGACAACAAGAAAAACCTGTCACTAGCGACACCTGTATTTCATCTGTTCCACCTGAACATACTTAAGGTCCAGTCCTCTCTTCCCCACATGACATCCATCACAGAGGAAGCTTGCAGATACTTCTTAAATACATTTACACCAACAGTGGAAATTATGATCAGTGAAAGTTCAGGTCCACGGCATAGAAAAATTATCCTCAATCTTTTGACTTCCATGGTGACGTTGAGCTCCGACTTAGGTGTCGAAATATTAAACCAAATACCACTGACTCCAAAGAATTTACAATATATTCTAGAAAAGCCAAATTATAAAGAGAAGGATAATGTCAGAACATGTTTTGTGCGTTTCATGACATCTTTTCTTGTCGAAGGTCATCTGCCATTGATAAAAGCTTTATTGGAAAAACCAGGATTGCTATCTCTGGTGATCCCCGGACTAGTTCAAGACGAAGCAGATGCCGTCTTAATGTTTTTGAACATCCTGAAGAACAATGTGATTGATAATACTTTAATATCAAAAACTTTAAAATTGAAAACATTCAGTCACCAAGTGTTGATCAATATGTTTAAAGTCTACATGTGGAAGGGACCTCCCGATTCAGATTCAGACAAAAGTGACATTAAAGAAGAAATAATGAGGCTGTTGTCTGACATTATACTTACATTATTTACGTCTCACAAACTTGGACTTTATTTTATGGACCCTCAAAACTTGTACAAAGCTCTGCAGCTGTTAAAACGGCCTTGGGAGAATGATGACCAGAGCCAAGTGGTCCTGGAAATTATTTACCGATGTCCGGATCTACACAGAGCTATGGTAAATGTAATCGAACAAAGTTTCCAACCCCAACATTCGCCCATGTGGGGAAAGGCAGTGAATTTTGTTATATCTCTTCTTGATAAATTAAACCCTGATAAAATGGCGACTCGCTTACATAACCTGAGTCCCATCCAAACAGCAAACTTCATAAGATTCATCACCCTGCCCGTGCCATTACTTAAATTAATGAATGCTGCAATCGGAACAGATCTCACCATATCCACACATTGTATTAAAGTCATAGTGAAAATGTTACAATCACTCAGGAGATTTATGCACATACTGGAATTAGAAGATTCAAATGAAAGAATATCAGAACTGAAGAATAAGTTGGAGAATTTTCTTCCTAAACATATGCCATCGTCTAACATTATTGTGTCACTCATAAAGAAAGTATTAGAGGGTTCTGCAACTCCTGATAACGCTGATGCTCAGGATTACAGGCTGCCGAAGCCGGAGGCGGCAGATGCTCTATTAACATTCATTGACACCCTGCTATTGTACAACCACATTTACCCAGCCTCCTTTGAGTCTCTGGAAGGTAATATTGATATGAAGCGTCTGCTAGACTTTTCCATGACACTAACTGAAGGCAATATATCTTTGTTAAAGTTCAAGGTCGTTTCTCTTTGGCTAATATTAGACGGCTCAGCTCTGACCATTAAAAACACAATGTTCAAACAACTGTTCCTGATTATGTTGGATGTGTTCACGAGCGACGAAAACGAAACGTGGTTGGAAGCTAAAGAAACACTGTATATATTTTTTAAGAATACAGAAGTTTTTGAGGCCGATGAAGATGAAATAAATCTCATGTTGTATACTCTACGGAACTCGAAAGTAAATCCGATATCATTGATAGCGGACATCATTGAACACGTTCTGGCCAATGGCCAGGAATTGTCTGAATACGTCAGGAATCAAGTCGTCAACTTCGAGATAACAGACGAATGTAGCGAGGGCAATCTGGATAAACTGTTCAAAGACTTGATGGGCGGGAAGCAGCCCACGGAGAGTGTTTTTCTGGAAAACAAAATACCTTCGCCTTTCATCGTAGGCTGTATGCAGTTTATCCAAAGCAACAGAGACGCTAAAAAGAATTTAAAACAATTTCTCTGTTTGTACGTCGCCAATTTGCTTCATTGTAATAATTCTCCGGAACTCACCGAGGTCTTGATCGGTGACTCGAAGTTAGATATAAGGAGTTACGTTGCCGACTGGACAGTACGACCCGTAGTTATACCCGATAGCACCAGCAAGGATGATACGTTGAAGAAATTATCATACTCTATAATTGAAGCTACTGAAATACCGATAAATGCTATCTTTCCATTCTTATTGGAGACGGACGACGAACACGACTTGAAAGTCCTGGATGTTCCGTATAGAATAGATACAAGGAAAGCTATCAATGGCTCGGATTTGTTTGTCTGGGCGAAATACTTGATGTTCTGTATTATACGACTCTCTAATATGAAAGAGCTTTATGAAGAACAACAGAAGAAAATCGACGGCTACTTCCAAGTGATTATAATGACAGGCAAAAAGCATCTGACGTTGAACATGTGCAGGAATATAATCCTGAATTTGTTTAAGAACGCCCACTCCCTTAAAGTATTCCAGCCTGTCGATTTCCACAAAAATCCATCGAACACTCTGGCTACGAAGTTCATGTTACAAATTCTGGAATCTAATAAAGATGTCATTAATTATCTCAATCAAAAACATAACATCCTAAAGTCGTATCAACAAAAGACATTCAACGAACTAGTGAAGGCATTTGTTAAAGTGAACAAAAGAAAAACTATTGACAGCGAAGTGACTGTGAGAGTGTTGGAGACGATAGGATTGTCTAAGGAAAACGATTTACATCTATTCGATAATATATTTTCAGCGAATACTTTCGCTTGCTTCGGAGAAGACAAAGAACCAACTTTGGTTTTGCAACTGTTAAACATTTTGATAACGAAGTATTCGAAATCCATAGCACAAGAACTACCTCCGGATACGGTAACCAATTGCTTCGTAATGTACACGAAACTCCTGAACCTTAAAGATGTGACTCCTAATTTGACAGATCTCGAGGAGTCGCTCATACAGTTGTTTGAACATAAACCCCACTATACTGCGCACGTCACTCAGGAGGAATTTAGAATTTTTTTCAATGCCAATGCTATCAGAAAGTCAACCTCGACTCTAGCTGCACTGATACTTAAACATCAAATTAAGATGTGCGATGTTTTCGTTGAAGAATTAAACAGACCAGAAGTACTCAGTCAAAGGGAGATCACGTTACCTTTAGGTAACGCTATGATTGATCACGAGCAGTTTCTCTTACAGAACAAAAACGTTCTGGCCAAAATATTCGAAGAGTACTAA

Protein sequence:

>DPOGS213208-PA
MGKRKYEDNSTSDNKKTKTENNSENINDTENDVEQPQKEQNVKSQNRNISKNALFDIKHFRKELTAKQGQTMALTQFLQVCLNPDSDADYMLEYLKVGGNSHELLRQISQDNKKNLSLATPVFHLFHLNILKVQSSLPHMTSITEEACRYFLNTFTPTVEIMISESSGPRHRKIILNLLTSMVTLSSDLGVEILNQIPLTPKNLQYILEKPNYKEKDNVRTCFVRFMTSFLVEGHLPLIKALLEKPGLLSLVIPGLVQDEADAVLMFLNILKNNVIDNTLISKTLKLKTFSHQVLINMFKVYMWKGPPDSDSDKSDIKEEIMRLLSDIILTLFTSHKLGLYFMDPQNLYKALQLLKRPWENDDQSQVVLEIIYRCPDLHRAMVNVIEQSFQPQHSPMWGKAVNFVISLLDKLNPDKMATRLHNLSPIQTANFIRFITLPVPLLKLMNAAIGTDLTISTHCIKVIVKMLQSLRRFMHILELEDSNERISELKNKLENFLPKHMPSSNIIVSLIKKVLEGSATPDNADAQDYRLPKPEAADALLTFIDTLLLYNHIYPASFESLEGNIDMKRLLDFSMTLTEGNISLLKFKVVSLWLILDGSALTIKNTMFKQLFLIMLDVFTSDENETWLEAKETLYIFFKNTEVFEADEDEINLMLYTLRNSKVNPISLIADIIEHVLANGQELSEYVRNQVVNFEITDECSEGNLDKLFKDLMGGKQPTESVFLENKIPSPFIVGCMQFIQSNRDAKKNLKQFLCLYVANLLHCNNSPELTEVLIGDSKLDIRSYVADWTVRPVVIPDSTSKDDTLKKLSYSIIEATEIPINAIFPFLLETDDEHDLKVLDVPYRIDTRKAINGSDLFVWAKYLMFCIIRLSNMKELYEEQQKKIDGYFQVIIMTGKKHLTLNMCRNIILNLFKNAHSLKVFQPVDFHKNPSNTLATKFMLQILESNKDVINYLNQKHNILKSYQQKTFNELVKAFVKVNKRKTIDSEVTVRVLETIGLSKENDLHLFDNIFSANTFACFGEDKEPTLVLQLLNILITKYSKSIAQELPPDTVTNCFVMYTKLLNLKDVTPNLTDLEESLIQLFEHKPHYTAHVTQEEFRIFFNANAIRKSTSTLAALILKHQIKMCDVFVEELNRPEVLSQREITLPLGNAMIDHEQFLLQNKNVLAKIFEEY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: