MonarchBase - Protein-coding gene

DPOGS210553
Transcript	DPOGS210553-TA	1392 bp
Protein	DPOGS210553-PA	463 aa
Genomic position	DPSCF300304 + 119938-122530
RNAseq coverage	877x (Rank: top 14%)

Annotation
*Heliconius*	HMEL006425	5e-74	95.49%
*Bombyx*	BGIBMGA013447-TA	3e-86	72.58%
*Drosophila*	rin-PB	2e-64	70.76%
EBI UniRef50	UniRef50_D6W949	2e-98	49.09%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6W949_TRICA
NCBI RefSeq	XP_975463.1	3e-99	49.09%	PREDICTED: similar to rasputin CG9412-PB [Tribolium castaneum]
NCBI nr blastp	gi\|91076984	6e-98	49.09%	PREDICTED: similar to rasputin CG9412-PB [Tribolium castaneum]
NCBI nr blastx	gi\|91076984	4e-107	48.28%	PREDICTED: similar to rasputin CG9412-PB [Tribolium castaneum]

Group
Gene Ontology	GO:0006810	3.7e-32	transport
	GO:0005622	3.7e-32	intracellular
	GO:0000166	3.7e-13	nucleotide binding
	GO:0003676	2.7e-12	nucleic acid binding
KEGG pathway
InterPro domain	[12-132] IPR002075	3.7e-32	Nuclear transport factor 2
	[326-434] IPR012677	3.7e-13	Nucleotide-binding, alpha-beta plait
	[346-408] IPR000504	2.7e-12	RNA recognition motif domain
Orthology group	MCL13089		Single-copy universal gene

Nucleotide sequence:

>DPOGS210553-TA
ATGGAGGCGTCCCCGTCCCCGTCCCCGCAGAGCGTCGGCCGCGAGTTCGTCCGCCAATACTACACTCTGCTCAACAAAGCGCCCGCACACCTGCATAGATTCTACAATAACTACTCGTCGTTCGTGCATGGCGGGCTGGACGCGCCCAACCGCGAGACGCTGCCTGTCGTCGGACAGAAGCAGATCCACAACCGTATCCAGCAGCTCAACTTCCGCGACTGTCACGCCAAGATCAGTCAGGTGGACGCGCAGGCCACGCTGGGCAACGGAGTCGTGGTGCAGGTCACCGGCGAGCTGTCCAACGCCGGCGCCCCCATGAGGCGCTTCACGCAGACCTTCGTGTTGGCGGCGCAGTCGCCCAAGAAGTACTACGTGCACAACGACATCTTCCGCTACCAGGACGTGGTGTTCTCCGACGAAGAAGGCGAAGGCTCCGGCCGCTCGGACGCCGAGGAGGAGGACGCGGCCGCCGGCGGGTACTTCCCGCCCGCTTTTCCGCCCGCGCCCTTCCCCGCGCCGCCGCACGCCCAGCTCGTGTCGCTGCCCGCGTCGCCGCATCTCAACGGACACCCTCACGACGACCCCGCCAGGCACCTCGCGGCCGCGCTGCAGGCTGACCCCTCCGCCATGTGTCCCGCGACACCGGCCGGAACCACCTCGACTCTGCGCCCCGTCTCCTCGGCCGGCACGATCGCACCCGCCGCAGCCGCAGTCCCCGAGCGGGAAGAGGAACCGGCCCCGGAGCCCGAGCGTGAGCCGACGCCTCCGCCCCAGCAGCCGACGCCTCAACCGATGCCTCAACCCGCGGCGGCCGCCCCTCCGGAACCCAAAACGTACGCCAACCTGCTGAAGTCTGGATCGAGTGCTAGTACAACGCGTGGCTCACCCCCTGCGCCCCCCGCACCCGTTCCCGCTCCCTCATCTGCGCCGGCGCCCGCCTCGCACGAGCCCCGCGCACGCCCGCCCAGGAGCGCTCAGCCACAGCAGCAGGCCGGCAACCAGGACGGCGGTCGTCGGTACTCGGACGCCCAGCAACTGTTCCTGGGCAACCTGCCGCACTCCGCCACGGAGGAGAGTCTGCGTGCTATCTTTTCTCGGTTCGGTCCCGTGGCCGAGCTGCGCGTGCACAGCAAGCCCGCCGCGCCCGGAGCGCCGCGCCACCCTAATTACGGCTTCATCACCTACGAGACGGCGCAGGCCGCCGCCGACTGTCTGCTGGCCGCCGCCAACGAGCCGCTGTACTTCCCTGGCGAGGGCGGTGAGGGCGGCGAGGGCGCCGGTGTCAAGCTCAACGTGGAGGAGAAGAAGACCCGCGGACGCGAGCCCCCGCGCCGCCGCCCGCTGTCGTCTCACCGCGCCTCCTTCCAGCCGCGCCAGAACTTCCGCCGCTAA

Protein sequence:

>DPOGS210553-PA
MEASPSPSPQSVGREFVRQYYTLLNKAPAHLHRFYNNYSSFVHGGLDAPNRETLPVVGQKQIHNRIQQLNFRDCHAKISQVDAQATLGNGVVVQVTGELSNAGAPMRRFTQTFVLAAQSPKKYYVHNDIFRYQDVVFSDEEGEGSGRSDAEEEDAAAGGYFPPAFPPAPFPAPPHAQLVSLPASPHLNGHPHDDPARHLAAALQADPSAMCPATPAGTTSTLRPVSSAGTIAPAAAAVPEREEEPAPEPEREPTPPPQQPTPQPMPQPAAAAPPEPKTYANLLKSGSSASTTRGSPPAPPAPVPAPSSAPAPASHEPRARPPRSAQPQQQAGNQDGGRRYSDAQQLFLGNLPHSATEESLRAIFSRFGPVAELRVHSKPAAPGAPRHPNYGFITYETAQAAADCLLAAANEPLYFPGEGGEGGEGAGVKLNVEEKKTRGREPPRRRPLSSHRASFQPRQNFRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: