MonarchBase - Protein-coding gene

DPOGS200156
Transcript	DPOGS200156-TA	1278 bp
Protein	DPOGS200156-PA	425 aa
Genomic position	DPSCF300128 + 18672-41066
RNAseq coverage	47x (Rank: top 71%)

Annotation
*Heliconius*	HMEL014416	2e-82	78.70%
*Bombyx*	BGIBMGA001619-TA	2e-102	84.81%
*Drosophila*	CG34354-PA	1e-92	81.15%
EBI UniRef50	UniRef50_A8JPX0	1e-90	81.15%	CG34354, isoform A n=31 Tax=Neoptera RepID=A8JPX0_DROME
NCBI RefSeq	XP_624017.1	1e-101	92.06%	PREDICTED: similar to CG12870-PA isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|345497985	5e-101	89.23%	PREDICTED: nucleolysin TIA-1 isoform p40-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345497985	8e-99	90.16%	PREDICTED: nucleolysin TIA-1 isoform p40-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0000166	3.7e-26	nucleotide binding
	GO:0003676	1.2e-23	nucleic acid binding
KEGG pathway
InterPro domain	[20-107] IPR012677	3.7e-26	Nucleotide-binding, alpha-beta plait
	[24-97] IPR000504	1.2e-23	RNA recognition motif domain
Orthology group	MCL15783		Insect specific

Nucleotide sequence:

>DPOGS200156-TA
ATGATACTCTCGGAGCATGGTGAGGATGTATGGGATTGTACTGGAGGAGTAAGAGCGAGAGAACACTACCACATCTTCGTCGGTGATCTCAGCCCGGAGATTGAGACGCAGAATCTCAGAGACGCCTTCGCCCCATTCGGCGAAATATCGGATTGTCGCGTCGTTCGTGATCCTCAGACGCTCAAATCTAAGGGATACGGTTTCGTGTCCTTCCTTAAGAAATCCGAAGCGGAGTCAGCTATAACGGCTATGAACGGCCAGTGGTTGGGGTCGAGGTCTATACGAACTAACTGGGCGACAAGGAAACCACCAGCTCCAAAAAACGAACTAAACTCAAAGCCGCTAACCTTCGACGAGGTTTACAACCAGAGCTCCCCGACCAATTGCACGGTCTACTGCGGCGGTCTTACGGCCGGGCTCACCGAGGAGCTCATGCAGAAGACCTTCCAGCCCTTCGGGACCATCCAGGAGATACGCGTCTTCAAGGATAAGGGATACGCTTTTATCAGATTCTCAACCAAAGAGAGCGCGACCCATGCTATAGTTGCTGTGCACAATGCTGATGTTAACGGCGCTCCTGTGAAGTGTTCCTGGGGCAAGGAATCCGGTGACCCGAATAACGCACAAGGAGCACAGCCGCTAACCTTCGACGAGGTTTACAACCAGAGCTCCCCGACCAATTGCACGGTCTACTGCGGCGGTCTTACGGCCGGGCTCACCGAGGAGCTCATGCAGAAGACCTTCCAGCCCTTCGGGACCATCCAGGAGATACGCGTCTTCAAGGATAAGGGATACGCTTTTATCAGATTCTCAACCAAAGAGAGCGCGACCCATGCTATAGTTGCTGTGCACAATGCTGATGTTAACGGCGCTCCTGTGAAGTGTTCCTGGGGCAAGGAATCCGGTGACCCGAATAACGCACAAGGAGCACAGTTGGGTGGCACTGCCTATAGTCCTTTCGGCGCCTATCCAGGAGGTGTTCCACCTTCATATTGGTATAACACATACCCGCAGCAACTGGGAGGTTTCCTGCAAGGAGTCCAGGGAGTGCAAGGATACTCCTATGCCGGACAATTCGCGGGCTATCAGCAACAATACATGGGCATGGGCGGCGTACAATTGCCATGGGCGCTGGGCGGAGGCGTGGGCGGTGTCGGTGGCGTCGGTGGTGTTGCTGCAATGTCTCAGCCGCCTCAAGTGCTGCACTATCCCGTACAGCACTTTCAAGTCCAGCCCATCGGTGAAGACGAGTGGCTGGCGCCGAGCCTGCTGGTGTGA

Protein sequence:

>DPOGS200156-PA
MILSEHGEDVWDCTGGVRAREHYHIFVGDLSPEIETQNLRDAFAPFGEISDCRVVRDPQTLKSKGYGFVSFLKKSEAESAITAMNGQWLGSRSIRTNWATRKPPAPKNELNSKPLTFDEVYNQSSPTNCTVYCGGLTAGLTEELMQKTFQPFGTIQEIRVFKDKGYAFIRFSTKESATHAIVAVHNADVNGAPVKCSWGKESGDPNNAQGAQPLTFDEVYNQSSPTNCTVYCGGLTAGLTEELMQKTFQPFGTIQEIRVFKDKGYAFIRFSTKESATHAIVAVHNADVNGAPVKCSWGKESGDPNNAQGAQLGGTAYSPFGAYPGGVPPSYWYNTYPQQLGGFLQGVQGVQGYSYAGQFAGYQQQYMGMGGVQLPWALGGGVGGVGGVGGVAAMSQPPQVLHYPVQHFQVQPIGEDEWLAPSLLV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: