MonarchBase - Protein-coding gene

DPOGS200105
Transcript	DPOGS200105-TA	1290 bp
Protein	DPOGS200105-PA	387 aa
Genomic position	DPSCF300044 + 417076-537884
RNAseq coverage	469x (Rank: top 26%)

Annotation
*Heliconius*	HMEL004318	2e-43	96.47%
*Bombyx*	BGIBMGA004557-TA	4e-119	93.61%
*Drosophila*	Pur-alpha-PB	5e-106	80.09%
EBI UniRef50	UniRef50_Q9V4D9	7e-104	80.09%	Purine-rich binding protein-alpha, isoform B n=38 Tax=Pancrustacea RepID=Q9V4D9_DROME
NCBI RefSeq	XP_001845827.1	1e-110	88.52%	transcriptional activator protein Pur-alpha [Culex quinquefasciatus]
NCBI nr blastp	gi\|170035946	2e-109	88.52%	transcriptional activator protein Pur-alpha [Culex quinquefasciatus]
NCBI nr blastx	gi\|170035946	9e-106	87.26%	transcriptional activator protein Pur-alpha [Culex quinquefasciatus]

Group
KEGG pathway
InterPro domain	[1-207] IPR006628	1.7e-127	PUR-alpha/beta/gamma, DNA/RNA-binding
Orthology group	MCL15635		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200105-TA
ATGCTCCAAATACAGTCCAAGAGGTTTTATCTAGATGTGAAGCAGAATAGGAGAGGACGTTTTATAAAAGTTGCAGAGATCGGCGCTGACGGGCGGCGCAGCCAAATATTCCTGGCCATGTCGACCGCGGCCGAATTCAGGGACCACTTGTCGGCGTTCAGCGATTTCTACTCGTCGCTGGGCCCGCCGAACCCGGACAACGTGCCCGACGACGGAAAACTCAAATCAGAGATGATGCTTAAGGACAACAGACGCTACTACTTAGATTTAAAAGAGAACTCCCGCGGTCGTTTCCTGCGCGTGTCTCAGACACAGACGCGGGGCGGTCCGCGCGCACAGGTTGCTTTGCCAGCGCAGGGCATGATAGAGTTTCGCGACGCGCTCACCGACCTGCTAGACGACTTCGGCTCCGATGACGGAGGGTTCAAGGGCGAGTTACCCGAGGGGCGCCACCTCCGTGTAGACAATAAAAACTTTTATTTCGACATCGGGCAGAACAACCGCGGGGTCTACATGAAAGTCAGCGAGGTGGTGAAGAGCAATTTCCGCACCGCCATCACCGTACCGGAGAAATGTTGGACACGCTTCAGGGACATCCTGGCGGACTACTGCGACAAGATGAACAGGGCGCACGACCCCGACCACCATCAGGTTTTCTTAGCTCTCGTACTATGCGTCGCTTACCTAGACGCCCAGCCGTATGGTTTGTACGGAGGCTTATACGGCATTGGTAGTCGACTCGGAATCGGCAGGGGCCTTGGTTTGGGGCTTGGTTATAGGAGATATGGCTATGGCATGCCACGTCTGGGCTACGGTTACAACAATCTGGGCTCAGGATACGGTGTTGCTGGTTTCGCTGTCATAGTTAAGTCTCAACTGCTCTTTGGTCTTGGAAGATTGGGAGCCGAAATAGGGTCAAGAATAGGGTCCGCTTTAGGGCATGGTATTGATGCTATTGCTGATATTGGAACCGAAGCATTATCATTAGGTGAGGAAGCAATAGACGGACCAAGATTATTTGATCTTGGTTCAAAAGCTGACTCAAATAATTATCATGAAACTGCTGACTCCGGTTCAAATGAATATAATGCTGGATCTGGCAGTGCTGAGAGTAGTGAACTTTCAAGACGTCATCAACGACACTANACTTATCCTAACGTCTGAGCTACATAAATGTAAAGTTACATAAATATCCATCCAGTAGTTTTTGCGTGAACGAGCAACAAACATCCATGGATATATGCATCATCACGAACTAACATTTTTATTACTGGGATTCAATTCGGATAA

Protein sequence:

>DPOGS200105-PA
MLQIQSKRFYLDVKQNRRGRFIKVAEIGADGRRSQIFLAMSTAAEFRDHLSAFSDFYSSLGPPNPDNVPDDGKLKSEMMLKDNRRYYLDLKENSRGRFLRVSQTQTRGGPRAQVALPAQGMIEFRDALTDLLDDFGSDDGGFKGELPEGRHLRVDNKNFYFDIGQNNRGVYMKVSEVVKSNFRTAITVPEKCWTRFRDILADYCDKMNRAHDPDHHQVFLALVLCVAYLDAQPYGLYGGLYGIGSRLGIGRGLGLGLGYRRYGYGMPRLGYGYNNLGSGYGVAGFAVIVKSQLLFGLGRLGAEIGSRIGSALGHGIDAIADIGTEALSLGEEAIDGPRLFDLGSKADSNNYHETADSGSNEYNAGSGSAESSELSRRHQRHXTYPNV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: