MonarchBase - Protein-coding gene

DPOGS204371
Transcript	DPOGS204371-TA	1086 bp
Protein	DPOGS204371-PA	361 aa
Genomic position	DPSCF300040 + 928898-932981
RNAseq coverage	15x (Rank: top 81%)

Annotation
*Heliconius*	HMEL011820	2e-151	97.79%
*Bombyx*	BGIBMGA005893-TA	5e-127	80.33%
*Drosophila*	bru-3-PA	2e-92	62.04%
EBI UniRef50	UniRef50_Q9VU91	2e-90	62.04%	Bruno-3, isoform A n=151 Tax=cellular organisms RepID=Q9VU91_DROME
NCBI RefSeq	XP_971057.2	6e-115	78.38%	PREDICTED: similar to bruno-3 CG12478-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270016806	5e-122	81.58%	hypothetical protein TcasGA2_TC001522 [Tribolium castaneum]
NCBI nr blastx	gi\|270016806	2e-130	81.58%	hypothetical protein TcasGA2_TC001522 [Tribolium castaneum]

Group
Gene Ontology	GO:0000166	8.2e-24	nucleotide binding
	GO:0003676	5.2e-20	nucleic acid binding
KEGG pathway
InterPro domain	[265-341] IPR012677	8.2e-24	Nucleotide-binding, alpha-beta plait
	[270-343] IPR000504	5.2e-20	RNA recognition motif domain
Orthology group	MCL11648		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204371-TA
ATGAATGCGCCCGACTTTAGTTTCTGTATTGTAGTTCCCTTCACCTGCCTCCGGGCCGTCGCTTGCATTTTTAAGGACGCTTGGGCCTCATTTTCTGAGGCGTTGTATGCTTTGCTAATGTTCACGTTTCCCTCACTGCCTATTAAAAGTGGAGCCTCATCGAGCCTGGTAGTAAAATTCGCGGACACGGAAAAGGAACGTCAACTTCGTCGCATGCAGCAGATGGCCGGCAACATGAGCCTGCTGAACCCGTTCGTTTTCAATCAGTTCGGAGCTTATGGAACCTACGCTCAGGTCATCACCGAGCAAGTTGACCTACAGCAACAAGCGGCATTGATGGTGGCCGCCACCGCCCAAGGCTATATCAGTCCTATGACAGCGCTCGCGTCCCACGCTCTAAACGGAATGGCCAATTCCGTAGTGCCAGCTACCTCTGATAACTTCACCGGGCTCGCGATAGGCACAGGAGGTGGACAGCCACTGAATGGAGCGCTTCCATCTCTGCCATCGCCAACGATGCCAGGCTTTAACATGGCAGCTCAGACAAATGGGCAGCCACCACCGCAAGAGGCGGTATATACTAATGGCATCCACCAGACATTTACTGGACCCGTGCCAGTGACAGCGCAGGGCATCCCTAACGGCGAAGCAGCGCTGCAACACGCTGCTTACCCCAGCATGCAGCCCTTCCCCGGCGTCGCTTATCCAGCCGTTTATGGGCAGTTTCCGCAGCCCATCCCGCCGCCGATGTCGACAATAGCGCCAGCGCAAAGAGAAGGATGCTCCATTTCGGGGCCTGAGGGCTGTAACCTGTTCATATACCACTTGCCACAAGAATTCGGGGACGCCGAACTGATGCAGATGTTCCTCCCTTTCGGGAATGTAATAAGCAGCAAGGTGTTCATTGACCGTGCCACCAATCAGAGCAAATGTTTCGGCTTTGTATCGTTTGACAACCCGACGTCAGCCCAGGCCGCCATTCAAGCAATGAATGGCTTCCAGATCGGCATGAAGCGGCTAAAGAAGGCTGCCGGCAAGTACCCTTCGCCCGCGGTGCGCTTCTTTGCGTATTATCAAGAATTCTAA

Protein sequence:

>DPOGS204371-PA
MNAPDFSFCIVVPFTCLRAVACIFKDAWASFSEALYALLMFTFPSLPIKSGASSSLVVKFADTEKERQLRRMQQMAGNMSLLNPFVFNQFGAYGTYAQVITEQVDLQQQAALMVAATAQGYISPMTALASHALNGMANSVVPATSDNFTGLAIGTGGGQPLNGALPSLPSPTMPGFNMAAQTNGQPPPQEAVYTNGIHQTFTGPVPVTAQGIPNGEAALQHAAYPSMQPFPGVAYPAVYGQFPQPIPPPMSTIAPAQREGCSISGPEGCNLFIYHLPQEFGDAELMQMFLPFGNVISSKVFIDRATNQSKCFGFVSFDNPTSAQAAIQAMNGFQIGMKRLKKAAGKYPSPAVRFFAYYQEF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: