MonarchBase - Protein-coding gene

DPOGS211059
Transcript	DPOGS211059-TA	1047 bp
Protein	DPOGS211059-PA	348 aa
Genomic position	DPSCF300446 + 166927-169462
RNAseq coverage	904x (Rank: top 14%)

Annotation
*Heliconius*	HMEL004432	5e-143	81.77%
*Bombyx*	BGIBMGA009577-TA	1e-122	75.57%
*Drosophila*	msi-PC	3e-88	75.13%
EBI UniRef50	UniRef50_Q8MS04	4e-86	75.13%	RH49436p n=31 Tax=Coelomata RepID=Q8MS04_DROME
NCBI RefSeq	XP_001607438.1	1e-92	55.17%	PREDICTED: similar to RH49436p [Nasonia vitripennis]
NCBI nr blastp	gi\|156538565	2e-91	55.17%	PREDICTED: hypothetical protein LOC100123736 [Nasonia vitripennis]
NCBI nr blastx	gi\|156538565	2e-99	53.63%	PREDICTED: hypothetical protein LOC100123736 [Nasonia vitripennis]

Group
Gene Ontology	GO:0000166	4.7e-23	nucleotide binding
	GO:0003676	2.5e-21	nucleic acid binding
KEGG pathway
InterPro domain	[153-248] IPR012677	4.7e-23	Nucleotide-binding, alpha-beta plait
	[169-241] IPR000504	2.5e-21	RNA recognition motif domain
Orthology group	MCL13889		Single-copy universal gene

Nucleotide sequence:

>DPOGS211059-TA
ATGATGGTATATTCCAGCGGCGCGCTGGGCGGGCTGGAGGTGGTGGAGGGCGGTCTGGTAGGTGGCGAGCTGGCGGCTCACGTGCTGAGCGCGCAGGCCGCCGCCCACGCCGCGGCCACTGCGGCCGCGCAACAACAACAGATGGCAGTGCAGCAAATCATGTGTCCGTCAGAGAACTCACCATCTTCTGGTCGTTCCACTCCTGTGACGACCGCCACTGGGAACACTTCACCATCACCCAGCAAGCTGTTTGTGGGCGGCCTCAGCTGGCAGACGAGCTCGGAGAAGCTGAGAGAGTATTTTGCCATGTTTGGAGCTGTAACCGACGTTTTGATTATGAAGGACCCCGTGACACAGCGCTCGCGCGGCTTCGGCTTCATCACGTTCCAGGAGGCGGCGTCCGTGGACAAGGTGCTGGCGGTGCCCGTCCACACGCTGGACGGCAAGAGGATCGACCCCAAGCACGCCACGCCCAAGTCGGCGCCCAAGCCGGCCAAGACCAAGAAGATCTTCGTGGGCGGCGTCGGCCAGGACACGTCGGCGGACGAGGTGCGCGCCTACTTCGCGCAGTTCGGAGCCGTGGAGGACGCCGTCATGCTCATGGACCAGCAGACCAAGAGACACCGCGGCTTCGGCTTCGTCACCTTCCACTCCGAGGAGGCCGTGGAGCGCGTGTGCGACATCCACTTCCACACCATCAAGAACAAGAAGGTGGAGTGCAAGCGAGCTCAGCCCAAGGAGGCGGTGGCGGCCGCCCCGCTGGCGCTCGGCAAGCGGCTGGTGCTGCGGCCGGGACGCGGGCTGGTTTACGCGGGAGGCGTGGGTGGAGTGGGAGCCGTCGGCGGCGTTGGCGGGGTGCCGGCCGTGGGCGCGCACGCCTACCGCTACGCGCCGTACGCCTTGCCGGGGTCGCTGGTGGCCCCGCAGCCCGCCCCAGCCCCCGCCCTGCCCCAGTTCGGCGCGGCGTACTCCCTGGCCGGCGTGGACATGTCTTCGTTCCAGGGCGTGGACTGGAGCGCCATGTACGGCGTGCCGATGTACATCTGA

Protein sequence:

>DPOGS211059-PA
MMVYSSGALGGLEVVEGGLVGGELAAHVLSAQAAAHAAATAAAQQQQMAVQQIMCPSENSPSSGRSTPVTTATGNTSPSPSKLFVGGLSWQTSSEKLREYFAMFGAVTDVLIMKDPVTQRSRGFGFITFQEAASVDKVLAVPVHTLDGKRIDPKHATPKSAPKPAKTKKIFVGGVGQDTSADEVRAYFAQFGAVEDAVMLMDQQTKRHRGFGFVTFHSEEAVERVCDIHFHTIKNKKVECKRAQPKEAVAAAPLALGKRLVLRPGRGLVYAGGVGGVGAVGGVGGVPAVGAHAYRYAPYALPGSLVAPQPAPAPALPQFGAAYSLAGVDMSSFQGVDWSAMYGVPMYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: