MonarchBase - Protein-coding gene

DPOGS202738
Transcript	DPOGS202738-TA	1326 bp
Protein	DPOGS202738-PA	441 aa
Genomic position	DPSCF300284 + 167108-180494
RNAseq coverage	357x (Rank: top 33%)

Annotation
*Heliconius*	HMEL012680	1e-119	75.06%
*Bombyx*	BGIBMGA005357-TA	5e-119	78.37%
*Drosophila*	shep-PA	2e-81	75.77%
EBI UniRef50	UniRef50_E2A5I6	2e-97	56.25%	RNA-binding motif, single-stranded-interacting protein 1 n=13 Tax=Endopterygota RepID=E2A5I6_CAMFO
NCBI RefSeq	XP_393384.3	6e-91	52.81%	PREDICTED: similar to CG32423-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|307185103	6e-97	56.25%	RNA-binding motif, single-stranded-interacting protein 1 [Camponotus floridanus]
NCBI nr blastx	gi\|345493906	2e-102	50.32%	PREDICTED: protein alan shepard-like isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0000166	8.4e-20	nucleotide binding
	GO:0003676	2.1e-18	nucleic acid binding
	GO:0003723	1.1e-10	RNA binding
KEGG pathway
InterPro domain	[98-184] IPR012677	8.4e-20	Nucleotide-binding, alpha-beta plait
	[112-185] IPR000504	2.1e-18	RNA recognition motif domain
	[111-126] IPR002343	1.1e-10	Paraneoplastic encephalomyelitis antigen
Orthology group	MCL10624		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202738-TA
ATGGCTAGCGCGGGCGCGCAGTACCGCGGCGGCGCGCAGCAGTGGGCCGCTGCATACGCGCCGCAGCCCTGCCGCTACCCGCCGCCACAGCAGCACTACGCAGCGGCACCCAGCCCTTTCACTCCCCATCAGTACACGAGTGCAACGATGGGGGGAGGATGCGGCGCCACGGGTACGAGGGTACCGACGGCTGCATCGCCGGCTAACACGGCGTCCAGCTCGTCGTCCAACTCCGCGGGGGGTACTCGATCTACCAGCCTAAGTACCGCCCCGCCTCCGCCCGCCTCCTCAGCCTCAACTACAGGCGCGTCCGGCGAACAACTCAGCCGCACCAATCTCTACATACGCGGCCTGAGCCAGACCACAACCGATAAAGACCTCGTCCAAATGTGCCAGATGTATGGCAACATAATATCAACAAAAGCAATATTGGATAAAAATACAAATAAATGTAAAGGTTACGGTTTTGTAGATTTTGAAACAATCGCGTCAGCTGAGGCCGCTGTAAAAGGATTACAAGCCAAAGGTGTTCAGGCCCAAATGGCTAAAGTGGGTATCTGGTTCCTGCGTAGACTGAACCGTCAACAGGAACAGGATCCAACCAACCTGTATATGGCCAACTTGCCACCGCACTTTAAAGAGAACGATGTTGACCAACTGTTGGCCAAGTTTGGTCAAGTCGTGTCCACGAGGATCCTGCGTGATACCCATGGACACAGCAAAGGCGTAGGCTTCGCAAGAATGGAGTCTAGAGAAAAATGCGAGCAGATTATCCAAATGTTCAATGGAAATCCGATACCGGGCGCTAAGGAGCCTTTGCTTGTGAAGTTTGCCGATGGGGGTAATAAGAAAAAGGCTCTGTATAATAAGCAGAATGACAACAACGGTAGAGTGTGGCGAGACAACAATGATTCCATCACTCAGGCGATGAGTGTGACGGGTGTGTACGCTAGCGGTGTCGGCGGCGCCGGCGGGGAGTGCGGCGTGTACCGCAGTAATGTATACGGCGTGGCGTTCCATCCTCAGCTCCACGCTCCAGCCTGGCTGCCGTACGCGGCACTGCTGCCGCCCGCCCATCACGCGCCCCACGCCCCGCACCCCGCACACCCCGCACACCCACAGCATCTGCCCATCGATACCGTGCCTAGTCAATATGTGAACTGGGACAGCTTAAGGCCGGAAAATGAATTATACTACTTCGCGTCGCACCCTTACCAGTATTTCACTGGTCCAACACCGCCCATCATTCAGATGCCGATGGAGAGCGAGCATGCGTCGACGGCCGCCTCCCCGGACGAGGCCTACCAGCCTTACCCCCCCAAGTAG

Protein sequence:

>DPOGS202738-PA
MASAGAQYRGGAQQWAAAYAPQPCRYPPPQQHYAAAPSPFTPHQYTSATMGGGCGATGTRVPTAASPANTASSSSSNSAGGTRSTSLSTAPPPPASSASTTGASGEQLSRTNLYIRGLSQTTTDKDLVQMCQMYGNIISTKAILDKNTNKCKGYGFVDFETIASAEAAVKGLQAKGVQAQMAKVGIWFLRRLNRQQEQDPTNLYMANLPPHFKENDVDQLLAKFGQVVSTRILRDTHGHSKGVGFARMESREKCEQIIQMFNGNPIPGAKEPLLVKFADGGNKKKALYNKQNDNNGRVWRDNNDSITQAMSVTGVYASGVGGAGGECGVYRSNVYGVAFHPQLHAPAWLPYAALLPPAHHAPHAPHPAHPAHPQHLPIDTVPSQYVNWDSLRPENELYYFASHPYQYFTGPTPPIIQMPMESEHASTAASPDEAYQPYPPK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: