MonarchBase - Protein-coding gene

DPOGS215939
Transcript	DPOGS215939-TA	1767 bp
Protein	DPOGS215939-PA	588 aa
Genomic position	DPSCF300308 - 13043-17763
RNAseq coverage	263x (Rank: top 41%)

Annotation
*Heliconius*	HMEL007683	4e-151	89.82%
*Bombyx*	BGIBMGA001870-TA	7e-150	68.47%
*Drosophila*	Srp54-PA	5e-96	63.38%
EBI UniRef50	UniRef50_E2BXG3	4e-102	62.50%	Probable splicing factor, arginine/serine-rich 7 n=3 Tax=Endopterygota RepID=E2BXG3_HARSA
NCBI RefSeq	XP_001605226.1	8e-111	67.36%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|307177851	2e-111	66.20%	Probable splicing factor, arginine/serine-rich 7 [Camponotus floridanus]
NCBI nr blastx	gi\|193704514	2e-144	49.69%	PREDICTED: hypothetical protein LOC100161931 [Acyrthosiphon pisum]

Group
Gene Ontology	GO:0000166	7.6e-08	nucleotide binding
	GO:0003676	6.2e-06	nucleic acid binding
KEGG pathway
InterPro domain	[175-247] IPR012677	7.6e-08	Nucleotide-binding, alpha-beta plait
	[174-233] IPR000504	6.2e-06	RNA recognition motif domain
Orthology group	MCL13187		Single-copy universal gene

Nucleotide sequence:

>DPOGS215939-TA
ATGGTTTCAAGCAGTACGAGGGTGATTCAAGTCACCAACATCGCCCCTCAAGCTACAAAAGACCAAATGCAAACCTTATTTGGTTATTTAGGAAAAATTGATGATATAAGATTGTACCCAACAATAAGAGACGTATCATGTCCGGTACAGTCTCGTATATGTTACGTGAAATATTATGATTCGGCGACAGTCAATGTCGCCCAGCATATGACAAATACGGTGTTTATAGATCGTGCTTTAATCGTGATTCCCATGCAGTCAGGAGAGATTCCTGACGAGCACCGAGCTCTAGAGATGTCAAGCAACGGAACTTTAGTGCCGGGTCTTAGTACAGTTGAACCACGATTACCAGCTCACGTGATCAACACTTTGGAAGGCGCACCACCCAACCAGGTCATTCAAACATACGATCCTAACATAGCAGCAGCGGGATTACCACCGTACCCGCCGCTTCCAGCCATTTATGACTCGAGGAAAATAGAAGAAATAAGAAGAACACTTTTACTTATAGATGTGGGCGAACTAACATCCCAACAACTCATTGATCATTTTTGTCAAGCTGGCGAAGTCAGCTACGTGCGATTTTGTGAACGGGAAGTTGACAACTTAAAGTATGCGCTGATAGAAATGACAGAACAAGAAAGCATATCAAAGGCTCTTCAGCTTAATGGAGTCGCATTAAATGGCCAAGTCATTAAGGTCCATCATTCTACGGTGGCTATATCAAAGCCTCAGGCTAAGAGCAATGAGGCAGCTCAAAGGGAGATCGAAGAGGCCATGTGCAGAGTTAAGGAAGCCCAGAACTTGATATCGGCTGCCATCGACCCCGTTATTGGATTGTTGTCTAAAGACAAAAGGACTCGTTCCCGGTCCCGGTCCCGCCGCCGCTCCCGGTCCCGGTCTCGTCGTTCCCGGTCCCGTCACCGCTCTAAGCGATCCCGCTCACGGTCCAGACATCGCTCCCGGAGATCACGCTCGAGGCACCGACACCGCACTAGGTCTCGTTCCCGTCACCGAAGCTCACGGCGCTCCAGGTCCAGATCCAGACACCGCAGCTCGAGATCCAAACGAGAGAAGTCGAAAGAACGCGATAGAAAAGACAAGAAAGACATCGGTGATAAGGAAAAGAGAGACAGTGATAAGACGAAGTCACCGCAGAAAGACGTGGGTAGGGACGGAAAAGACGAGCTCAAGATTGACATCAGCGAGGTTGATACGAACGGCAGCTCGTATGAACATAAATCTAAAGCCTCCACACCCGCTGATGATAAAGAAAAGACGACAGAGCTCGACAAGGACAAGTCGCCGAGGAAAAAGGAAAGGTCCCGCTCCAAGGAAAGGAAGAGGGAACGGTCGCGGTCGAAACGAAGGTCGCGGTCACGATCAAGAAGGAAACGCTCGAGGTCACGTAAAAGATCGAGGTCCAGGGACAGAAAGAAATCCCGCTCCAGAGAGAGGAAGAAGTCGAGGTCGCGGGACAGAAAACGGTCCAGGTCCAGGGACAGGAAGCGGACGAAGTCGAGGGAGAGGAAGAGGTCGCGGTCCAAAGATAGGAAAAGATCGCGCTCCAAGGATAGGAAGCGTTCGCGGTCACCCAGCAGGCGCTCCAAGAGCCGGTCCCATAGAGATTCCAAAACGCCTCACGAGAGGAAGTCACGTGACCACTCGCCGCTACCAGCAATAATGGAAAAGACTCCACACAAAACTATAGACGTGACAGATGAAAAGAATTCCCCAGACAATATGGACATTTCAAATTCCCCATAA

Protein sequence:

>DPOGS215939-PA
MVSSSTRVIQVTNIAPQATKDQMQTLFGYLGKIDDIRLYPTIRDVSCPVQSRICYVKYYDSATVNVAQHMTNTVFIDRALIVIPMQSGEIPDEHRALEMSSNGTLVPGLSTVEPRLPAHVINTLEGAPPNQVIQTYDPNIAAAGLPPYPPLPAIYDSRKIEEIRRTLLLIDVGELTSQQLIDHFCQAGEVSYVRFCEREVDNLKYALIEMTEQESISKALQLNGVALNGQVIKVHHSTVAISKPQAKSNEAAQREIEEAMCRVKEAQNLISAAIDPVIGLLSKDKRTRSRSRSRRRSRSRSRRSRSRHRSKRSRSRSRHRSRRSRSRHRHRTRSRSRHRSSRRSRSRSRHRSSRSKREKSKERDRKDKKDIGDKEKRDSDKTKSPQKDVGRDGKDELKIDISEVDTNGSSYEHKSKASTPADDKEKTTELDKDKSPRKKERSRSKERKRERSRSKRRSRSRSRRKRSRSRKRSRSRDRKKSRSRERKKSRSRDRKRSRSRDRKRTKSRERKRSRSKDRKRSRSKDRKRSRSPSRRSKSRSHRDSKTPHERKSRDHSPLPAIMEKTPHKTIDVTDEKNSPDNMDISNSP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: