MonarchBase - Protein-coding gene

DPOGS207088
Transcript	DPOGS207088-TA	2733 bp
Protein	DPOGS207088-PA	910 aa
Genomic position	DPSCF300001 + 2815122-2818441
RNAseq coverage	270x (Rank: top 40%)

Annotation
*Heliconius*	HMEL006149	0.0	60.70%
*Bombyx*	BGIBMGA013053-TA	4e-158	57.03%
*Drosophila*	CG7879-PA	3e-20	45.36%
EBI UniRef50	UniRef50_E2BZF7	1e-41	40.66%	RNA-binding protein 12 n=1 Tax=Harpegnathos saltator RepID=E2BZF7_HARSA
NCBI RefSeq	XP_001600826.1	4e-41	39.93%	PREDICTED: similar to ENSANGP00000015961 [Nasonia vitripennis]
NCBI nr blastp	gi\|307197792	4e-41	40.66%	RNA-binding protein 12 [Harpegnathos saltator]
NCBI nr blastx	gi\|157109923	3e-73	26.73%	heterogeneous nuclear ribonucleoprotein (hnrnp) [Aedes aegypti]

Group
Gene Ontology	GO:0000166	1.2e-07	nucleotide binding
	GO:0003676	8.3e-07	nucleic acid binding
KEGG pathway
InterPro domain	[637-716] IPR012677	1.2e-07	Nucleotide-binding, alpha-beta plait
	[642-710] IPR000504	8.3e-07	RNA recognition motif domain
Orthology group	MCL26031		Lepidoptera specific

Nucleotide sequence:

>DPOGS207088-TA
ATGAGTATAAGGGCGTGTGTTACCGATGAAGACGCAAGACAAGCCATGATGTTAGACGGAGGAAAAATCAAAGAAATCCAAGTTAAGCTTCTTCTGAGTTCTCGGTCGGAGATGCATAAAGTGATAGAAGCGGCTCGACAAAACGTTCCCCTTCTTAATATCAATGCTCCGGCCGCTAGCCCTGCTCCAACTCCAGCTGCCCCTGCAGCGCCAGTTATTACACCGTTCTCAGCAGCTCTAGGAACTGGCATATCGACTTTTGGAATACCGGGTATCGGAAATCCGCAAGAGATACCACAACCTGCCGTCATAGAACCACCAGCGCCAATTATAAGCCCACCTGCTAAATCTCCTGTTGAAGAAGAAAAGGATGAGGATACGAAATCTGACAGAAAACGTAGTAAGGAGAAAGACAGACGCCGAACACGGTCACGGTCCAGGTCGAGAGATCGAAAGGATAGAAAACGAGATCGAAGAGACAGATCACGATCCAGAGACAGGAGACGACGGGATCGGAGTCGGAGCAGGGAGAGACGAGATCGGAAACGTGAAAGAAAGGACCGTAGTCGCTCCCGAGACAGGTCGCCTTCCAGACGATCACGCGATAAGCGGAACGGAGATCGTAAATCACCACAAGGTTCAATGGACAGATCCCAAGAAAGTAGTCTTGATAATTCACTGTCAAATTCTACACCTCCTTTTGGCGGTTTGCTGAATTCTAACGGTCCGCAAATGGGTATGATACTCCCAAATAGTGCAATGTCTAATCTGCAATTAGGTCAGGGTGATCTGACACAAACTCGTTTCAATGATCCATCTTTAGCTGAGGCATTCAATAAATTACAAGAATTAGGTAAAAAACGTAATCCCAATGCATTCCAAGGAGAGCAACAGAATGGTAGTAAATTTTCAAGTGGCAGAGGTGGAAGTAGTAGCTCTAGGAATCAATTCCGTCGTGAGGGTCGATCTACGAGATTTGAAGATCAGCAAAGAGACTGCTGCGTGGCTATAAGAAATGCGCCAAACCACACAAGTTATGGTGACGTTCGTCGTTTTTTCCCTTTTATGATCGATAAACGAGGAATAAAAATGATTAATGATAATATGGGTCGGCGAACTGGAAATATATTTGTTAGATTTTGCGACTCTCGAGCAAAACAGCTTGCCTTACAACGCAAACCAAATGAGTTAAAAGGAGCTCAAGTAATTGTAGAATCTTTGGACGATGATACTTACGACGCTGCTACAGACTCATTCCTTCCTTACCGTGAGGATAATGACGAAGAAGAATCTACATTGACAGTCTCAGATACAGGAGACGATAATAAAACTCAATTCAGTGTTCTCAAACTGATAGATCTCCCTCATTTTGTGCAAGAACAAGATATTATGAAAGCATTTAGCGATTTTTCACTTTTATCGATCCAACTTGTTGACTGTCGCCATAACCGTACTAAAAATGCATATGTTGAGTTTGTAAAACCAGATGATGCCAAAATAGCTTTAGAACGCAAAGATTCTTATGTTTTCGGAAGACGACATCCAGCTATCACTCCACTTACAGATGAAGAGTATAAAAACGATAAAAATGAAAATTCTGATGTGTCTGGAAAATCGCAATCCAGTAAAAATTCATTACAAGAACAGGCTGTGCCTCGAGATCCTCGTCAGCGACGGTTATTGGATAATGGTCTGGGAGGGCCACAAATGCATAACGCACAACAGCCTTTCTTTCCCAATACTGCATTTGCACAAAATTTTAGGTCACCCTTTCCCAATCCACAATTCGGTGGTTTTGGAGGTATGGATCATAGAGGTTTGATTCAGAATTGGGGCAACCGAATGAACTTCCCCAACAAGTCGGATGTTCAATCAAGTTCCCAGGCTATATCTCTCAACATTGATGAGGAATCCCTCGATTGCGTCCTCATGAAAGGTCTTCCTCGCGAAGCTACGGACAGAACTATCGTCAACTTTTTGTCAGACACGGGAGCCGTACCTGCGAGGATCCACCTCATGCTAGACAACAACGGTCTTCCTTCGGGAGATTGCTTTTGCGAGTTTAGAACCTCTCAAGAAGCTAGGCAAGCAAGCACTAAGCATGGCAGTCTTTTGGATGGTTGCCGCGTTACCGTCGATTTGGTTTTGAGAAGTGTCGTAGAGGAAGCTTTGGAAGGACCCAAGGACACAAATCAGGGGACTCAAGAGGGTCTACTCGGACCGCCACCTCCCTTCGTCAACGTACCTCGCATGCCATTTTTCCCGAATCGTGGACAGTTTCGAGGTCGAGGATTCGATAGAGGAGGATTCGACCGAGGCGGATTTATGAATCGTGGCGGGTTTGATCCCCGAGGGCGTGGCATGATGCGCGGTCGCGGTGGCTGGCCAGATCGTGGTCGCGGGTTCGACCCAAGAGGCCGTGGCCGAGGCTTCATGCGCGCGCCTGCACCTAGAGACGACGAGCCAGATCCAGCACTCGAAGATTTCGGCACGCCAGGTTGCGTGCTGTCTATGGAGAATGTACCTTTCAGAGCCACTATTGACGACATCCTCGCGTTCTTCAGTGACTTTGAGCTGACACAGGACGACGTTATCCGCCGCTACAACGAACGCGGTCAACCCACAGGAGATGCGCGTGTTTCGTTCCGCACTCCATTCGACGCTAAGCGTGCACAGTCGTCCCACAACCTTTCGTCCATCTTTGACCGCCGCATTACGCTTACTTTACTCTAG

Protein sequence:

>DPOGS207088-PA
MSIRACVTDEDARQAMMLDGGKIKEIQVKLLLSSRSEMHKVIEAARQNVPLLNINAPAASPAPTPAAPAAPVITPFSAALGTGISTFGIPGIGNPQEIPQPAVIEPPAPIISPPAKSPVEEEKDEDTKSDRKRSKEKDRRRTRSRSRSRDRKDRKRDRRDRSRSRDRRRRDRSRSRERRDRKRERKDRSRSRDRSPSRRSRDKRNGDRKSPQGSMDRSQESSLDNSLSNSTPPFGGLLNSNGPQMGMILPNSAMSNLQLGQGDLTQTRFNDPSLAEAFNKLQELGKKRNPNAFQGEQQNGSKFSSGRGGSSSSRNQFRREGRSTRFEDQQRDCCVAIRNAPNHTSYGDVRRFFPFMIDKRGIKMINDNMGRRTGNIFVRFCDSRAKQLALQRKPNELKGAQVIVESLDDDTYDAATDSFLPYREDNDEEESTLTVSDTGDDNKTQFSVLKLIDLPHFVQEQDIMKAFSDFSLLSIQLVDCRHNRTKNAYVEFVKPDDAKIALERKDSYVFGRRHPAITPLTDEEYKNDKNENSDVSGKSQSSKNSLQEQAVPRDPRQRRLLDNGLGGPQMHNAQQPFFPNTAFAQNFRSPFPNPQFGGFGGMDHRGLIQNWGNRMNFPNKSDVQSSSQAISLNIDEESLDCVLMKGLPREATDRTIVNFLSDTGAVPARIHLMLDNNGLPSGDCFCEFRTSQEARQASTKHGSLLDGCRVTVDLVLRSVVEEALEGPKDTNQGTQEGLLGPPPPFVNVPRMPFFPNRGQFRGRGFDRGGFDRGGFMNRGGFDPRGRGMMRGRGGWPDRGRGFDPRGRGRGFMRAPAPRDDEPDPALEDFGTPGCVLSMENVPFRATIDDILAFFSDFELTQDDVIRRYNERGQPTGDARVSFRTPFDAKRAQSSHNLSSIFDRRITLTLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: