MonarchBase - Protein-coding gene

DPOGS200032
Transcript	DPOGS200032-TA	1710 bp
Protein	DPOGS200032-PA	569 aa
Genomic position	DPSCF300337 + 138677-148597
RNAseq coverage	3159x (Rank: top 4%)

Annotation
*Heliconius*	HMEL003679	2e-120	89.58%
*Bombyx*	BGIBMGA012429-TA	4e-124	91.67%
*Drosophila*	Hrb27C-PB	1e-115	63.71%
EBI UniRef50	UniRef50_P48809	2e-113	63.71%	Heterogeneous nuclear ribonucleoprotein 27C n=27 Tax=Arthropoda RepID=RB27C_DROME
NCBI RefSeq	XP_966757.2	2e-117	60.37%	PREDICTED: similar to hrp48.1 [Tribolium castaneum]
NCBI nr blastp	gi\|189241702	3e-116	60.37%	PREDICTED: similar to hrp48.1 [Tribolium castaneum]
NCBI nr blastx	gi\|195438186	1e-132	57.97%	GK24781 [Drosophila willistoni]

Group
Gene Ontology	GO:0003676	5.8e-23	nucleic acid binding
	GO:0000166	4.7e-21	nucleotide binding
KEGG pathway	pop:POPTR_1089460	4e-47
	K12741 (HNRNPA1_3)	maps->	Spliceosome
InterPro domain	[14-86] IPR000504	5.8e-23	RNA recognition motif domain
	[89-184] IPR012677	4.7e-21	Nucleotide-binding, alpha-beta plait
Orthology group	MCL14119		Single-copy universal gene

Nucleotide sequence:

>DPOGS200032-TA
ATGCGTATGAATCCAGACATGGACGATGATGAGAAGGGAAAACTGTTTGTTGGCGGTCTATCATGGGAGACATCGCAGGAGAATCTGCAGCGTTACTTCTCCCGCTACGGCGACGTGATTGATTGTGTTGTTATGAAGAACAGCGAGTCTGGCCGTTCAAGAGGTTTCGGTTTTGTTACCTTTGCTGAACCCTCACTGGTCAATGTCGTGCTTCAGAATGGTCCCCATCAACTCGATGGCAGGACAATCGACCCGAAACCGTGCAATCCAAGGACTCTTCAGAAGCCCAAGCGCGGCGGCGGCTATCCGAAGGTGTTCCTCGGAGGTCTGCCATCCAACATCACCGAGACTGACCTGCGCGTGTTCTTCGGACGGTACGGCAAGGTCATGGAGGTCGTCATCATGTATGACCAGGAGAAAAAGAAGTCTAGAGGCTTCGGATTTCTGTCATTTGAAGATGAAATCTCTGTTGAGAGAGTCACCCAGGAGCATTTCATCAACCTGAACGGCAAACAGGTCGAGATCAAGCGCGCGGAGCCTCGCGATGGTTCCGGCAAATTGGGCTCCGGAGGAGGCATGGGCGGGGGCATGGGGGGAGCGCCCGGAGATGCGCCCGCCGCGGGACAGTGGGGACCACCGCAAGCCGCGCCCATGAATATCATACAGGGCCACAACGGACAGATGGGCGGCCCACCGATCAACATGCCCATGGCCGGACCTAACATAATGCAGGGATACCAGGGCTGGGGAACGTCAGCCGGGCAGACTTCGTACGCCGGGTACGGTGCGGCGGGCGGCGGCGCGGGCCCTGGCAACTACCAGGGCTGGGGAGCTCCGCCGGCGCCTCAGGCCCCGCCGCACGCGCCCGCCTGGCCCGCCACCAACAACTACACTCAACACGCTCAGCCGCCCGCCCAGGGATACGGCAGCTACGCGAACTACAGCTCGGCGCCGGCGGGCGCCTCGGCCGGTGGCAGCTGGACTAATTGGAGCATGCCGCAGAACTCCAACTCTACCGGCTCCGGATCGTACGTTCCGTTGTCGGAGGGCGGTGAGATGTACGGTCGCGGTGGTGGCGGTGGCACGGGCGCGGCGCCGGCTCTGGCCGGGGCGCTGTCCTCCGCCGCCCTCTCCAAGTCCTCCTCCGCCGACTACTCTACCTACCAGCAGTACCCGCCCGCCTACCAGCAGGATCAGGTCTCTCATCACCCTTCCCCTCCCTCCCCCGGCCACCACACGTGTCCCCTCCCCCCGGTAGCCCTTGCCGCCTCCACCACCCCTCACTTCATCCCTCTGGGACGACTCACGCTTTGCCCGTCCATCTTCACGCTCTGCGCTACTTACACATCTGCTAGACGCGAGGGATTGTGGCGAGTGGGACTTTATGTCTGGTTGGCAATCCGGTCGTTACTAGACGGGGTAGGACACAGGGCAGTAGGGCGGCCGGCTAACGTGTCGCCACCGGGCAGGGCTCCTCGTACGGCGGCGGAGGGTCGCGCTACGCTGCCGGCGAGTACCACTCGGCCGCCGCTCAGCCGCCAGGTGTGCACCCTCACCCGCACCACGCGCCCAAACACTTCAACAACGAGTTTAACAAGGAGTGGCCAGCCGCCTAGTGCCCCCCGCCACCCCCGCGACCCCACGCACACGCACCAGCCGCCCGTCCACCGCCTCGCCCGCCGCGACCCCGCCATCTCTTACCTCAGTTAG

Protein sequence:

>DPOGS200032-PA
MRMNPDMDDDEKGKLFVGGLSWETSQENLQRYFSRYGDVIDCVVMKNSESGRSRGFGFVTFAEPSLVNVVLQNGPHQLDGRTIDPKPCNPRTLQKPKRGGGYPKVFLGGLPSNITETDLRVFFGRYGKVMEVVIMYDQEKKKSRGFGFLSFEDEISVERVTQEHFINLNGKQVEIKRAEPRDGSGKLGSGGGMGGGMGGAPGDAPAAGQWGPPQAAPMNIIQGHNGQMGGPPINMPMAGPNIMQGYQGWGTSAGQTSYAGYGAAGGGAGPGNYQGWGAPPAPQAPPHAPAWPATNNYTQHAQPPAQGYGSYANYSSAPAGASAGGSWTNWSMPQNSNSTGSGSYVPLSEGGEMYGRGGGGGTGAAPALAGALSSAALSKSSSADYSTYQQYPPAYQQDQVSHHPSPPSPGHHTCPLPPVALAASTTPHFIPLGRLTLCPSIFTLCATYTSARREGLWRVGLYVWLAIRSLLDGVGHRAVGRPANVSPPGRAPRTAAEGRATLPASTTRPPLSRQVCTLTRTTRPNTSTTSLTRSGQPPSAPRHPRDPTHTHQPPVHRLARRDPAISYLS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: