MonarchBase - Protein-coding gene

DPOGS204455
Transcript	DPOGS204455-TA	1293 bp
Protein	DPOGS204455-PA	430 aa
Genomic position	DPSCF300002 + 331340-339750
RNAseq coverage	567x (Rank: top 22%)

Annotation
*Heliconius*	HMEL008154	6e-92	81.82%
*Bombyx*	BGIBMGA013473-TA	6e-84	78.26%
*Drosophila*	glo-PA	1e-32	39.78%
EBI UniRef50	UniRef50_G4VLD5	4e-49	31.31%	Putative heterogeneous nuclear ribonucleoprotein (Hnrnp) n=4 Tax=Schistosoma mansoni RepID=G4VLD5_SCHMA
NCBI RefSeq	XP_002581068.1	7e-50	31.31%	heterogeneous nuclear ribonucleoprotein [Schistosoma mansoni]
NCBI nr blastp	gi\|322801457	2e-70	40.14%	hypothetical protein SINV_07549 [Solenopsis invicta]
NCBI nr blastx	gi\|91094511	2e-77	41.49%	PREDICTED: similar to Heterogeneous nuclear ribonucleoprotein H (hnRNP H) [Tribolium castaneum]

Group
Gene Ontology	GO:0000166	4.2e-09	nucleotide binding
	GO:0003676	1.6e-08	nucleic acid binding
KEGG pathway
InterPro domain	[341-417] IPR012677	4.2e-09	Nucleotide-binding, alpha-beta plait
	[120-184] IPR000504	1.6e-08	RNA recognition motif domain
Orthology group	MCL10373		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204455-TA
ATGTTGGGATCCGGTGATGGTAGCTATATTATAAAACTACGGGGCTTGCCTTTCTCCACTACTGCTGAAGATGTCCTCACATTTCTAAGCGGCGTAAATGTTATAAACGATAAAGAAGGTGTCCATTTGACCGAGGTTAGACCTGGTAGGCCTTCTGGAGAATGTTTCGTAGAGGTGCAGAGTCAAGACGATGTCACTCACGCGTTGAAAAAAGACAAAGAAAATATTGGCAGACGGTACATTGAAGTCTTTTCCACCGATCGTCAGGACATGGAGTGGGCGTTAAATGCTATGAGACAGAGTGAAAATGGTTTTGATGTTATACCCAATGTGTCTGATGATTTTGGAATAGTAAAATTGAGGGGCTTGCCTTTTGGTTGCTCTAAAGAGGAAATTATACAATTCTTCAACGGGTTGTCGGTGGTCCAGGACGGGGTGCACTTGCTCTCGGATCACACGGGGCGGGCCTCCGGCGAGGCGTTTGTATACTTCGTAGACAAGCAGAGCGCTCGAGACGCTCTTGACAGGGACATGGAGAAAATAGGACACAGAATGCTACATGCTAACGCTGTGATGACATCAAAGGACTCGTTGTGTTTAGTTGATGTTATCACAGTCTGTTATGAATATTGGCATTCTGGAGTGCATTGGTTGTTGAGTTGTCAAGGTCGAGGGTCGAGGGGCGCGGGCGGAGGGTCGCGGAAGACGGCCGCCGGTTTATATGAGATGCACCAGTTGTATGAGGCTGGAGATAGGGGATTCATGCGATATGATATGGATGTTTTAAAACATATTTTGACCGTACTTGTGCCATACATAGAGGTGTTCCTAAGTTCAGCGGACAAGGTGCGAGCGTACGGCGCTCGGCTGGAGGGTGGCGGGTTCAAGTCCCGGGGATACAGACCCACGCCCTACGACAGGAACGACAGGCTCTCCGGCCGGTTCGGGGGCAGGGGGAGGGGGTCCTTCGCCAGAGGAGGTTCGGGAGGCTCGTACACGGGCCGCGGCGGCCGGCTGGGCTCCAGCCACTGTGTACACATGAGGGGGCTGCCGTTCAAGGCGACGCCGCAGGACATCGCATATTTCTTCAAGCCGATCCGTCCTCTGAATATCAACATACACTACGACAACAGCGGCCGACCCTCGGGGGAGGCGGACGTGGAGTTCGAGTGTCACGAGGACGCCATGAGGGCGATGCGCCGTGACAAGAACAACATGGAACACCGCTACATCGAGTTGTTCATGAACTCCTCGCCGACCTTCAAGAGCCCGCGCCCGTTCCGCACCTACTGA

Protein sequence:

>DPOGS204455-PA
MLGSGDGSYIIKLRGLPFSTTAEDVLTFLSGVNVINDKEGVHLTEVRPGRPSGECFVEVQSQDDVTHALKKDKENIGRRYIEVFSTDRQDMEWALNAMRQSENGFDVIPNVSDDFGIVKLRGLPFGCSKEEIIQFFNGLSVVQDGVHLLSDHTGRASGEAFVYFVDKQSARDALDRDMEKIGHRMLHANAVMTSKDSLCLVDVITVCYEYWHSGVHWLLSCQGRGSRGAGGGSRKTAAGLYEMHQLYEAGDRGFMRYDMDVLKHILTVLVPYIEVFLSSADKVRAYGARLEGGGFKSRGYRPTPYDRNDRLSGRFGGRGRGSFARGGSGGSYTGRGGRLGSSHCVHMRGLPFKATPQDIAYFFKPIRPLNINIHYDNSGRPSGEADVEFECHEDAMRAMRRDKNNMEHRYIELFMNSSPTFKSPRPFRTY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: