MonarchBase - Protein-coding gene

DPOGS210557
Transcript	DPOGS210557-TA	2241 bp
Protein	DPOGS210557-PA	746 aa
Genomic position	DPSCF300304 + 137052-143237
RNAseq coverage	1151x (Rank: top 11%)

Annotation
*Heliconius*	HMEL009546	4e-117	93.95%
*Bombyx*	BGIBMGA013450-TA	2e-171	76.96%
*Drosophila*	SF1-PA	1e-143	67.59%
EBI UniRef50	UniRef50_Q9VEJ1	1e-141	67.59%	LD36095p n=24 Tax=Eumetazoa RepID=Q9VEJ1_DROME
NCBI RefSeq	XP_001600318.1	1e-155	75.14%	PREDICTED: similar to zinc finger protein [Nasonia vitripennis]
NCBI nr blastp	gi\|307168161	6e-152	70.57%	Splicing factor 1 [Camponotus floridanus]
NCBI nr blastx	gi\|157104868	0.0	47.75%	zinc finger protein [Aedes aegypti]

Group
Gene Ontology	GO:0003723	5.7e-12	RNA binding
	GO:0008270	2.8e-05	zinc ion binding
	GO:0003676	2.8e-05	nucleic acid binding
KEGG pathway
InterPro domain	[399-492] IPR004087	5.7e-12	K Homology
	[416-487] IPR018111	1.6e-07	K Homology, type 1, subgroup
Orthology group	MCL14190		Single-copy universal gene

Nucleotide sequence:

>DPOGS210557-TA
ATGAGTTCTCGACATAGAGACAGAAGCCGATCACGGTCTCGTGATCGTGATCGTCTTAAGGACAGGGATAAGGGACGGGAACGGGACCGGGATAAAGATAGGGAGAGAGAAAGGGACCGGGACCGTGATAGGGATCGAGAACGCGACAGGGACCGCGATCGAGACCGTGACAGAGACCGAGAGAGAGATAGAGATCGCGATCGAAACAGGGACCGGGAGAGAGACCGGGATCGAGATAGAGAGCGTCATCGGTCTAAGAGGGACAAAGATCGTGATAGAAGCCGCAGCCGTGATCGCCATAAAGAAAAGAGACGCAGTCGCTCTCGAAGCCGTAGTAGGAGTCGCGGCAGAAAATCAAAAGACAGGGATGGTACAATAGCTTTACTGGATCAAATGGTGGGCACCACTACCAAGGCGACGGCTCGCCAGGTGGCCGTTCCCACCTCCATGAACCCAGCAACACAAGCCGCCATACTGGCAGCAGCAGCCGTGGCTCAGACGTTTGTGGCTCAGCGGCGGCTGGCGGCGCCCGTGCAGCCCGCGGCGGCGGCGGCGGCAGCCCTGTCTGCAGCCCTGTCCGCGGCCACCGCCATCCCGCCGCCCACCTCTGTACAGCAGAAGCTGGAGCTGCTGCAGGCGCGCACTGAGGGACGGTACCGCGACAAGCAACCTCCCGACCACCATCCGGACGACGACCACGACGACGGACAAGGTCCTCCCGGGGAGACGGCGGCCGAGCGTCGGGCCCGGCGGCGCCGCACTCGCTGGATGGGCTCCGAGCACGACAAGACCTTCATCCCGGGCCTGCCCACCGTGCTGCCCTCCACGCTCACTCGCGAGCAGGAGGAGCAATATCTACTTCAGCTGCAGATCGAGGAGGTGAGCCGCAAGCTGCGCTCGGGCGACCTCGGCATCCCGGCCAGCGTGGACGAGAGTATGTTATCGACAGAGAAGCGCGCCCCCCTCCACCCCCTCCCTAGTGTAACTATACCGGGCGCCATGCTGGCCCCGCCCCCTCCCGACCCTGTGAGGTCGCCCTCGCCCGAGCCGATCTACTCCACGGACGGCAAGAGGCTGAACACGCGCGAGTACCGCACGAGGCGGAAACTCGAGGAGGAGAGACACCGGCTCGTCACCCGCATGCATCAGATCAACCCCGAGTTCAAGCCGCCGCCCGACTACAAGCCGCCCATCGTCCGTGTGCACGACAAGGTGATGATCCCTCAGGAGGAACACCCCGACATCAACTTCGTGGGTCTGCTCATCGGCCCGCGAGGCAACACGCTCAAAGCGATGGAGAAGGAGACCGGCGCCAAGATCATAATAAGAGGAAAGGGCTCCGTGAAGGAGGGAAAAGTCGGCAGGAAGGACGGCCAGCCGCTGCCCGGGGAAGACGAGCCTCTGCACGCCTACATCACCGCCACCAACGCCGACTGCGTCAAGAAGGCCGTCGAGAAGATCAAGGAGGTGATCCGTCAGGGTGTGGAGGTGCCCGAGGGACAGAACGACCTCCGCCGCATGCAGCTGAGGGAACTGGCGCAACTCAACGGGACTCTCAGGGAGAGCGACTCGCCGCGCTGCGCCAACTGCAGCGCCGCCGACCACAAGACGTGGCTCTGTCCGGACAAGCCGAACGTGACGAACAGTATCGTGTGTTCATCGTGCGGCGGCGCGGGACACATCGCGCGCGACTGCCGCGCCAAGAGACCGGGACACGCGCCGCCCGCCCTGCATCACGACAAGGCTAAGATCGACGAGGAGTACATGTCGCTGATGGCGGAGCTGGGGGAGGCGCCGCCCGGGGTCGGCGGAGTCACCGGCCCGTCCGCCGCGGCCGCTCGACGCACGCACGGACCCTTCGCCCCCGCGCCGCCGCCGCGGGCTATCATGCCGGCTCCCGGGAACATGGGCGGCTTCCACGCGATGACTCACCCTCCTCACCCGCCGCACCCTCCGCATCCTCCGCCGCACGCTCCCTGGCTCGGCGCGGTGTCCACTGGAGCGTCCGTGAGCGCGGCTCAGCCCCCGCCGCCCGGCAGCGCGCCGCCCTTCCCTCCGCCGCCGCCGCACCAGGCTGACGGCACTCTCCCGCCGGGTTCTTCGCCGCACCTGCCGCCGCCGCCAGGTATGCTGGCCGGTGGTCCGTGGCGCGGGTTCGCTCCCCCGCCGCCCTCCCGCCGAGGAGGGGGGCGGCGTCTGTTCGCTCCGCCGCCGCCGCCCCCGCCGGTCTCCTCCGCATAA

Protein sequence:

>DPOGS210557-PA
MSSRHRDRSRSRSRDRDRLKDRDKGRERDRDKDRERERDRDRDRDRERDRDRDRDRDRDRERDRDRDRNRDRERDRDRDRERHRSKRDKDRDRSRSRDRHKEKRRSRSRSRSRSRGRKSKDRDGTIALLDQMVGTTTKATARQVAVPTSMNPATQAAILAAAAVAQTFVAQRRLAAPVQPAAAAAAALSAALSAATAIPPPTSVQQKLELLQARTEGRYRDKQPPDHHPDDDHDDGQGPPGETAAERRARRRRTRWMGSEHDKTFIPGLPTVLPSTLTREQEEQYLLQLQIEEVSRKLRSGDLGIPASVDESMLSTEKRAPLHPLPSVTIPGAMLAPPPPDPVRSPSPEPIYSTDGKRLNTREYRTRRKLEEERHRLVTRMHQINPEFKPPPDYKPPIVRVHDKVMIPQEEHPDINFVGLLIGPRGNTLKAMEKETGAKIIIRGKGSVKEGKVGRKDGQPLPGEDEPLHAYITATNADCVKKAVEKIKEVIRQGVEVPEGQNDLRRMQLRELAQLNGTLRESDSPRCANCSAADHKTWLCPDKPNVTNSIVCSSCGGAGHIARDCRAKRPGHAPPALHHDKAKIDEEYMSLMAELGEAPPGVGGVTGPSAAAARRTHGPFAPAPPPRAIMPAPGNMGGFHAMTHPPHPPHPPHPPPHAPWLGAVSTGASVSAAQPPPPGSAPPFPPPPPHQADGTLPPGSSPHLPPPPGMLAGGPWRGFAPPPPSRRGGGRRLFAPPPPPPPVSSA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: