MonarchBase - Protein-coding gene

DPOGS201302
Transcript	DPOGS201302-TA	2403 bp
Protein	DPOGS201302-PA	800 aa
Genomic position	DPSCF300176 - 264744-275113
RNAseq coverage	331x (Rank: top 35%)

Annotation
*Heliconius*	HMEL017255	3e-143	57.19%
*Bombyx*	BGIBMGA003050-TA	1e-87	64.21%
*Drosophila*	Spps-PA	8e-59	75.44%
EBI UniRef50	UniRef50_E1ZX10	5e-69	45.98%	Transcription factor Sp4 (Fragment) n=2 Tax=Camponotus floridanus RepID=E1ZX10_CAMFO
NCBI RefSeq	XP_624316.2	1e-67	52.48%	PREDICTED: similar to Transcription factor Sp3 (SPR-2) [Apis mellifera]
NCBI nr blastp	gi\|328784652	3e-69	48.83%	PREDICTED: hypothetical protein LOC551928 [Apis mellifera]
NCBI nr blastx	gi\|340726716	2e-87	33.58%	PREDICTED: hypothetical protein LOC100650907 [Bombus terrestris]

Group
Gene Ontology	GO:0003676	1.1e-17	nucleic acid binding
KEGG pathway
InterPro domain	[678-709] IPR013087	1.1e-17	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL20679		Insect specific

Nucleotide sequence:

>DPOGS201302-TA
ATGTCGTCTGACTCCCACAAAGTGACAGTTGAATATATCAGTGAGGACAGAACAGTGAAGGAGGGTAGCGGCACCCAGTCGCCCCTAGCATTACTGGCGGCCACGTGTAGCCGTTACGGCGCTGTCAGCATGGGGCCCGAACAGCAGCAGGAGAAGGATCAGCAACAACAGCAACCACAGCAGCAACAGCATTACACCCAACAACAACAAGTGCAGCAACAGCAGCAGCAGCAGCAACAACAGCAACAACAGCAGCAGCAGCAACAACAGCAGCAGCAACAACAACAACAACAGCAGCAGCAACAACAACAACAACAGCAGCAGCAGCAACAACAACATCAACAACAAGTGCAGCAGCAACAGCAACAACAACAGCAACAACAACAACAACAACAACAGGTCCAACAAGCTCAGCTAGTCCAGCAACAAGTACAGGGCGAGGCACTTGCAGCACTCCAGCAGCAGTATATGCAGCAGCCGCAGCTCAGAGTCATCAGCACTGCCGTGGTGCAACAACTGAGAGCGCAAGGCCTGTCGGTGAGTGATGTGGGGAGAGATGTAAATGCTAGTGTCCAGCCGCTTCAACATGGCAATGAGTTATCAGCGGCCATTGTGAATGCTGCGACAACAGTCCCAAATGGCATTCAAGTGCAGCAACCGCAGGTGATATCAATGCAGCAGCTGCAATCTCTGCTGGGAGGCGGCGTGGTGTCGTCCAGTGAGGGCACGCCCTATCAGAACTCACCGCAACAACTGCTGCAGATACACCCACAACTGCTGCAACAACAGTGGCCGCCCCACATGCCGCCGACTGTGGTGGGAGGCGTCACTCCGCTGCAAGCCGTCACCGTGGACGGACAGGACGCTCTGTTCATACCCTCACACCACGCTCAGAACTTCTCGGGCATGGGTCAGGTGAGCCTGGTCAACGGTCAGCTGGTCCGCACGCCTGTCCTGCCGTCCGGGTTTCTCCACAACGTGATGCATCTCCCTGCGGAGCAACAAGCGACCGTGTCCATCCCCGGCACTAACCTAACAATACCGCTAAGCGCACTAACCGGTAATCAGATGGTAACTATCCCGGGAACGAATATATCGATACCGGGCGGGATACAGATACCGACCAGCCAGGCTATCACTATCCCGAGCTCCACGGGCGTGCAGTTGCCCGCGGCCGGCGTGCCCAATAACGGAGTAACGATACAGACTGACGGGAAACACGGAAACGGAAAAGAGGCCAAGTCACCCGCCAGTCCGGGGCAAGGCGGCGGGGTTGCTGTCCGTGGTGGCGTGGGCGGGGTGGGCGGCGTGGGCGGCATGGGCATGGTGCCGGTCCAGGTGCCCGTGAGCGTGGCCAACGGTCACACGGTGTACCAGACGGTCCACGTCCCAGTACACGCGCCCCACCTCCAGATAATACCGCAGCTGCAGCAGATGCAAGCCCAGCCTCAAGTGGCGAACGTGCTGACACCCTCCGGACAAATACAACAGATACAGATCGCGTCGCTCGGAAATGTTCAGGCTGTGTCTAATCCCATGCAGGACACTGGCCAGGTCCAGCAGCAGGCTATCATCACGAGTACTCCGAACGGACAGCAGGTCACTGTGATACCTGCCTCCAGTAATGTCCCGACGCTGGGCGACCCGCCAGACCCGCCGCACGTCTTGGTCCCAGCCGTGGGTTTGCCGGGCGTCCAGCTAGCGCAGATACCACAACAACAACCGCAACCCGCGCCTACACCGCAACCGCAACCTCTCATCGGTCAGCAAATACAGCAGGATCCGAACGAGCCGGGGAAGTGGCAGGTGGTGACGGTCAGCTCCGGCAACACAACTACCAGCGAGTGTGAGGCCAACAAGAACAGACCCAGCAGTCCCAACAGTGGGAAACGGTTGATGAAGCGAGTCGCCTGCACATGTCCCAACTGTGATCAGGGAGAGAACCGCCTGGTGGATCGCAAGAAACAACATGTCTGCCACATCCCGGGCTGTAACAAGGTCTACGGGAAGACCTCCCACCTAAGAGCACATCTACGATGGCATTCCGGAGAGAGACCCTTCCTTTGCAACTGGCTGTTCTGCGGGAAAAGGTTCACACGCTCGGACGAGCTGCAGCGTCACCGCCGCACACACACGGGAGAGAAACGCTTCGAGTGTCCGGAGTGCAGCAAGCGGTTCATGAGATCAGACCATCTCGCCAAACACGTCCGCATACACACCAAGAACAGGATCACGGAGGTGGCGACATCTACACAGTCAATGTATTCAGACTCCGGGGACGACAGCTGCGATGAGAAAATGATGTTGACCATAGAGACCATGCATCCCAGCAATGATGCGGAGGAGAAGCTGGTCATGATACGCTCAGGAGCCAAGCTCGAGCCGGACCACATAGACAGTTAG

Protein sequence:

>DPOGS201302-PA
MSSDSHKVTVEYISEDRTVKEGSGTQSPLALLAATCSRYGAVSMGPEQQQEKDQQQQQPQQQQHYTQQQQVQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQHQQQVQQQQQQQQQQQQQQQQVQQAQLVQQQVQGEALAALQQQYMQQPQLRVISTAVVQQLRAQGLSVSDVGRDVNASVQPLQHGNELSAAIVNAATTVPNGIQVQQPQVISMQQLQSLLGGGVVSSSEGTPYQNSPQQLLQIHPQLLQQQWPPHMPPTVVGGVTPLQAVTVDGQDALFIPSHHAQNFSGMGQVSLVNGQLVRTPVLPSGFLHNVMHLPAEQQATVSIPGTNLTIPLSALTGNQMVTIPGTNISIPGGIQIPTSQAITIPSSTGVQLPAAGVPNNGVTIQTDGKHGNGKEAKSPASPGQGGGVAVRGGVGGVGGVGGMGMVPVQVPVSVANGHTVYQTVHVPVHAPHLQIIPQLQQMQAQPQVANVLTPSGQIQQIQIASLGNVQAVSNPMQDTGQVQQQAIITSTPNGQQVTVIPASSNVPTLGDPPDPPHVLVPAVGLPGVQLAQIPQQQPQPAPTPQPQPLIGQQIQQDPNEPGKWQVVTVSSGNTTTSECEANKNRPSSPNSGKRLMKRVACTCPNCDQGENRLVDRKKQHVCHIPGCNKVYGKTSHLRAHLRWHSGERPFLCNWLFCGKRFTRSDELQRHRRTHTGEKRFECPECSKRFMRSDHLAKHVRIHTKNRITEVATSTQSMYSDSGDDSCDEKMMLTIETMHPSNDAEEKLVMIRSGAKLEPDHIDS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: