MonarchBase - Protein-coding gene

DPOGS212848
Transcript	DPOGS212848-TA	2964 bp
Protein	DPOGS212848-PA	987 aa
Genomic position	DPSCF300086 + 223324-227166
RNAseq coverage	68x (Rank: top 67%)

Annotation
*Heliconius*	HMEL010124	3e-177	39.22%
*Bombyx*	BGIBMGA000792-TA	0.0	44.96%
*Drosophila*	crol-PE	3e-50	31.87%
EBI UniRef50	UniRef50_E7F8Z9	3e-91	27.05%	Uncharacterized protein n=61 Tax=Danio rerio RepID=E7F8Z9_DANRE
NCBI RefSeq	XP_001950800.1	8e-88	30.50%	PREDICTED: similar to mCG142610 [Acyrthosiphon pisum]
NCBI nr blastp	gi\|326667255	4e-93	29.61%	PREDICTED: zinc finger protein 91-like [Danio rerio]
NCBI nr blastx	gi\|326667255	6e-109	29.61%	PREDICTED: zinc finger protein 91-like [Danio rerio]

Group
Gene Ontology	GO:0003676	2.4e-15	nucleic acid binding
	GO:0005634	1.2e-10	nucleus
	GO:0008270	1.2e-10	zinc ion binding
	GO:0005622	6e-06	intracellular
KEGG pathway
InterPro domain	[672-700] IPR013087	2.4e-15	Zinc finger, C2H2-type/integrase, DNA-binding
	[31-104] IPR012934	1.2e-10	Zinc finger, AD-type
	[653-675] IPR007087	6e-06	Zinc finger, C2H2
Orthology group	MCL19019		Insect specific

Nucleotide sequence:

>DPOGS212848-TA
ATGAACGGTGGAACCGCTTCAGACCAGCTAGACGAACTTGATATTAAATGCAGCGGCGAAACTCATGAGAACCTGCAGGATTCTCCAAATATATGTCGAATATGTGCCACCGTCACAGACCTGGTCATTCCTATATTTGAAGGAGAAGGACTACAAAACAACTTAGCAGAAAAAATACATAAACATTTACCTATAAAGGTGTCTGTGCAGGATGTGCTGCCCCAGGTGGTGTGCTACCAGTGCTCCAGTACTTTGCTCGCCTGGCATGAGCTGGTGCAATGCTGTCAACAAGCGGACCAAGCTCTCCGACAGCAGGCAGCCCATAGGGAGAGGAAAGCAAACGAAGTAACAGGAACAACATCAGATCCAAAGGCTTTGAGCTTGTTAACATCCTCAGTGCGAGGTGTGTTGAGTGATTACTGTCAAATGCTTAATATAAATCAGGAAACTTCTGACATCTGTTATGTCTGTCAAGAATGTGACGGACATCCCGTCTCAAGCTCTATAGAAAATTTATCAGAGCATCTGCAATTGGTACACAAGGAAGTCCTCATCTCTGATGAATTATTTGGTAGCGATGATCTCGGCGAGCCTGCTCCTCAGAAAGAGTTGCCAAACTATTCCTGTCCTTTCTGTGAGAGCATGTTTTCTTCACCCACTAGACTCATTTTCCACCTGAACTGTCATCTCGAGGTCTGTATCGACGACGGAGTGTACTGTTGTGACCAACTGTTCGATAATAAAACATCTTTCGTCAGTCACCTACAATCTCGACACGTTCGTAAAGTTATCGAATCGTCTTACGTGTGCAAGAGCTGTGGCCTCACAGCCGGCGACCTGGCCGAGCTCCAGAAACATATTAACGATAATCATCCCGAAGCGGAGGACAGATATGAGAAGGGCAAGACAGAAGGGAGTCCCAAATGTCAGAAATTTATTCCCGCCGTGTGTTCCGAGTGCAACAAAACTTTCTCTAACAAGTACAACATGCTGGTGCACATGAGGAACCATTTCGGACCAGCGAGTCGGTTCGCGTGCGGCAAGTGCAACAAGACTTACAAGAGCCAAGGCAGCCTCATATACCACCATAAGGTCGTCCACGAGGGACAGCTCAAGTTCGTGTGCTCGTCGTGCGGAGAGGCCTTCCCGTCACGAGCGGCGAGAGACGTACACGCGCGCCTCCACACTGGTCAGAGACCTTTTTCATGCCAATACTGTGGGAAGGCCTATCGAGCTAAGAACACTCTATACCGACATATAGACATGCATCTGAACATAAGAAAATATGCCTGCAACTTTTGTGATCGAAAGTTCCGAAAGAGTACACACCTTAAGTGTCACTTGCGAACGCACGAGAGGACGACATGGATCCCATCTCCCGACCCATACTTCTTGAAGAGGAGAGAATTTAAAATTGAACTCAATGAACCGACACACAGTAATGATACTGAGCCAGTCACAGCTCATCGCAGTCGCGGATCGGATTCCGACGAAGACGACAAACCTCTCGCTGAGTTCGCGGCCGGCAAGCCGTCAGATATATACAGAAACTTTTATAGAGCGTTAACAAAGTTTCGAGATCACTACGTTCAACATGAAATTAAGACAGATCGCTGCTCAGACTTAGCGAACTCGAGCGATTCGGAGGAGGAAAGAAACTGTGAAGACCTGGATCCGACTCAGTACGACGACCTCTCTAACAGCAACATGAGGAAAGACAAAATGAACGAGGAAACGCGACTCGAGCTCAGCCAGGTGCAGACGAAAATAAACGGGAAGACTTACTTCATCTGCAAAATCTGTGACAAGAAGCTGAGCTCGTCACACACTTATATTTTCCACAAGAGAATACACACGGGGGAGCGACCGTGCATCTGTCACGTGTGCGGTAAACAGTTCCGCGCGCCCAACGGACTCCAGCGACATCTCACCGAGACGCACGAACGACTGCGCCGGTACACATGCCAGATTTGCCACAAATCCTTCGCGAACTCGCAAAACCTCAAACAACACATGAGAATACACACGGGTGAGAGACCTTTCGTGTGCTCCCACTGTGGTAAGCGATTCACACAGAGTGGCTCGCTACATGTGCACCTCAAGACCCACAGTGCCACGCTCCCGCACGCTTGCCGGGACTGCGGCGCGAAGTTTCGTATGCGCTCCGGACTGACGCGGCACCGCCTCAAACACACCGGAGAGAGGCCGCACGTCTGCCGGCATTGCGGAAAAGGATTCAGACAAAAACATGAAATGAATGCGCACGCGCTCACGCACTCGGACAGCAAGCCGCACGTGTGCACCGTCTGCGGAACCGCCTTCCGCCAACGACGAGCGCTCCGCCATCACTGCAAACGACTACATGACAGCAAGCCCGCGGAAGACGCGCACGGCTACAACAACGCGATCAATTACATTCTGACATTGAACTCCAACAGCGAGACTAGCGAGTGCAGCATTTGCGGCAAGTCGGTGCCTCGCGCGAGTAAAGCGCGGCATAGACGTGCGCACGAAGCAGCGGGCACCCAACGCTACCGCTGCAGCGTGTGCGGGTGTGCCTTCTCAGACGGCGGCAACCTCGCTCGCCACGTTCGTGCCCTGCACGCCGCGCGTCGACCTCACGCGTGCCCACTCTGCCGCCGGACTTTCACACGCGCCGCTCACCTTGCCGACCACTTGCGTTCACACGACGATCGCAGGGATTACGTGTGCCACGTGTGCGGGAAAGCGTCTAAAACCGGCGCCGGACTGCGCTCACACCGCCGCGTGCACGCTGAAGAGTTCGAATTCGAGTGCCCGGCGTGTTCGGCGCGTTTTAAAACAGGCCGTCAGTTGCGCGCGCACGCCTCCGTACACACGGGTGAAAGGCCATACGCCTGCACCTGTGGAGCCGCCTTCCGCCTGCGCGCTCAGCTCACCAGACACGAGCGGACTCACACACGGACGAAAACAACCGCCGACTGA

Protein sequence:

>DPOGS212848-PA
MNGGTASDQLDELDIKCSGETHENLQDSPNICRICATVTDLVIPIFEGEGLQNNLAEKIHKHLPIKVSVQDVLPQVVCYQCSSTLLAWHELVQCCQQADQALRQQAAHRERKANEVTGTTSDPKALSLLTSSVRGVLSDYCQMLNINQETSDICYVCQECDGHPVSSSIENLSEHLQLVHKEVLISDELFGSDDLGEPAPQKELPNYSCPFCESMFSSPTRLIFHLNCHLEVCIDDGVYCCDQLFDNKTSFVSHLQSRHVRKVIESSYVCKSCGLTAGDLAELQKHINDNHPEAEDRYEKGKTEGSPKCQKFIPAVCSECNKTFSNKYNMLVHMRNHFGPASRFACGKCNKTYKSQGSLIYHHKVVHEGQLKFVCSSCGEAFPSRAARDVHARLHTGQRPFSCQYCGKAYRAKNTLYRHIDMHLNIRKYACNFCDRKFRKSTHLKCHLRTHERTTWIPSPDPYFLKRREFKIELNEPTHSNDTEPVTAHRSRGSDSDEDDKPLAEFAAGKPSDIYRNFYRALTKFRDHYVQHEIKTDRCSDLANSSDSEEERNCEDLDPTQYDDLSNSNMRKDKMNEETRLELSQVQTKINGKTYFICKICDKKLSSSHTYIFHKRIHTGERPCICHVCGKQFRAPNGLQRHLTETHERLRRYTCQICHKSFANSQNLKQHMRIHTGERPFVCSHCGKRFTQSGSLHVHLKTHSATLPHACRDCGAKFRMRSGLTRHRLKHTGERPHVCRHCGKGFRQKHEMNAHALTHSDSKPHVCTVCGTAFRQRRALRHHCKRLHDSKPAEDAHGYNNAINYILTLNSNSETSECSICGKSVPRASKARHRRAHEAAGTQRYRCSVCGCAFSDGGNLARHVRALHAARRPHACPLCRRTFTRAAHLADHLRSHDDRRDYVCHVCGKASKTGAGLRSHRRVHAEEFEFECPACSARFKTGRQLRAHASVHTGERPYACTCGAAFRLRAQLTRHERTHTRTKTTAD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: