MonarchBase - Protein-coding gene

DPOGS205904
Transcript	DPOGS205904-TA	3240 bp
Protein	DPOGS205904-PA	1079 aa
Genomic position	DPSCF300089 - 212220-224514
RNAseq coverage	590x (Rank: top 22%)

Annotation
*Heliconius*	HMEL013008	65.61%
*Bombyx*	BGIBMGA007089-TA	79.32%
*Drosophila*	crol-PE	69.16%
EBI UniRef50	UniRef50_E0VFL0	65.94%	Zinc finger protein, putative n=6 Tax=Arthropoda RepID=E0VFL0_PEDHC
NCBI RefSeq	XP_002424904.1	65.94%	zinc finger protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242008211	65.94%	zinc finger protein, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242008211	52.56%	zinc finger protein, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0003676	7.9e-13	nucleic acid binding
	GO:0008270	5.3e-06	zinc ion binding
	GO:0005622	5.3e-06	intracellular
KEGG pathway
InterPro domain	[662-689] IPR013087	7.9e-13	Zinc finger, C2H2-type/integrase, DNA-binding
	[671-693] IPR007087	5.3e-06	Zinc finger, C2H2
Orthology group	MCL10000		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205904-TA
ATGAATCAGGATCATCACAATATAAACACGGGTGGTGGCCAGCCACCAGGCAATTCTGAGCCTCAAACTCAGAGAGTTCAATCATCGCAGCAGCAACAGCAGCAGCAAACACAAAATAACAGTTTAACTCCCACAACATCTGCCACTGATTTACGGGTCAATTCGGCGGCAGTAAACGTTGCTTTGTCAAGCGTAGCTAAATATTGGGTGTTTACTAATTTGTTTCCGGGTCCAATACCTCAGGTGTCAGTGTATGGCGTGCCCACTGGTGCAAGAATTGAAAATGGAAAACCTGTACAGGATCTAGGTCAAGCGCATGCTAGTATCTTGAATGGTGATCCTAGTATTATACTAGGTCATGCAGGACAACCCCAGGTCACAGTATCAGCTGCGGGACAACAGATTCCTGTCTCCCAGATAATCGCAACTCAATCAACACAAGGACATGAGTCGCTGGTCGGTCACGGGTCGGGTGAATCGGGCGGTTCGCTGGCAACACCCTCGCAGGTACCCAATCGGGTCGAGTTTGTACAACATAACGTTGACATGGGTCACCACTCGCAGCAGCATCTGATGCAACAACAGCTAGCCATGGCAAGACCCGACCACGCCAATCAACAGATCCAGCTCACTGTGAGCGAGGATGGGATAGTAACAGTGGTGGAGCCGGGCGGAAACAAGTTGGTTGACAAAGAAGAACTACACGAGACTATAAAGATGCCCACAGATCATACACTCACTGTACACCAACTGCAACAGATTGTTGGACATCATCAGGTGTTAGACAGCGTGGTTCGCATCGAGCAGGCCACGGGCGAGCCCGCGAACATACTTGTGACTCAAAATCCCGACGGTACCACCTCCATAGAAACTAGCGCCGCAGACCCGTTGACGGTCAAGGATGAAAAAGGAACTAAAATGGAAACCGCACAGTTCGCCATACCAGCCGAAATCAAAGACATCAAGGGCATTGACCTTAAGAGTGCGATGGGTATGGAAGGCGCTGTGGTAAAGATATCAACTGGCTCCGAACAACACGATCTACACACCATGTATAAAGTTAATGTCGAAGATTTATCACAGTTGTTAGCCTATCATGAGGTCTTTGGAAAATTAAACACTGAGGGACAACCCCAAGCTAAGGTGATAAACGAGGTGGAAGTTGAGGCCGGAACTAGCGCTGCCATGTCGGAAGCGGAGTCATCTCCCGGCCATCATTCTTGTGATATATGCGGGAAAATATTCCAGTTCAGATATCAACTTATAGTACACAGACGGTACCATGGCGAAAACAAACCACATACATGTCAAGTGTGCGGGTCCGCTTTCGCTAATCCAGTTGAACTGTCCAAACATGGGAAATGTCATTTGGCGGGAGATCCGACCGAACGCCAGGCCAAACGTCTTGCTCAGGACAAACCGTATGCTTGTTCTACTTGCCACAAGACGTTCTCGCGTAAGGAACACCTCGATAACCACGTGCGAAGTCACACTGGAGAAACACCCTATAGATGTCAGTTCTGCGCCAAGACGTTCACTCGCAAGGAGCACATGGTGAACCACGTCCGTAAACACACGGGCGAGACTCCGCACCGCTGTGAGATCTGCAAGAAGAGCTTCACGAGGAAGGAGCACTTCATGAACCACGTCATGTGGCATACCGGTGAAACACCGCACCATTGTCAAATATGCGGCAAGAAGTATACTAGGAAGGAGCATTTAGTGAACCATATGAGATCCCATACAAACGATACTCCCTTCAGATGCGATCTGTGCGGCAAATCATTCACCAGAAAGGAACACTTCACCAATCATATATTGTGGCACACTGGTGAGACTCCCCACCGCTGCGACTTCTGTTCGAAGACTTTTACCCGTAAGGAGCATCTTTTAAACCACGTGCGACAACACACGGGCGAGTCTCCGCACCGCTGTAACTACTGCGCCAAGTCATTCACACGGCGAGAACATCTCGTGAACCACGTGAGGCAACATACTGGCGAGACGCCATTCCAGTGTGGATACTGCCCTAAGGCTTTCACTAGAAAGGATCATCTTGTAAACCACGTCCGGCAGCATACTGGGGAGTCTCCACACAAATGTTCTTTCTGCACGAAGTCTTTTACTCGCAAAGAACATTTGACCAACCACGTGCGTCAACACACAGGAGAATCTCCGCATCGGTGTATTTATTGCTCCAAATCTTTCACTAGAAAAGAACATTTAACTAATCACATTAGACAACATACGGGCGAGACTCCTCACAAGTGCACGTACTGTCCGCGTGCGTTCGCGAGGAAGGAACACCTCAACCAGCACGTGAGGCAGCACGTGGGCGACTCCCCGCACACCTGCTCCTACTGCCAGAAGACCTTCTCCAGGAAGGAACATCTAGTAACTCACGTCCGACAACACACGGGTGAGACTCCATTCAAATGCACCTTCTGCGCCAAATCGTTCAGTCGAAAAGAGCATCTAACGAATCACGTTCACCTTCATACCGGCGAAACGCCGCACAAATGCCCCTTCTGTACCAAGACGTTCTCGAGGAAGGAACACTTGACTAATCATGTTAGGATCCACACAGGAGAATCTCCACATCGATGTGAATTCTGTCAGAAGACATTTACCCGTAAGGAGCATTTGACGAATCATCTAAAGCAACACACCGGCGACACGCCGCACGCCTGCAAAGTGTGCTCCAAACCATTCACTAGAAAAGAACATCTCATTACTCACATGAGGTCCCACAGCTGTGGCGAGCGACCATATAGTTGTGGCGAATGCGGGAAATCCTTCCCTCTGAAGGGCAACCTATTATTCCATGAGCGATCTCACAACAAAAACAACGCAGCTAACAAGCCGTTCCGATGTGATGTGTGCTCCAAAGAGTTTATGTGCAAAGGTCATCTAGTAACACATAAGAGAACTCACACGGACACTGAAACACCGGCCGCTGAAACGGCTCCAGAAGATGATTGCGGAGATTTCACTAAATGCGAAAAAGACGCTGATAGACCTGAACGAAAGCACGATATTAGGACAACAACAGAAAATAGACCAGCGGAAACGAATGTCACAAGCAATCAGCCAACAAATACAGCAGTGATGCAAATAACTAGCCAGGAAGTTAGAACGTGCCCCACAACAAGCACGCCATCTGTTGCCGGTACATACACACATACAAATACCCATCACAGTGGAACGATAACACACCATCCAGTGTCCGTGAATTACTAG

Protein sequence:

>DPOGS205904-PA
MNQDHHNINTGGGQPPGNSEPQTQRVQSSQQQQQQQTQNNSLTPTTSATDLRVNSAAVNVALSSVAKYWVFTNLFPGPIPQVSVYGVPTGARIENGKPVQDLGQAHASILNGDPSIILGHAGQPQVTVSAAGQQIPVSQIIATQSTQGHESLVGHGSGESGGSLATPSQVPNRVEFVQHNVDMGHHSQQHLMQQQLAMARPDHANQQIQLTVSEDGIVTVVEPGGNKLVDKEELHETIKMPTDHTLTVHQLQQIVGHHQVLDSVVRIEQATGEPANILVTQNPDGTTSIETSAADPLTVKDEKGTKMETAQFAIPAEIKDIKGIDLKSAMGMEGAVVKISTGSEQHDLHTMYKVNVEDLSQLLAYHEVFGKLNTEGQPQAKVINEVEVEAGTSAAMSEAESSPGHHSCDICGKIFQFRYQLIVHRRYHGENKPHTCQVCGSAFANPVELSKHGKCHLAGDPTERQAKRLAQDKPYACSTCHKTFSRKEHLDNHVRSHTGETPYRCQFCAKTFTRKEHMVNHVRKHTGETPHRCEICKKSFTRKEHFMNHVMWHTGETPHHCQICGKKYTRKEHLVNHMRSHTNDTPFRCDLCGKSFTRKEHFTNHILWHTGETPHRCDFCSKTFTRKEHLLNHVRQHTGESPHRCNYCAKSFTRREHLVNHVRQHTGETPFQCGYCPKAFTRKDHLVNHVRQHTGESPHKCSFCTKSFTRKEHLTNHVRQHTGESPHRCIYCSKSFTRKEHLTNHIRQHTGETPHKCTYCPRAFARKEHLNQHVRQHVGDSPHTCSYCQKTFSRKEHLVTHVRQHTGETPFKCTFCAKSFSRKEHLTNHVHLHTGETPHKCPFCTKTFSRKEHLTNHVRIHTGESPHRCEFCQKTFTRKEHLTNHLKQHTGDTPHACKVCSKPFTRKEHLITHMRSHSCGERPYSCGECGKSFPLKGNLLFHERSHNKNNAANKPFRCDVCSKEFMCKGHLVTHKRTHTDTETPAAETAPEDDCGDFTKCEKDADRPERKHDIRTTTENRPAETNVTSNQPTNTAVMQITSQEVRTCPTTSTPSVAGTYTHTNTHHSGTITHHPVSVNY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: