MonarchBase - Protein-coding gene

DPGLEAN01964 in OGS1.0

New model in OGS2.0	DPOGS210630
Genomic Position	scaffold600:- 39811-42586
	See gene structure
CDS Length	2181
Paired RNAseq reads	889
Single RNAseq reads	2420
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA013636 (2e-23)
Best Drosophila hit	crooked legs, isoform A (1e-32)
Best Human hit	putative uncharacterized zinc finger protein 814 (2e-39)
Best NR hit (blastp)	hypothetical protein TcasGA2_TC000840 [Tribolium castaneum] (1e-45)
Best NR hit (blastx)	hypothetical protein BRAFLDRAFT_61400 [Branchiostoma floridae] (3e-54)
GeneOntology terms	GO:0005622 intracellular GO:0006355 regulation of transcription, DNA-dependent GO:0003676 nucleic acid binding GO:0008270 zinc ion binding GO:0046872 metal ion binding
InterPro families	IPR007087 Zinc finger, C2H2-type IPR013087 Zinc finger, C2H2-type/integrase, DNA-binding IPR015880 Zinc finger, C2H2-like
Orthology group	MCL39212

Nucleotide sequence:

ATGGCTTCGCACACACAACCCAATAGACCCAGCTCCATCATGAGCCCAAAACCTACTACA
ATCGATTTAGTCGGCGGAATCTACTGTAACATATGTAATTTGATATATGCAAATAAGAAG
GATTACGACCTACATTACACTAAACACGAAACTGGCAGCAAGGACATAGTTTACACTTGC
GTAGTGTGTAGAAAAGAAATCTCAGGCTATCCAAGCTTTCGTGGTCATTGTTACACAAGT
CATGTCATCAAAGAGAGATTTAAATGTGAACACTGTTCAAAATTATTTTCAAAGTTTGCT
TCACTACGAGAACATGTCATGGTAATGCATAGATTCAGATGCAACACTTGCAAGAAGGAA
TTTACATCAAAAAAAGAATTGAAATTGCATGAAATTATTCACAATGACAACGACAGTCCT
CCTTATGAATGTAAAGCGTGCGGTGAGGAGTTAGACACTCTGGAAGACTGCAAGAATCAT
ATAGACGTACACTCAGCATTCATATACTTTTGCCCCATATGTAATGAAAATATATCAAAT
AAAGAAAACTCCAGTGAGCATTTGAAGAAACATTTTGGACATGTGATTAATACAAATACT
ATTGAAACACAAAAGAGTCTGGACAAAGAGGAAAATTCAGTTGAGAGATTGGGCGGGATT
TCGTGTAGTTATTGCTCCCAGACTTACAAGAACCGTATGGAATTTGATGCCCACTTCTCA
TGCGACCACGGAGACAAAGATATCATATACAGCTGTATTGTGTGTGCAAAGCAGTTTGAG
AAGTATTCCGTATTTAGTCATCATGCTTACAATCACTTCACCAAAGGAAGATTTTGTTGT
GACATATGCCGGAAGACATTCAACCGTCTCTCCCTGCTGGTGACTCACACGGCCGCCTGT
CAGACCGATGCCGAATGTAAGGGGAAGCCGTTCACTTGCTATCAGTGTGGACACCGCTAT
GTGACGGAGATGAGGCTGAGGGAACATCTGAGGGATATACACGGTGTACACTGTGTCATC
TGTCCGGAGGAAGGCTGTCAGGAAGTATTTGCCACACCAAAAGAATTGGTATTCCACCAA
CGTGCGCACCAATCCGACCGGAACTGGTGTCGCCAGTGTGGCCTGTTGTTCACCGGCCTC
GCCTCCTGCGAGCGACATCTCGACGTCCACAAGAAGAAGCTGTATGTGTGTCCGGTCTGC
AACAAGAACTACAGCGAGAAGCATCTCATACTGAAACATATCTCACAACATTTTGAAACT
GTTTTGCACATTTGCAAAGTGTGCGGGAAGGTCTACAACGCCAAGAATCGTCTGATCGAA
CACTTCAAGTCGCACTCCGAGAACAAAACCCACAGTTGCACCTACTGCGACAAGAGTTTC
GTGAAAATTGGCCAACTGCAGCAACATCTGAACATACACACGGGCTCCAAGCCATACAAG
TGTCCGGTCTGCTCGAAAACGTTCGCCAGCTATCCCAACTGGCATAAACACTTGCGTCGA
ATGCACAACGGCGACGGAAAAAATTACAAGAAACCAGATATCGACAACGAAGAAGAGAAC
ATCCACGATGAGAACGTGGAAGAATATCCTGGCGCCGATAGAAGTGTACAGAAGACAGAC
GCGTCTCGAGAAGACAAGCACACGCACCTCAAGGTAGACGCGGAACCGGCTGGTAATAAG
GAATCCAGACTGGACACATACATCTATTACGAACCGAACGACAGCACCATGGAGTCGGAC
AGCATCGATCACGCCGTCATCGAGAAGGAGTTGGAAATATTCGAGAACACAAACGACGAG
AGTATCGGCAACATCACGAAGTTTGTCAACGTCTTGGCCACGAACAATACGGTGTGCGTT
GGCGAGAGTTCCGAGTCGTCGGCAGCCAGCGCCTTCCCCGCCGAGTACGGGCCAGAGTTC
AGCGGGGTCATCGACCTGGACGACCACATGTTGCCTCACATCGATCCGCTGCTCATCAAC
AGCCAGCCGCCCCCGCCCTACGACCAGTTGGCCGACTCGTTGGTCGACTCACTGGCCGAC
TACACCGACAACTTCGCCGAAGCCTACGCCCCACCCAAATGGGAACCCATCATCACCAAG
GTGTACCAGGACTACTCCTACGGTTACGGAGAAATGGTCGAGTCCAACCGACTGTCCATA
ATGAACACAGATATATTTTGA

Protein sequence:

MASHTQPNRPSSIMSPKPTTIDLVGGIYCNICNLIYANKKDYDLHYTKHETGSKDIVYTC
VVCRKEISGYPSFRGHCYTSHVIKERFKCEHCSKLFSKFASLREHVMVMHRFRCNTCKKE
FTSKKELKLHEIIHNDNDSPPYECKACGEELDTLEDCKNHIDVHSAFIYFCPICNENISN
KENSSEHLKKHFGHVINTNTIETQKSLDKEENSVERLGGISCSYCSQTYKNRMEFDAHFS
CDHGDKDIIYSCIVCAKQFEKYSVFSHHAYNHFTKGRFCCDICRKTFNRLSLLVTHTAAC
QTDAECKGKPFTCYQCGHRYVTEMRLREHLRDIHGVHCVICPEEGCQEVFATPKELVFHQ
RAHQSDRNWCRQCGLLFTGLASCERHLDVHKKKLYVCPVCNKNYSEKHLILKHISQHFET
VLHICKVCGKVYNAKNRLIEHFKSHSENKTHSCTYCDKSFVKIGQLQQHLNIHTGSKPYK
CPVCSKTFASYPNWHKHLRRMHNGDGKNYKKPDIDNEEENIHDENVEEYPGADRSVQKTD
ASREDKHTHLKVDAEPAGNKESRLDTYIYYEPNDSTMESDSIDHAVIEKELEIFENTNDE
SIGNITKFVNVLATNNTVCVGESSESSAASAFPAEYGPEFSGVIDLDDHMLPHIDPLLIN
SQPPPPYDQLADSLVDSLADYTDNFAEAYAPPKWEPIITKVYQDYSYGYGEMVESNRLSI
MNTDIF