MonarchBase - Protein-coding gene

DPGLEAN10188 in OGS1.0

New model in OGS2.0	DPOGS213896
Genomic Position	scaffold1130:- 35786-48198
	See gene structure
CDS Length	1419
Paired RNAseq reads	1966
Single RNAseq reads	5918
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA004632 (2e-16)
Best Drosophila hit	mitf, isoform B (2e-45)
Best Human hit	transcription factor E3 (8e-38)
Best NR hit (blastp)	PREDICTED: similar to CG17469-PA.3 [Apis mellifera] (6e-75)
Best NR hit (blastx)	PREDICTED: similar to CG17469-PA.3 [Apis mellifera] (8e-72)
GeneOntology terms	GO:0005634 nucleus GO:0001745 compound eye morphogenesis GO:0030528 transcription regulator activity GO:0045449 regulation of transcription
InterPro families	IPR001092 Helix-loop-helix DNA-binding domain IPR011598 Helix-loop-helix DNA-binding
Orthology group	MCL12826

Nucleotide sequence:

ATGACCAAGGGCCCTCGGAAAGTGAAGCTAGTCATAGTAGTCAACAATAAAAAAGATCCG
CCCACATTCAAAACCTTAACGCCCACATCCCGCACGCAGCTTAAACAACAGTTGATGAGA
GAGCATGCCCAGGAGCAACTACGGAGGGAATCGTTACAGGTGCGAACAGTTTTGGAGAAT
CCCACCAGGTATCACGTGATCCAGAAGCAGAAGAGCCAGGTGCGCCAGTACCTCAGCGAG
TCATTCACACCACAAACGCAGGTGTCAGCTGTCCGTGGTCCGGTGCAGAGCGCCCCGGAG
CTAAGGTCGTCATCACCAGAACGTGGAACTGTCCTCAGTCCAGGACTATGCTCGGCAGGA
AACTCAGAAACGGATGAATTTCTGGATGACATCCTATCCCTGGATAGCGGGGCTGGTCCC
CTGTCGTCTTCGGAGCCCCCCTCTACAGCCAGCTCCGTGGCCGGGGACTGCGCCCTCTCA
GACGCAGACATGCACGCGCTCGCTAAGGATAGACAGAAGAAAGACAACCATAATATGATC
GAACGCCGCCGTCGTTTCAATATAAACGATAGAATTAAAGAGTTGGGTACCTTACTGCCC
AAAACGAACGATCCCTTCTACGAGGTGATACGGGACGTGCGACCTAACAAGGGGACCATC
CTCAAGAGCAGCGTCGACTACATCAAGTGTCTGCGGGACGAAGTCAACAGGCTCAAGCAG
AGCGAACAGAGGCGGAAACAGATTGAGCTGCACAACCGGAAACTCATGCTGAGGATACAG
GAGTTGGAACGTCTGGCGAGAGTTCATGGACTTCCGGTCAATGAAAGCTGGTCGGCATCA
CAGGAGGACTCGGGGGTCGAAGCCTCCCCGGAATGTTACACTGACAAGAACCCAGTACAC
CAAGAGCCTCCAGCTGTGCAGCCCAAGAGTGAACCAGCGCCGATGGAACTGTCCGATGGA
AGGGACGCCCTTGCAGCACTCACAGCGCTTGACGGTTTGAAGCTGGGCTCATGTTCTCCC
CTGGACCGCGGAGCATCTCTGTCCTTGGACTGCCTGGAACCAGACCTCTGTCTCGACACA
CCTGGAGACCTCTTCCACAAAGATATCAAGCAGATGCGTTTGTCACCCACGGCTGGTCTC
CTTGATGATGAAGCGGTGATGAACCTGGCTCAGATAGAAGACCTCATGGATGACGACTCA
CACAATCCCGTCACACAGGGTGACCCGATGTTGTGTTCGTCGCCGAGCGCGATGGGGCCG
GCGGGAGATTCGTCCTGCGCCATGCTGCACATAGACCTCGCGCTGCACAACACAGACTAC
GGCTCACGATCTCTCCTGTCCGAGCTGAGTGACGGCCTGCCTCTGTTGATGGGTGCTCCG
CCCCCCCGGGCCTGCTTCGACATGGATCTAGGGGCGTAG

Protein sequence:

MTKGPRKVKLVIVVNNKKDPPTFKTLTPTSRTQLKQQLMREHAQEQLRRESLQVRTVLEN
PTRYHVIQKQKSQVRQYLSESFTPQTQVSAVRGPVQSAPELRSSSPERGTVLSPGLCSAG
NSETDEFLDDILSLDSGAGPLSSSEPPSTASSVAGDCALSDADMHALAKDRQKKDNHNMI
ERRRRFNINDRIKELGTLLPKTNDPFYEVIRDVRPNKGTILKSSVDYIKCLRDEVNRLKQ
SEQRRKQIELHNRKLMLRIQELERLARVHGLPVNESWSASQEDSGVEASPECYTDKNPVH
QEPPAVQPKSEPAPMELSDGRDALAALTALDGLKLGSCSPLDRGASLSLDCLEPDLCLDT
PGDLFHKDIKQMRLSPTAGLLDDEAVMNLAQIEDLMDDDSHNPVTQGDPMLCSSPSAMGP
AGDSSCAMLHIDLALHNTDYGSRSLLSELSDGLPLLMGAPPPRACFDMDLGA