DPGLEAN12192 in OGS1.0

Genomic Positionscaffold175:- 81549-88339
See gene structure
CDS Length5562
Paired RNAseq reads  424
Single RNAseq reads  798
Migratory profilesQuery via corresponding ESTs
Best Bmobyx hitBGIBMGA001143 (7e-20)
Best Drosophila hit  ND
Best Human hitND
Best NR hit (blastp)  conserved hypothetical protein [Culex quinquefasciatus] (5e-19)
Best NR hit (blastx)  cell surface glycoprotein (predicted) [Schizosaccharomyces pombe] (4e-26)
GeneOntology terms  ND
InterPro families  IPR002557 Chitin binding domain
Orthology groupND

Nucleotide sequence:

ATGGAATTTTGCATTATTGGATTCAAAAACTTTTTAATATTTGTGTTAATTTTAATGCTG
CCGTGCGTAGCGTGCTCAAATATTGACTGCAATGGGAAAGCTTTTCACTGCGTGAATTCG
ACACATTTCAAGATATGCGTTGATTTTGGCGGAGGAATATCGACGACTGTGGACGAATAT
TTAATTCCGTGTCCACAAGATACAGTGTGTAAATCATATAACCTATATGAATGTGAGTAT
GAGAAAACGACCACTTCTTCTACAGTGACAGTGCAAAGTGAAGTAACGACCGAAGTGATT
GAAAGTATTGGTGTGTCCTCTGGGGAATATTCGGATGTAACAACAGTATTTCCTACAAAT
CAGGAGCAAGCGCATACCCATTTCCCTGATGACAAAGTAATGTCGCCTACAGAAGGTGTA
ACTTTAAGTACAGAAGCGAATAACGAATCTCGGACTTTGGTGTTGAAAGACTTGGAAGAC
TTTTACGAAACCAATAGATTAGGTGGTGCCCTGACATCGTCGTTGTTCCCAAATACTACT
ACAGTTACAACCGAGACAATATCATATCAGACCACCAAAGATGAAATTACTATTACTACT
TTTGATCACTTAGCTAAAGAAACAACTCCAAAATTTGAATCCTCTTCTAACCCTACATTG
ATTTTGAATACAACAACAACAACATTTGATAAAGCTGACTTATTTGCGACGATAGAGGTT
GAAAAAGCAGCACCTGGGACAAAACTAGATGTGACCAACGAAATACGACCGATTATTTTG
GGTGATCCAAACGTATTATTACAAGAAAACACTTCAAAAAGCTTGTCTACCCTGACTACA
GAATCTGTACCTTATAAGAAAATTGAACTTGGAAATCATACTTCTACGGAGGTACATACA
ACGCCGGCTGCGACAACAGTAGATGTGATCCACGAAATACTACCAGTTGTTTTAAGTGAT
TCAGACGTATTATTCAAAGAAAACACTTCAAAAAGCTTGTCTAACCTGAGTACTGAATCT
ATACCTTATAATAAAATGAAAGTTGAAAATCGTACTTCTACGGAGATACATACAACGCCA
GCTGCGACAACAGTAGATGTGATCAACGAAATACGACCAGTTGTTTTAAGTGATTCAGAC
GTATTGTTCAAAGAAAACACTTCAATAAGCTTGTCTAACCTGAGTACTGAATCTATACCT
TATAATAAAATGAAAGTTGAAAATCGTACTTCTTCGGAGATACATACAACGCCGGCTGCA
ACAACAGTAGATGTGATCAACGAAATACGACCAGTTGTTTTAAGTGATTCAGACGTATTG
TTCAAAGAAAACACTTCAATAAGCTTGTCTAACCTGAGTACTGAATCTATACCTTATAAT
AAAATGAAAGTTGAAAATCGTACTTCTTCGGAGATACATACAACGCCGGCTGCAACAACA
GTAGATGTGATCAACGAAATACGACCAGTTGTTTTAAGTGATTCAGACGTATTGTTCAAA
GAAAACACTTCAATAAGCTTGTCTAACCTGAGTACTGAATCTATACCTTATAATAAAATG
AAAGTTGAAAATCGTACTTCTTCGGAGATACATACAACGCCGGCTGCAACAACAGTAGAT
GTGATCAACGAAATACGACCAGTTGTTTTAAGTGATTCAGACGTATTGTTCAAAGAAAAC
ACTTCAATAAGCTTGTCTAACCTGAGTACTGAATCTATACCTTATAATAAAATGAAAGTT
GAAAATCGTACTTCTACGGAGATACATACAACGCCAGCTGCGACAACAGTAGATGTGATC
AACGAAATACGACCAGTTGTTTTAAGTGATTCAGACGTATTGTTCAAAGAAAACACTTCA
ATAAGCTTGTCTAACCTGAGTACTGAATCTATACCTTATAATAAAATGAAAGTTGAAAAT
CGTACTTCTACGGAGATACATACAACGCCAGCTGCGACAACAGTAGATGTGATCAACGAA
ATACGACCAGTTGTTTTAAGTGATTCAGACGTATTGTTCAAAGAAAACACTTCAATAAGC
TTGTCTAACCTGAGTACTGAATCTATACCTTATAATAAAATGAAAGTTGAAAATCGTACT
TCTTCGGAGATACATGCAACGCCGGCTGCGACAACAGTAGATGTGATCAACGAAATACGA
CCAGTTGTTTTAAGTGATTCAGACGTATTGTTCAAAGAAAACACTTCAATAAGCTTGTCT
AACCTGAGTACTGAATCTATACCTTATAATAAAATGAAAGTTGAAAATCGTTCTTCTACG
GAGATACATACAACGCCGGCTGCAACAACAGTAGATGTGATCAACGAAATACGACCGATT
ATTTTAGGTGGTTCAGACGTATTATTGCCAGGAAACATTTCAATAGAGTTGATCAAAGTG
AGTACAGAACCTATATCTTATAATAAAATAGAAGTAGAAAAACATATTCCTACTGAAACT
CCTTTGTTGTTCCATTCAACAGCAGATGCAACAGCAGATGCAAACGAACCTTATTCTGAT
TTAAATATCCTAGACTTCCCGATGAAACCGGAAAGTCGAAAAGGCGGTATGAGTTTTAGT
TCATCTTTAGGTACTACAGCTTCAACTAACTTTTTCACTTCCAATACTCTTTCTAATGAG
TTGACTATATACCCACTAGCATTGTCAGAAAATAAACATAAAGTTTTGCCTGCTAATAAT
ACGAAAACTTTAGAGACAAGCCAGAATGGTTTAAAATTAAAAGAGCCCGTATCCATTATA
ATAGAAAAAAGAGATAAAAACGAAATTGAGTCGCTCAGAGACAATTTAACGTTTACAAAT
GGAGATAATTTGACAAAGTTTTTGATTGAAAACCCATTAATTAAAGAATCGACAGTTAAT
TTAACCAAAATAAAATCTATACAAGATTCTATGTTGGTAACCCGTAAAGGTGAGACAACA
GTTGATGGATTATTATCCATAACTACTCCACTAGCTGTTCAACAACATGTATCAAAACCT
AATACAGATGTATCAACCGAACCAAAAGCTTTACAATTGAAGGAGCCCCGATTTCCTCTC
TCTTTGAGTTATTCAGAAAAGAACAATCCTTCAGATAATGCCACGTTTTCAACAAATTTG
GAAAAACCAATGATTTTGTCAAATGTAACCACAAGCTCGAATGCATCTGACTTAAATGGA
TCATTTGATTTTATTTCGACATACCTTCACAATGAGAGTGTAAGAAGTATTGATGCAGAC
AATTTAAAAATTTATAAAAACCAAAATATTATAAAAAAATCAACTGAAATTTACGATTCT
TTTAATGAAGATTGGTCTGATACGACAACTGAAATTATTAAAAAAACTACAACTATGGGC
AAAAATTTTTCCGAAACAGGTCCATCAAAGAATTTTATAAATATATACAATGTTAGATTT
CCAAATATAAATATTAAAGATTCTTCTACGTTTCCCTTAAAAGTTTCGAATGACTTTAAA
TCCAGCTCTATAAATGTAGATATGACAACAGAATATAGATTAACGTCTAAGAGTAATGAG
AACCAAAATGTTACTCAATATGAAAAAGATGTCATTTTAACCATAGATTCTTTAACTCCT
ATTAATTCAAACGTTTCTACCTTGGATCATGTTTTAGCGGATACAACTAAGACGAGTACA
TTCGATAACATATTTAAGGTTGCAAATTTTACTAAGTCGATTACAGAAACCAAACGAGTA
GTAAAAGTACCAATTTCTATTAATGATAAAATTTTTGAAGAACAGAATATAATTGAGAAA
AACAGAAACATAACAACAGTAACAGAGGGCAAAAACCCGGAGAGTTATTATGTAGAAGAA
AAACTTTTTCCTGTAGAAATTATCTCGGGTTGGGAGAATAACGGCACTGAAAAAAATATA
TTAACGTCAGTTACTGGTAGTTACCAAAGTTCTTTTAAAAGTTATTTTACGAACGTCACC
AATTCTGCTCAGCGTTTTTTTACAGAAGAAATATCTACAGCGACAATAGCTAATGACTAT
AGTGCAAGAGGGAAATTTCATGAAAATGAATATAATACAGAACAATCCGTAAATGGGCAA
CTACTAACCCAGGTAGAGGGTCTTAATGTTGAATATTCAAACAAAACTGTCAATCTATCA
CTGAACTCAAACACTACTAAAGCAGTCAAAGAAAAAGATTATCTGTATAACTCACCTGAT
TCCCCAACAACTAACAGCAATAATAAAATGATTGATCGTAATTCAAAAAAGAAACTGGAT
AGCTTTAATAATGTTAAATATGATACAATGCAAAATAAATCAATATTCGCCGATGTTATT
GACCGCAACGAAATAATTAATCAATCGAATTCATCTAATACTAACAATTCGTCAGATTTT
TTTTTTAAATACTCGTCAAAAATACAAACATCTTTGCCCGAGATAAATGAAACATATAAG
TTAGACCGTCATAATGAATCAAGTGACCACCGTGCCTTAAACGCCAGCTATTATGATCAT
TTAAAAAATACTGGTAACGCAAATACCAATGACAATAAATTATTACTTTCGTCTGTGTCT
AAAACAAGTTTAAGCAAAGATGTGACAGACACACTATCTCCATCGATCGATGAATCATTA
TCTGGAAAAACATTTGTAGAAACTCAAACTACTGGAACATCACTTCCCTATTCCGAATCT
ACGTTAAATTATTTGGATACCGAAAAATTTTCTGCAGATTCAATAAATTTAGGTTTAGAC
GTTAACTCAACAAGAACATCAACAACAAAGGAAAAACTAATACACAGTGATTTAATCGAT
TCTTTGGCTACGACCCATTTTTACTACAAAGCAACCACCAAGCCAACAATTAATAAAGTT
ACTAAAATTATTAATGAAAATAAAACAAATATTATCTCTAAATCAACCGATAGAACAGAA
CAACCTAATGATTATACTGGAGTAATAAAAATTGTACCCGAATTTGTATGTGTCCAACGT
GGAAAGTACTCTGATCGCTTTAATTGTAATAAATTTTACTTATGCATTGGACTACCTAAG
CCACTAATACGCGTTTGCCCTCCTAATACTGTATTCAGTGAATTTTTAAAACAATGTACT
AAAAATGTTGCACATTGCATAAGAAATAATCAGTTTAAATGTACGACCAACGGCAGATTT
AATAATATATTATCGAACAACAGTTACTTTATTTGTGTTAAGAAAAATAATGGGTTCATA
AGATTTACATTACAATGTCAAAAAGGTTACTATTTAGATAAAAGAAATACAAAATGTACC
CAAGAATCACTTAGCATGTCTAAATCAGAAGAAAATAATTCGAAGAATACAAAAGAAGTA
TCTGTTGAAAAGTCCAAGGAAGGATTTGCTAAGAAAGATTATTTCGAATGTGAAAGAGAA
GGCAAATTTGAAGATCCAGAGAACTGTAGAAAATATTACGTATGTAAGAAAGCTAGAAAC
TCAACATTTAGGCGTAAGATAAAAGCATGTGACTCCGATGAAGTGTTTCATAAGAAGAAA
GGGAAATGTGTAGACGAAGAAAGCTATGAATGTAACATTTAA

Protein sequence:

MEFCIIGFKNFLIFVLILMLPCVACSNIDCNGKAFHCVNSTHFKICVDFGGGISTTVDEY
LIPCPQDTVCKSYNLYECEYEKTTTSSTVTVQSEVTTEVIESIGVSSGEYSDVTTVFPTN
QEQAHTHFPDDKVMSPTEGVTLSTEANNESRTLVLKDLEDFYETNRLGGALTSSLFPNTT
TVTTETISYQTTKDEITITTFDHLAKETTPKFESSSNPTLILNTTTTTFDKADLFATIEV
EKAAPGTKLDVTNEIRPIILGDPNVLLQENTSKSLSTLTTESVPYKKIELGNHTSTEVHT
TPAATTVDVIHEILPVVLSDSDVLFKENTSKSLSNLSTESIPYNKMKVENRTSTEIHTTP
AATTVDVINEIRPVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRTSSEIHTTPAA
TTVDVINEIRPVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRTSSEIHTTPAATT
VDVINEIRPVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRTSSEIHTTPAATTVD
VINEIRPVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRTSTEIHTTPAATTVDVI
NEIRPVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRTSTEIHTTPAATTVDVINE
IRPVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRTSSEIHATPAATTVDVINEIR
PVVLSDSDVLFKENTSISLSNLSTESIPYNKMKVENRSSTEIHTTPAATTVDVINEIRPI
ILGGSDVLLPGNISIELIKVSTEPISYNKIEVEKHIPTETPLLFHSTADATADANEPYSD
LNILDFPMKPESRKGGMSFSSSLGTTASTNFFTSNTLSNELTIYPLALSENKHKVLPANN
TKTLETSQNGLKLKEPVSIIIEKRDKNEIESLRDNLTFTNGDNLTKFLIENPLIKESTVN
LTKIKSIQDSMLVTRKGETTVDGLLSITTPLAVQQHVSKPNTDVSTEPKALQLKEPRFPL
SLSYSEKNNPSDNATFSTNLEKPMILSNVTTSSNASDLNGSFDFISTYLHNESVRSIDAD
NLKIYKNQNIIKKSTEIYDSFNEDWSDTTTEIIKKTTTMGKNFSETGPSKNFINIYNVRF
PNINIKDSSTFPLKVSNDFKSSSINVDMTTEYRLTSKSNENQNVTQYEKDVILTIDSLTP
INSNVSTLDHVLADTTKTSTFDNIFKVANFTKSITETKRVVKVPISINDKIFEEQNIIEK
NRNITTVTEGKNPESYYVEEKLFPVEIISGWENNGTEKNILTSVTGSYQSSFKSYFTNVT
NSAQRFFTEEISTATIANDYSARGKFHENEYNTEQSVNGQLLTQVEGLNVEYSNKTVNLS
LNSNTTKAVKEKDYLYNSPDSPTTNSNNKMIDRNSKKKLDSFNNVKYDTMQNKSIFADVI
DRNEIINQSNSSNTNNSSDFFFKYSSKIQTSLPEINETYKLDRHNESSDHRALNASYYDH
LKNTGNANTNDNKLLLSSVSKTSLSKDVTDTLSPSIDESLSGKTFVETQTTGTSLPYSES
TLNYLDTEKFSADSINLGLDVNSTRTSTTKEKLIHSDLIDSLATTHFYYKATTKPTINKV
TKIINENKTNIISKSTDRTEQPNDYTGVIKIVPEFVCVQRGKYSDRFNCNKFYLCIGLPK
PLIRVCPPNTVFSEFLKQCTKNVAHCIRNNQFKCTTNGRFNNILSNNSYFICVKKNNGFI
RFTLQCQKGYYLDKRNTKCTQESLSMSKSEENNSKNTKEVSVEKSKEGFAKKDYFECERE
GKFEDPENCRKYYVCKKARNSTFRRKIKACDSDEVFHKKKGKCVDEESYECNI