DPGLEAN21831 in OGS1.0

New model in OGS2.0DPOGS213807 
Genomic Positionscaffold461:+ 58363-62172
See gene structure
CDS Length3810
Paired RNAseq reads  298
Single RNAseq reads  846
Migratory profilesQuery via corresponding ESTs
Best Bmobyx hitBGIBMGA006548 (0.0)
Best Drosophila hit  CG8777 (4e-72)
Best Human hittetratricopeptide repeat protein 37 (4e-86)
Best NR hit (blastp)  PREDICTED: similar to tetratricopeptide repeat protein 37 [Tribolium castaneum] (2e-164)
Best NR hit (blastx)  conserved hypothetical protein [Pediculus humanus corporis] (2e-156)
GeneOntology terms  GO:0005488 binding
InterPro families

  
IPR019734 Tetratricopeptide repeat
IPR013026 Tetratricopeptide repeat-containing
IPR011990 Tetratricopeptide-like helical
Orthology groupMCL15836

Nucleotide sequence:

ATGGCTGATGTTAAATCACTTTTAAAAGAAGCAAGAAAATTGATTGATGATAAAAATTTT
AAAGAAGCTCAGGAATGTTGTAAGAACATATTGCGAAAAGACAAAAATAATTATTTAGGT
TTGGTACTGCTGGGAAAATCATTAGCAGAATCTGATCAGGCTCCATTGGCATTTCAAAAA
GCTATATCTAGTAAACCAGATCATCCTTTAGCATGGCAAGGTCTAGCTAATTATTATGAA
AAAAAAGCAGATGCTACAGCTATAAAAAAACTTTTAGCAGTGTATGATGAAATTTTGAAA
TTGCAAATAGATCAGGAGAAAGCATTAGAAATTGTTTCCAAAGTTGGTCAACTTGGTTGC
ATACATAAAGATAACTTAGCAATTAGCATTCTAGTTAACTATATGAACAGAAAGATGGAC
ATGTATACAGTTGCTGAAAAAGAATTATTAGGTCTATTGAAAGCCGATATTATATGTAAA
GAGGAAGACATCCCAAATGTTGTGAATATTATACGCAAAATAAATGACAGAGAGCCAAAT
GACTCCATTCATATTTTGCTAGGAAAAGTAATTTTACAAAAAAGTGAATTTGAACAAGCT
ATGAAAGAGGTCATGGAATTGCCTTATTTTACTTCTGGTGTAGTATTTCGTGATTGGCTC
TGCAAATACCTATGTACATATTATATTCAAAATAACTCATTCAAGTTTGATTTAGAAAAA
TATTTCAATGAAATAACTTTGGGAATTGAAAATTCGAAGTATCCTGGACTCTTAAAAAGT
ATGATTCTCTTTGACAAGCAATTATATCTGGAGGCTTACAAACAATGTGTTCCACTTGTT
AATTATAATGAAGCTGATTTGACTGAAGTTACATTTATCATTAAGTGTACCTTTATGTTG
AAGAAATGGTCAGTGTCCCAAAAGCTTTCTACAAACTTCTTGATGAAGGTAAAAGATAGT
GACTTCGCAATCACTTTAAGAAAATTTTTGTTTTTATCATTGGTAGAACAACAAAAATGG
AAGCAAGCTATTTCATTGTCCCGAGAAATTCCTTTTGAATCTTTGGATTTAAGTGAGCAA
GCGGCTCTCGCCAAATGTTACCTTGAAAATAATGAAGATATGGATGATCACTTGAGACAG
AATCTTGAGACTACTCACTACTTTACACAGCTGGAAGCTCTGTCATTAATCAAACATAAA
AAATACAATGAAGCCATTTCATTGTTAGAGAAAAAACCTGAAGATCCTTTGAGTTTCTTC
TATATAGGCAAAGCGTATTGGGAATTAAAAGAGTATGAAAAATCTCAAATAAACCTTTTA
AAAGCTGCAAAATTGAATGCTGATCATACAGAAACATTTTTGTATTTAGGGATGTTCTAT
CAAAACCACAAGAATGATTTTGCAAAGGCTAAAAAATGTTATGAAAAAGCTTATAGTTTA
GACAGCACAAATATCAATGTTATTAAAAATCTAAGTGATATTTATGTTGAATTGGAACTA
AAAGATTCAGATTTTGAATTATTATTGAAATCTAGTCAGTCTGTACAGACAGAATTTGAG
TGGGTAACTTTTCGTCTCGGTTTATATTATATAAATAAAAGAGATTGGGAGAATGCTATT
TTACAATTTCGTCATGTGATCAAACATAATCACAAAAATGTTATAGCATTTGAATGTCTG
GCTGATGCATATTATTCAAGGGGATCATTTACATCTGCATTAAAAGCTTATAATAAGGTA
ATGTCTGTCAATCCAAAAAAAGCCCTACATTGCCTTACAAGAATCGGTTACATACATTCT
CTTTTAAGAGAATATGATGAGGCAATTTCAACATTTAAAAGAGTTTTTGAGATAGACCCT
TTTTCACTATTAGCATTAAAGGGAATTGCTGAAACATGGATGAGAATAGCAAGAAAGAAA
TATACTGCAAAATTGTATGGCAGTGCAAGGGACACAGCACAAACTGCAATCAATTATTTG
ATTATTGCTCTATCAAAGGAGACAAAATTTACCTGCTTTTGGAATTTAATGGCTGATGCA
TTAATATTTATAACAAGGTTGCCTAATAAATATAGTTATGTTTATATAACAGAAGCCTTT
GGTAAAGGAAGTGAAGACATCATAAGGAAGGATAAATCTTGTATTTATCCACAAGCGCTT
GCTTGTTTGTCCAGAATAGCCAAACAAAAATCGCAATTTACTTCATATGATTTAGCCGCT
ACTTACCTTGATTATTATCTATGCACTCAAAATATTGTAAATTGTCAGATAGCATTTAAA
TTGACTGTTGCTTGTATCAAAGATAAACCATCCACTTGGCGTAATTGGAATTTACTGGGA
AAAGTATGCTATTTCATGAAGAAGTATGTTTTTGCACAGCATTGCTTTATTAAAGCTTTG
CTAGTAACTCGAAAATGGTCCATAGCACAAATATGGTGCAATCTGGGCACATTGTATTTA
AAATTAAAACTTTATAAATTGGCAAACTACTGTTTCTGGCGTGGTCAGTCCACTTTACCG
TCACACCCTCATAGCTGGATTGGGCAAGGACTGATAGCAGAAGTGATTCGCGAAGAAGAA
GCTATGGATCTATTCAGACACGCATGTCGACTTGGCTACCACCCAGAAAGTTCACTAGGA
TATGCAGATTGGGTTTGTCGTACTCTGAAAAACGACAAGTATGAACATAGCACAGAATTA
AAATATGTTATCGATGGTTTATCTGCCATACCGTACGCCTTGGATTTACTGAGTTGGTTT
TCTACGTTTGAGACTGATAATTCTTGTGCTTCAAATATTCTGGGCATTTTACACGAAAGA
AGCGGATTACTTAATAGTGCTTTAAATTATTACCAAAAAGCTTTAGAAGATGCAGAGGAA
TGTAATAAAAATACGATCCTCCTAAATATTGGTAGAATATACATAAGACTTACGAAATAT
GATGAAGCTATAAAGACTTATAAGTCAATATCCGAAGCCAGTCTCAACTCCACTTGCGGT
TTAGCTCTGGCTCTTTTTAAGAATGGTCTTTATGAAGAATCCTATTCAGCTTATGATACT
GCTCTGCACTGGCTTAGTAATAATGATAATGAAAAGGCTGATTTACTTGTTGCCATGTCA
GGAATAGTTTATATGTTCAAAGGCCTTGACGACGCAAAAACATTATTGTTCCATAGTATA
CAAGTATCCCAAAAGAAACCCACTGCATATAGCTTATTTGCTATTTGTTCTCTGGGTATT
ATTCATTCTGATCAAGGATTATCCAAGCTAGCGTTAAGCGAATTGAAAAAGTACGAAAAG
GATAATAATTTTGGATTTGATATAGGTTTTCTCAAATCTTACCTCTTCGTAAACGAAGAC
TTAAATCAAGCTATAAAGATCTTAAGTGATTCTCTTCACGACCATCCAAACAACACAAAG
TTATGGTTCTGTTTAGCTCAATATTGCCTGCAGGAGTCAGATACGAAAGCAAGTTTGGCC
AGTTGTTGTGCCCAAAGGTCCTTAGCATCAAATTATGAAAATAATGTCAGTTCTGCCAAA
ATGCTTGCAACAGCTAGTATAGCCGAACATGTTGGAGGTGATAAGAGAAAAGCTTCACTT
TTAGCAAAACAAGGCCTCCACACACATCCTGACCAACCAGAAGTTTGGGCGGCGCTATTG
TTATCAATCGTTACAAATACAATGTGGCATGAAAAACGCCTATGGATATCATCAGCCACA
GGACATATGAGAAAAAATCTTAATATAACAAGAAGCCTTGCAAGGTGGATAAATTTGTTA
GATAAGAAAATAAGCACCCAAGTAAATTAA

Protein sequence:

MADVKSLLKEARKLIDDKNFKEAQECCKNILRKDKNNYLGLVLLGKSLAESDQAPLAFQK
AISSKPDHPLAWQGLANYYEKKADATAIKKLLAVYDEILKLQIDQEKALEIVSKVGQLGC
IHKDNLAISILVNYMNRKMDMYTVAEKELLGLLKADIICKEEDIPNVVNIIRKINDREPN
DSIHILLGKVILQKSEFEQAMKEVMELPYFTSGVVFRDWLCKYLCTYYIQNNSFKFDLEK
YFNEITLGIENSKYPGLLKSMILFDKQLYLEAYKQCVPLVNYNEADLTEVTFIIKCTFML
KKWSVSQKLSTNFLMKVKDSDFAITLRKFLFLSLVEQQKWKQAISLSREIPFESLDLSEQ
AALAKCYLENNEDMDDHLRQNLETTHYFTQLEALSLIKHKKYNEAISLLEKKPEDPLSFF
YIGKAYWELKEYEKSQINLLKAAKLNADHTETFLYLGMFYQNHKNDFAKAKKCYEKAYSL
DSTNINVIKNLSDIYVELELKDSDFELLLKSSQSVQTEFEWVTFRLGLYYINKRDWENAI
LQFRHVIKHNHKNVIAFECLADAYYSRGSFTSALKAYNKVMSVNPKKALHCLTRIGYIHS
LLREYDEAISTFKRVFEIDPFSLLALKGIAETWMRIARKKYTAKLYGSARDTAQTAINYL
IIALSKETKFTCFWNLMADALIFITRLPNKYSYVYITEAFGKGSEDIIRKDKSCIYPQAL
ACLSRIAKQKSQFTSYDLAATYLDYYLCTQNIVNCQIAFKLTVACIKDKPSTWRNWNLLG
KVCYFMKKYVFAQHCFIKALLVTRKWSIAQIWCNLGTLYLKLKLYKLANYCFWRGQSTLP
SHPHSWIGQGLIAEVIREEEAMDLFRHACRLGYHPESSLGYADWVCRTLKNDKYEHSTEL
KYVIDGLSAIPYALDLLSWFSTFETDNSCASNILGILHERSGLLNSALNYYQKALEDAEE
CNKNTILLNIGRIYIRLTKYDEAIKTYKSISEASLNSTCGLALALFKNGLYEESYSAYDT
ALHWLSNNDNEKADLLVAMSGIVYMFKGLDDAKTLLFHSIQVSQKKPTAYSLFAICSLGI
IHSDQGLSKLALSELKKYEKDNNFGFDIGFLKSYLFVNEDLNQAIKILSDSLHDHPNNTK
LWFCLAQYCLQESDTKASLASCCAQRSLASNYENNVSSAKMLATASIAEHVGGDKRKASL
LAKQGLHTHPDQPEVWAALLLSIVTNTMWHEKRLWISSATGHMRKNLNITRSLARWINLL
DKKISTQVN