MonarchBase - Protein-coding gene

DPGLEAN21831 in OGS1.0

New model in OGS2.0	DPOGS213807
Genomic Position	scaffold461:+ 58363-62172
	See gene structure
CDS Length	3810
Paired RNAseq reads	298
Single RNAseq reads	846
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA006548 (0.0)
Best Drosophila hit	CG8777 (4e-72)
Best Human hit	tetratricopeptide repeat protein 37 (4e-86)
Best NR hit (blastp)	PREDICTED: similar to tetratricopeptide repeat protein 37 [Tribolium castaneum] (2e-164)
Best NR hit (blastx)	conserved hypothetical protein [Pediculus humanus corporis] (2e-156)
GeneOntology terms	GO:0005488 binding
InterPro families	IPR019734 Tetratricopeptide repeat IPR013026 Tetratricopeptide repeat-containing IPR011990 Tetratricopeptide-like helical
Orthology group	MCL15836

Nucleotide sequence:

ATGGCTGATGTTAAATCACTTTTAAAAGAAGCAAGAAAATTGATTGATGATAAAAATTTT
AAAGAAGCTCAGGAATGTTGTAAGAACATATTGCGAAAAGACAAAAATAATTATTTAGGT
TTGGTACTGCTGGGAAAATCATTAGCAGAATCTGATCAGGCTCCATTGGCATTTCAAAAA
GCTATATCTAGTAAACCAGATCATCCTTTAGCATGGCAAGGTCTAGCTAATTATTATGAA
AAAAAAGCAGATGCTACAGCTATAAAAAAACTTTTAGCAGTGTATGATGAAATTTTGAAA
TTGCAAATAGATCAGGAGAAAGCATTAGAAATTGTTTCCAAAGTTGGTCAACTTGGTTGC
ATACATAAAGATAACTTAGCAATTAGCATTCTAGTTAACTATATGAACAGAAAGATGGAC
ATGTATACAGTTGCTGAAAAAGAATTATTAGGTCTATTGAAAGCCGATATTATATGTAAA
GAGGAAGACATCCCAAATGTTGTGAATATTATACGCAAAATAAATGACAGAGAGCCAAAT
GACTCCATTCATATTTTGCTAGGAAAAGTAATTTTACAAAAAAGTGAATTTGAACAAGCT
ATGAAAGAGGTCATGGAATTGCCTTATTTTACTTCTGGTGTAGTATTTCGTGATTGGCTC
TGCAAATACCTATGTACATATTATATTCAAAATAACTCATTCAAGTTTGATTTAGAAAAA
TATTTCAATGAAATAACTTTGGGAATTGAAAATTCGAAGTATCCTGGACTCTTAAAAAGT
ATGATTCTCTTTGACAAGCAATTATATCTGGAGGCTTACAAACAATGTGTTCCACTTGTT
AATTATAATGAAGCTGATTTGACTGAAGTTACATTTATCATTAAGTGTACCTTTATGTTG
AAGAAATGGTCAGTGTCCCAAAAGCTTTCTACAAACTTCTTGATGAAGGTAAAAGATAGT
GACTTCGCAATCACTTTAAGAAAATTTTTGTTTTTATCATTGGTAGAACAACAAAAATGG
AAGCAAGCTATTTCATTGTCCCGAGAAATTCCTTTTGAATCTTTGGATTTAAGTGAGCAA
GCGGCTCTCGCCAAATGTTACCTTGAAAATAATGAAGATATGGATGATCACTTGAGACAG
AATCTTGAGACTACTCACTACTTTACACAGCTGGAAGCTCTGTCATTAATCAAACATAAA
AAATACAATGAAGCCATTTCATTGTTAGAGAAAAAACCTGAAGATCCTTTGAGTTTCTTC
TATATAGGCAAAGCGTATTGGGAATTAAAAGAGTATGAAAAATCTCAAATAAACCTTTTA
AAAGCTGCAAAATTGAATGCTGATCATACAGAAACATTTTTGTATTTAGGGATGTTCTAT
CAAAACCACAAGAATGATTTTGCAAAGGCTAAAAAATGTTATGAAAAAGCTTATAGTTTA
GACAGCACAAATATCAATGTTATTAAAAATCTAAGTGATATTTATGTTGAATTGGAACTA
AAAGATTCAGATTTTGAATTATTATTGAAATCTAGTCAGTCTGTACAGACAGAATTTGAG
TGGGTAACTTTTCGTCTCGGTTTATATTATATAAATAAAAGAGATTGGGAGAATGCTATT
TTACAATTTCGTCATGTGATCAAACATAATCACAAAAATGTTATAGCATTTGAATGTCTG
GCTGATGCATATTATTCAAGGGGATCATTTACATCTGCATTAAAAGCTTATAATAAGGTA
ATGTCTGTCAATCCAAAAAAAGCCCTACATTGCCTTACAAGAATCGGTTACATACATTCT
CTTTTAAGAGAATATGATGAGGCAATTTCAACATTTAAAAGAGTTTTTGAGATAGACCCT
TTTTCACTATTAGCATTAAAGGGAATTGCTGAAACATGGATGAGAATAGCAAGAAAGAAA
TATACTGCAAAATTGTATGGCAGTGCAAGGGACACAGCACAAACTGCAATCAATTATTTG
ATTATTGCTCTATCAAAGGAGACAAAATTTACCTGCTTTTGGAATTTAATGGCTGATGCA
TTAATATTTATAACAAGGTTGCCTAATAAATATAGTTATGTTTATATAACAGAAGCCTTT
GGTAAAGGAAGTGAAGACATCATAAGGAAGGATAAATCTTGTATTTATCCACAAGCGCTT
GCTTGTTTGTCCAGAATAGCCAAACAAAAATCGCAATTTACTTCATATGATTTAGCCGCT
ACTTACCTTGATTATTATCTATGCACTCAAAATATTGTAAATTGTCAGATAGCATTTAAA
TTGACTGTTGCTTGTATCAAAGATAAACCATCCACTTGGCGTAATTGGAATTTACTGGGA
AAAGTATGCTATTTCATGAAGAAGTATGTTTTTGCACAGCATTGCTTTATTAAAGCTTTG
CTAGTAACTCGAAAATGGTCCATAGCACAAATATGGTGCAATCTGGGCACATTGTATTTA
AAATTAAAACTTTATAAATTGGCAAACTACTGTTTCTGGCGTGGTCAGTCCACTTTACCG
TCACACCCTCATAGCTGGATTGGGCAAGGACTGATAGCAGAAGTGATTCGCGAAGAAGAA
GCTATGGATCTATTCAGACACGCATGTCGACTTGGCTACCACCCAGAAAGTTCACTAGGA
TATGCAGATTGGGTTTGTCGTACTCTGAAAAACGACAAGTATGAACATAGCACAGAATTA
AAATATGTTATCGATGGTTTATCTGCCATACCGTACGCCTTGGATTTACTGAGTTGGTTT
TCTACGTTTGAGACTGATAATTCTTGTGCTTCAAATATTCTGGGCATTTTACACGAAAGA
AGCGGATTACTTAATAGTGCTTTAAATTATTACCAAAAAGCTTTAGAAGATGCAGAGGAA
TGTAATAAAAATACGATCCTCCTAAATATTGGTAGAATATACATAAGACTTACGAAATAT
GATGAAGCTATAAAGACTTATAAGTCAATATCCGAAGCCAGTCTCAACTCCACTTGCGGT
TTAGCTCTGGCTCTTTTTAAGAATGGTCTTTATGAAGAATCCTATTCAGCTTATGATACT
GCTCTGCACTGGCTTAGTAATAATGATAATGAAAAGGCTGATTTACTTGTTGCCATGTCA
GGAATAGTTTATATGTTCAAAGGCCTTGACGACGCAAAAACATTATTGTTCCATAGTATA
CAAGTATCCCAAAAGAAACCCACTGCATATAGCTTATTTGCTATTTGTTCTCTGGGTATT
ATTCATTCTGATCAAGGATTATCCAAGCTAGCGTTAAGCGAATTGAAAAAGTACGAAAAG
GATAATAATTTTGGATTTGATATAGGTTTTCTCAAATCTTACCTCTTCGTAAACGAAGAC
TTAAATCAAGCTATAAAGATCTTAAGTGATTCTCTTCACGACCATCCAAACAACACAAAG
TTATGGTTCTGTTTAGCTCAATATTGCCTGCAGGAGTCAGATACGAAAGCAAGTTTGGCC
AGTTGTTGTGCCCAAAGGTCCTTAGCATCAAATTATGAAAATAATGTCAGTTCTGCCAAA
ATGCTTGCAACAGCTAGTATAGCCGAACATGTTGGAGGTGATAAGAGAAAAGCTTCACTT
TTAGCAAAACAAGGCCTCCACACACATCCTGACCAACCAGAAGTTTGGGCGGCGCTATTG
TTATCAATCGTTACAAATACAATGTGGCATGAAAAACGCCTATGGATATCATCAGCCACA
GGACATATGAGAAAAAATCTTAATATAACAAGAAGCCTTGCAAGGTGGATAAATTTGTTA
GATAAGAAAATAAGCACCCAAGTAAATTAA

Protein sequence:

MADVKSLLKEARKLIDDKNFKEAQECCKNILRKDKNNYLGLVLLGKSLAESDQAPLAFQK
AISSKPDHPLAWQGLANYYEKKADATAIKKLLAVYDEILKLQIDQEKALEIVSKVGQLGC
IHKDNLAISILVNYMNRKMDMYTVAEKELLGLLKADIICKEEDIPNVVNIIRKINDREPN
DSIHILLGKVILQKSEFEQAMKEVMELPYFTSGVVFRDWLCKYLCTYYIQNNSFKFDLEK
YFNEITLGIENSKYPGLLKSMILFDKQLYLEAYKQCVPLVNYNEADLTEVTFIIKCTFML
KKWSVSQKLSTNFLMKVKDSDFAITLRKFLFLSLVEQQKWKQAISLSREIPFESLDLSEQ
AALAKCYLENNEDMDDHLRQNLETTHYFTQLEALSLIKHKKYNEAISLLEKKPEDPLSFF
YIGKAYWELKEYEKSQINLLKAAKLNADHTETFLYLGMFYQNHKNDFAKAKKCYEKAYSL
DSTNINVIKNLSDIYVELELKDSDFELLLKSSQSVQTEFEWVTFRLGLYYINKRDWENAI
LQFRHVIKHNHKNVIAFECLADAYYSRGSFTSALKAYNKVMSVNPKKALHCLTRIGYIHS
LLREYDEAISTFKRVFEIDPFSLLALKGIAETWMRIARKKYTAKLYGSARDTAQTAINYL
IIALSKETKFTCFWNLMADALIFITRLPNKYSYVYITEAFGKGSEDIIRKDKSCIYPQAL
ACLSRIAKQKSQFTSYDLAATYLDYYLCTQNIVNCQIAFKLTVACIKDKPSTWRNWNLLG
KVCYFMKKYVFAQHCFIKALLVTRKWSIAQIWCNLGTLYLKLKLYKLANYCFWRGQSTLP
SHPHSWIGQGLIAEVIREEEAMDLFRHACRLGYHPESSLGYADWVCRTLKNDKYEHSTEL
KYVIDGLSAIPYALDLLSWFSTFETDNSCASNILGILHERSGLLNSALNYYQKALEDAEE
CNKNTILLNIGRIYIRLTKYDEAIKTYKSISEASLNSTCGLALALFKNGLYEESYSAYDT
ALHWLSNNDNEKADLLVAMSGIVYMFKGLDDAKTLLFHSIQVSQKKPTAYSLFAICSLGI
IHSDQGLSKLALSELKKYEKDNNFGFDIGFLKSYLFVNEDLNQAIKILSDSLHDHPNNTK
LWFCLAQYCLQESDTKASLASCCAQRSLASNYENNVSSAKMLATASIAEHVGGDKRKASL
LAKQGLHTHPDQPEVWAALLLSIVTNTMWHEKRLWISSATGHMRKNLNITRSLARWINLL
DKKISTQVN