DPGLEAN15675 in OGS1.0

New model in OGS2.0DPOGS207122 
Genomic Positionscaffold1:+ 3027130-3030753
See gene structure
CDS Length3624
Paired RNAseq reads  219
Single RNAseq reads  662
Migratory profilesQuery via corresponding ESTs
Best Bmobyx hitBGIBMGA013083 (0.0)
Best Drosophila hit  CG32104 (2e-91)
Best Human hitRNA polymerase II-associated protein 1 (2e-44)
Best NR hit (blastp)  hypothetical protein TcasGA2_TC012660 [Tribolium castaneum] (2e-176)
Best NR hit (blastx)  hypothetical protein TcasGA2_TC012660 [Tribolium castaneum] (2e-168)
GeneOntology terms  GO:0005488 binding
InterPro families
  
IPR013929 RNA polymerase II-associated protein 1, C-terminal
IPR013930 RNA polymerase II-associated protein 1, N-terminal
Orthology groupMCL13318

Nucleotide sequence:

ATGATAAGACGTCCCAAGAAAGGTGAAAATGAAGAAGATTTATTGCGAATGCAAGAAGAA
TTTCTAAGAGAAAAAAATGCGCCTTCAGCACAAGTGGTAAATTTACGTAAAACCGAACAC
CAAACAACTAAAAGAACTAATTCTAGTACTTCAGACAGAAAGCTATCTAAATATGCTAAA
TCTAAAGGACTTCAAAATTCGGAAAAAAGGACTAAAGTTGATAACAGTACTGGTTCCCTT
TTTGGAGACATAATGGAAAAGAATGTGTCTGAAGAACCACAACCAGAACGTACGGAATTC
GAAGATGATAAAGTTTATTATCCTAAAGTGCTTCCATTTGTTCTTGGTGATATAGTGGAA
AAAAGCAATGATGACATTTTAAGCTTGGATTTTAAGATGACACCCCAAGGCTTTCCAGCT
GCTATCAAAAATGATTTAAAATTGAAACCTATCCCAAAGAAAGGGTCCCTACCCTTTAAA
AAATTAGGTGACATTGAAGAAGAAAAGATGGATATTGATTCGTCTTCCGATCATCATGCA
AGTAATACATCAAAGTTAAATATTCCTAACAAAAGTTATATTCTCAATTCAAATGAGGCA
AATGCTATTCACAGTGAAAATGTGAATACGCTCAGTAAAATGACAGAAGAACAGATATTA
TCTGAACAACATAAACTGTTGTCTAGCTTGGACCCAAAACTGGTAGATTTTATAAAAAGT
GTGAGGAAACCAAGTAACACTGATCACATACAACTTGAAAATCAGTCACAAAATCAATTA
ATGGATGTTTCTGAGCCTAAACAAGAGGAGACAGAAAAAGTTGTACAAGAAAATGATCCA
GTTAATAATGATACGCTATGGGAGAGTGATGTGCTTTCTCATCCACATATCAATCAATGG
ATTCATTTTAATGATTTAGAAAAAGAAAAATTAGAATGGATGAAAGGCATTGAAGAGAGT
AAAAAACTTAAACCTAATGAACCTTTTGAAGCAAGATTTGATTTTAAAGGCTACCTTCTA
CCTTATACTATGGAGTATACTGAGGAAACAAAAACTTTGTTTCATCATGGTGAGGAACCA
CACCGACCAGGCTACTCCATTACAGAACTCATTGAGCTCTCTCGCTCTACTATCATACAA
CAAAGAGTTATGGCTCTAAATACTATAGCTGAGCTTTTAGAATATTACATTTCAGGTTTT
TATAAAGATGTGATAGAAATTCCACTGAGCAAACTATTTTTTGTTATCAGAATTGCTATG
GATGAAAATAAGACCATTCTGTTACAAGCAGCACTTAAAGCTATGAGAAATTTACTGTAC
AACAGAATTGATGAAGCCTGTCTTGATGCTTTATTGGGATTTGAAGAAGGCTCTTATCAG
CCTTGTTTAGAAAATGATAAATCAGAAATTTCTGAAATAGAATCAGAGGAATCCGAACTA
AAAGATTTTCACTTGGCTGAAATAGATCTTTTGTCCGCTGTGCTTAGAACAGATATATTA
CAAAGACTTTACTATATCTTAGAATGTGTAAGACCAAGTTTTAATTGTGTGCAGTATTCA
TTGCAAATACTGACAAGGATATCACGTGACTCAATAGAAGCGGCTCAAACTATTGTCAAC
ATAGAACATTTAATGACTTCGATTATTCAAAACTTTGTTCCAACTACAAGTATAAATTTT
TCATTTGGTCCGAACATTGTTTATAGTGGCAAACCTATTATGGCAGCCTTAAAATTAATA
AGGATATTGTCTTTGCAAAACAAAGACATTGGAGAAATTTTAATAACCAAATATAATATA
TTAGAACCTCTATCAGAATACATACGATCAGGTGTAGATGGTACTTATGGTTTAAGACTG
CAAGTAGAAGCATTCAGTATTTTGTCCAATCTTATAAACTATGGACTTGGGGTTGATAAG
GCATTCTCATTATTTCCTATAATTATCACTACAATATATAAACATGTTCAAGGCACAGAC
ATCTTTATTTCTTCATCAATAATATCAGCACAACATGCAGCTGTTGTTCTACAATTGTTA
AATAAAATGTTCAATTGCAAGATGATTAATTCAGATAACTATAAAGAACAGGCTTATCCA
TTATTGAAAGAAGGATTGCAGAAATGGTTGATGCAAACTGCTGCGATGGATGAATACACA
TGTGGACATTTGAGGCTATTATGTTCAGCTCTAGACTGCTGTAAAACAGTCTTAATAAAT
GAGAAAGTGACACTAAAATTCCTCAATGACTCCTTGACAACATTTGCAGGTTCCAAAGGT
TTTAAAAACATTATTAAAAACCTTATCCCAAGCTCTAACCTTGTGTCCAATATAGATGAA
AATGATTTAAATTATTTTAAAAATCTTGTCAGTCTTGGTGGATCTATCATTGATTCTACT
CAAAAAGTCCTTCCAGTATTGAATATTTTGTCTCCTATTCCAGTTTTGGTGTCATTGTTT
AAATTGTTAAACATTATAAATGATATAAATATATCAAAATTATTTTTAGAACAGCTTACA
GAATACTTAACAAAGTTGTCAAAAAAAGAGCCAAGTTTATGCAACAACTGGTTTACGAGA
ATGGAAATTGATTTTGTATTTAACATAATAAAGTTATATACAAAGACTAACACTTCAGAA
TCATCGAAAGATTTAATTTACTCCGTAGCCAGCACACTATGTTATATACTCAGGGTTGAT
AAAAAATTAGAATTGGATTACCTATTCAATAATATAATTTATAACAAAGATTGGTTTTCA
GCGGAGAGATTATTGAACATTATCTCATTATCTGAAGAGGATGGAATTGGTGAAGTGTTA
GTGAATGTGGATGATATTAAAGCATGCTATACAAAAGTAATAAATGCAAACAAAATTGAA
ACTAGTGGTAATATTGTATTAAACGAGTGGCGGGATCCTGTGTTACCGAGGGACTGGATT
TACTTGCCAATATTATCTCTTTATAGCAGTAGCCAGACAACAACAAGCCCGGAAGTAATA
GGTGAACATGCAACACGAGTTAAGCAACAGATTGCAGCTGAAAAGGAAATGTTAGTAAAA
TGCAGCCTTGAATGGATTGTGTTCAATGAAATCTGTTTTCCTGACTTGTTGAAAGACATA
GACATAACAGATAGATTCTGTAGAGTAATGTGTGTATACTTATGTGATAACTCCTTATTT
TTAGATAAAACTATACAAATGTTGTTAAAGAAATGTACACAATTGTTATTCAAAAAGGGT
AGCGAGTTTAATTTTGATAAACAGTTGACTGGCCTGAATAATTTTCAAGATTTCTACACC
CAGTTTCTGGAGCAGTTCCAATCAGTGAGTTATGGAGATCCAATATTTGCTGCCTGTGTT
TTGGTTCCATTGGCCCAGAGACATAATGTAAAATGGCGAAAATTATTATGGTCGGAATAT
GCGGGTTGCTTAAGGGCCTTAGACTGCCCGGAGAGATTTTTATGTTATGAGTTAAATGAA
TATTTGTGTCCAGAGGAATCAGATGAATCTCTTATAAAATCGTATTTCAGAGCCCTTTCT
AGTAACTTACTAAGAAATAACACACTCGCTTATAGAATAGCTAATCATCATGTTAATAGC
TATAAAAAACGAATGAACAAGTAA

Protein sequence:

MIRRPKKGENEEDLLRMQEEFLREKNAPSAQVVNLRKTEHQTTKRTNSSTSDRKLSKYAK
SKGLQNSEKRTKVDNSTGSLFGDIMEKNVSEEPQPERTEFEDDKVYYPKVLPFVLGDIVE
KSNDDILSLDFKMTPQGFPAAIKNDLKLKPIPKKGSLPFKKLGDIEEEKMDIDSSSDHHA
SNTSKLNIPNKSYILNSNEANAIHSENVNTLSKMTEEQILSEQHKLLSSLDPKLVDFIKS
VRKPSNTDHIQLENQSQNQLMDVSEPKQEETEKVVQENDPVNNDTLWESDVLSHPHINQW
IHFNDLEKEKLEWMKGIEESKKLKPNEPFEARFDFKGYLLPYTMEYTEETKTLFHHGEEP
HRPGYSITELIELSRSTIIQQRVMALNTIAELLEYYISGFYKDVIEIPLSKLFFVIRIAM
DENKTILLQAALKAMRNLLYNRIDEACLDALLGFEEGSYQPCLENDKSEISEIESEESEL
KDFHLAEIDLLSAVLRTDILQRLYYILECVRPSFNCVQYSLQILTRISRDSIEAAQTIVN
IEHLMTSIIQNFVPTTSINFSFGPNIVYSGKPIMAALKLIRILSLQNKDIGEILITKYNI
LEPLSEYIRSGVDGTYGLRLQVEAFSILSNLINYGLGVDKAFSLFPIIITTIYKHVQGTD
IFISSSIISAQHAAVVLQLLNKMFNCKMINSDNYKEQAYPLLKEGLQKWLMQTAAMDEYT
CGHLRLLCSALDCCKTVLINEKVTLKFLNDSLTTFAGSKGFKNIIKNLIPSSNLVSNIDE
NDLNYFKNLVSLGGSIIDSTQKVLPVLNILSPIPVLVSLFKLLNIINDINISKLFLEQLT
EYLTKLSKKEPSLCNNWFTRMEIDFVFNIIKLYTKTNTSESSKDLIYSVASTLCYILRVD
KKLELDYLFNNIIYNKDWFSAERLLNIISLSEEDGIGEVLVNVDDIKACYTKVINANKIE
TSGNIVLNEWRDPVLPRDWIYLPILSLYSSSQTTTSPEVIGEHATRVKQQIAAEKEMLVK
CSLEWIVFNEICFPDLLKDIDITDRFCRVMCVYLCDNSLFLDKTIQMLLKKCTQLLFKKG
SEFNFDKQLTGLNNFQDFYTQFLEQFQSVSYGDPIFAACVLVPLAQRHNVKWRKLLWSEY
AGCLRALDCPERFLCYELNEYLCPEESDESLIKSYFRALSSNLLRNNTLAYRIANHHVNS
YKKRMNK