Monarch geneset OGS2.0

DPOGS203785
TranscriptDPOGS203785-TA6432 bp
ProteinDPOGS203785-PA2143 aa
Genomic positionDPSCF300010 + 1004089-1016883
RNAseq coverage41x (Rank: top 72%)
Annotation
HeliconiusHMEL0059470.094.40% 
BombyxBGIBMGA003690-TA0.085.16% 
DrosophilaCG9492-PA0.047.00% 
EBI UniRef50UniRef50_Q7QJV40.043.81%AGAP007675-PA n=68 Tax=Eumetazoa RepID=Q7QJV4_ANOGA
NCBI RefSeqXP_966797.10.056.13%PREDICTED: similar to dynein heavy chain [Tribolium castaneum]
NCBI nr blastpgi|2700044550.051.70%hypothetical protein TcasGA2_TC003808 [Tribolium castaneum]
NCBI nr blastxgi|2700044550.051.60%hypothetical protein TcasGA2_TC003808 [Tribolium castaneum]
Group
KEGG pathwaycre:CHLREDRAFT_1372211e-155 
 K10408 (DNAH)maps-> Huntington's disease
InterPro domain[1466-1872] IPR0136022.9e-124Dynein heavy chain, N-terminal domain-2
[344-898] IPR0135947.5e-100Dynein heavy chain, N-terminal domain-1
Orthology groupMCL10001 Multiple-copy universal gene
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS203785-TA
ATGTCTGGAGAAGCTGGCGATAAACCTGCTGAAGGTGGTGAAAATCCTGCAGGGGATCCTCCCGAACCTGGCGAGAATACTGCGGAAGCACCTCAAGAAGAAGGTGAACAGGCAAATGCAGGAGCTGTAGAAGAAACTGCTGTGAAAATAGATGAAGTGGCTAGAAAAATGTCACGTAAGAAATCAGTGGTAGCTTCCACATCAGCTCTGGGTGTACAAAGTATAATAGATATAGACAGAACCGCTCTAGAAGCTATTCTCGATGTCAGTTCACGATTACAGGACATTCAGAAAAAAAGCAAAATATCTATGAGCACACTGGCCTTAGGTCACGAGTCTTATAAAGATAAACAAGCGAAAGCTAAAGAAGCTCGCAGTAATAGAATGGGAGGAGTAAAATCACAAAGTAGATTTCTGCTAGAGAATGCAGCTGAAATTTTAAATAAGACCATAGAATATGTTATGGAAGGTGTTTATGATGCTGATATTCATATTGATATATTGGATAGTGCATTAGTAGAGGGGGGGAGAAATTGTTTCGTTCTCTGTGATGCTCTGCTGCCACCTTTAAAAATGGAGTCGGGAAGGTTCGTGCCAAATCAAAAAGGTAAGATGGAGAGAACTTACATATCAGATGCGGCGACAATTGGAACGGAGGGTATGTGTGTGGCCATGTATCGCATCAAGAATAAAGCTATTGATATAAAAAATGTGGCGGAAGACTATTTTTTAGTGTTATTTGATATGAACCAAGAAACAGAGAACGTCGTATCTGGTATATTCAAGACCATGAAAAGAGTTTACGTTCCAGCCATACAAACGTGTCAAGCTTGGGGAGATCTTAATCCACCAAACCCCAGGAGTACTGATATTATCAAAACATATATTTCCAAAATAATGCTCTTCATCGATTATCTTGCCAAAACTAAGATTGATTTGGATTGCTGTACAAAGTTTAAGATAAATCTAGTTCTGTATGAGGAAGAGCTTTCTGATTTAGAGAAGATGAAAGCTGCAATAACAAAGACTCATGTTTTGGAAGAAATTTGTTTTTATGTCAAACAGTGGGTTAAACAAATTACAATGGTGTTGGTACAAAGTCAGCAGCTGCGCCGTGAGCCTTCGAATATAGGCCCTTTAGCAGAGCTTGACCACTGGCGCAGGCAATTGACGTCATTTACATCTATCATAGAACACATCAAGAGCGATCCATGCCAAATGTACATACATACTCTCATACGAGCCAAGTCTAAGCTCCTTAAGAAATGGCGAATGTTAGATAATCAAGTAACAGATTACTACAATGAAGCTTTCGATAATGTTAGATATCTGTACGCTCTGGAAAAATACTGCGAACCTTTATACAGATGTGATCCATTGACCATGCAGCAGTACTTACCGGGATTGATTTACACTGTACGAATGATTTTCGCAACTTCCCGCTACTATAATACCACGAAACAGATATCCACGTTGCTTGTTAAAGTAACTAACCAAATTCTTAATATGTGCATGGATTATTTGACTAATGGCGACAGAAAAACTATATGGAATCAAGACAAACTTAATTTTATCAGTAAGGCTAAGTTATGTCTGAATCTGTATAGTTTTTATCGTGAATGCTATAACGAAACTCAGATGGAAATGATGGAAGCGGCCGATGAACGTCCATTTGATTGTTCCGAAATGTATATTTTCGGAAAATTTGAAACATTCCGAAAGCGATTGCTTAAGATCATAGATTTGTTTCAAACATACATCACTTACTACGTTCTCAACAAAACAACTCTAGAAGGAATTGAAGAGTACGCCGTAAACTTTAATAAACTTTTTAAAGTCATATCATCTAAAACGTACGACGCTTTAGACCACAGGCGACCAGACTTCGACAAGGATTATAAGACTTACAAAGACAATGTTGCGACACAAGAACTACTGTTAGAGAATTTTATGATTGCGAGTGTTAACAAATGTCCAACGACTGAAATAGCATTGCATTTATTGGAAAGGTTTAAGAGACTTAAGTTAGACTGCTTGTATCTTGAGGATCAGTATTACGATCTGATTAGCAAGTACACAGCGGAGATTGAAGCTATCCGAGATAGGTACAATGAAGAAAGAGAAAATCCTGACTTACCACGTAATATGCCTCCGGTTTCTGGAAGGGTGATGTGGATAAGATTCTATGATAAAAATATAAAGTGTCCCATGAAAGAGTTTATGAAACATCACGAGGTCATAACTCATATGAATACTCAAAGATGTATAAAACTCTATAATGTTATGAGCATTGTGTTTACGGAATTCGAACTAATTTATCACAGAGCCTGGATGGAAAACGTTGGCCAGGTGCGCCTTGGCTTGATCGCACCTCTACTGATACGCCATCCTGTCACCAATTTATTCATTGTCAACTTCAACATCTATATTCCTGAATGTATAAGGGAGGTGGAATATATGTGGCAGTTAGGTTTGAGTGTTCCTGATTCAGCGCAAATCGTAGCGTACTCCAAGGACAAAATATTTGCTGACTATGAACGTATAAAATTTTTGGTCGAGCGCAACAATCAGATACGGAGGAGTATGCCAAAACTCTACCTGCCGTTGTTGCGAGCACAGCTGATTAAGCTTGACCAAGCCTTTCAGCCGGGACTGTCCATAATAACATGGACCTCTTTAGAGATACCCTCCTATTGTGATAACATTGAGACTGTACTCGACGAAGTTGATCTGTTTATTAAAGAGGTAGTAGATATGAAAGAGGCACGTATAGATGCCATTTTGCAATCAATAGCGACGACTTTATTAGTGTACCTGCCTAAGACCGCAGTGGATCCCAATTCATTTTATGAAGAAAATTTGATACGGCGGGATGAAATCGCCAATGAAATACAGCAAAAATCTTGGAACGCTGAGCTGGCTGTAATAGAACTCATAAATAAGTTCTTAGATAGCGTTCCATCGAAACAAATCCGAGATTTAAAAGATAACTGGTTGGATACAGAAAAGGCGTTGAAACAGGTAACATCAGCTACAAGAGTGTTCCCAGAAGATGCAGCGTTTATGGAGATTGAAAATCCCGATAGATTTGAACCGATGCACGCTATAAATGAATGCAATGAGCTTTTTGCATACTTCGCCACAAAATGTCTGGAAGCACTTATAAAATGTACGAGACAAAGTTTGGACCTACTAAGAAAACGAGCATCGGTTTCCAGCTTTTTGACTATGACAACGGATCCCGAAGAACAAAAAAAACTAAAACCTCTCATGCTCACGATGATGTATTTGGAAATTCCCAAAATTCTTATAAAGCCCTCCTTGGAAGAAATCCAGTCAGCGTTCTCACAGGTTGTGTTGAATTGCATTATGGATATTCATCGCAACGTATACATGTGGGGTCAACAAGAGTTGATTAAAAAGGAGAAAATGGGAGAGCATTCATTGACTGCTGCTAGGAGCATGAGTGCTACATCGAGATCTGGCTCAACTTTAATTGGTATCAGAAGTTATTTTAGAATGGTTTCTGAACATAAGGACATAGTCCGTGCTGTCATGGCGCTGCAAGGCATGATGTACAAATTTAAGCCGGATATAGAAAAGCTTTTGACTGGCTATGGTCGATTTTCACATTTGTGGGCCGAAGATAGAGTTAAACAAGTTCAGGATTTTGTCGACACAAACCCTCTTAACGTTATAATCAGAGATATGTTTAAAAAATACGAAAATCAAACGGACGAAGTTGTTCATCTCCCAGAAAGACATATTATTGGTTCTATTCAAATAGACATGGAAAAAATTAAGTTGGCTTTGCATATTGAATCGATAGAATGGAAACGTATTCTGGGTAAATTATTAAGTCAGGCTTATAGAGAAAGAGTTCTCAAGATGATGCAGTTCATAAACGACCGCATGAAGGCCATGAGCAAGAAGATAAAAGACTTAGACGACGTCCGCGTTGCTATGATATGTTTGGAATTAATAAGGGAAGAGTTCATTGGAATGGATATCGAGCTAGATTTGATCGAAGAGAGCTATGCTACATTTAGTCAGTTCAATATTGATATTCCAAAAGAGGACGCTGATATGGTTTATGGTTTGCGCTATGCTTTCCAAAATATGCTACTAACTTCTCAACAAGTGCAACAGAGAATAGTAGATATGCAGGGCCCATTGCAAACGGAATTGAGCGATGGTGTGGCAGCATTTAACGTCGACGTACTTAAGTTTGATGCTGATTACGATGCGTTCGGGCCAATGACCCCTGGTCTATCAGCAAGAGAAGCGAGACTAGTGATTATGTTCCAATCGCGGTTTGATGAATTATGGAGAAGATTTGAAATGTACTCCAATGGTGAAAAATTGTTCGGTATGGAAGTCAAAGACTACCCTATACTTCATCAGAAAAAGAAAGAATTTAATCTGCTAAGTAAACTATACAGTCTATACCTCGCCGTTATGAACTCTATAGACGGTTACTTTGAAACGCCATGGGTTTCAATTGACATTGAACAAATTGTCTCACAGCTGGCAGAATTTGATTTAAGATGTCGAAAATTACCTCGAGGTATGAAAGATTGGCCAGCATTTATTGATTTGAAAAATAAAATCGATGACTTTAATCAAACTTGTCCTCTACTGGAGCTTATGGCGGATAAGTCCATGAAAGATAGACACTGGAAGAGATTAGAGAATCTCATGCATTGTGTCTTGGATGTGGAATCTCCGTCGTTCCTTCTGGCTGACGTTATGGAAGCACCTTTACTGAAATACAAAGAAGATGTTGAGGATATATGTATTAGTGCCGTCAAAGAAAAAGACATTGAAGCTAAATTAAAACAAGTTATAGCAGATTGGGCCGTAGTAGATCTTACTTTCGCTCCATTTAAGAACAGAGGAGAACTGCTTATCAAACCTCAGGAGACTCTCGATATTATAACTTTGCTTGAAGATTCTTTGATGGTTTTGAATTCTTTAGCGTCAAATAGATACAATGCTCCATTTAAGCGAGATATTTTATTATGGATCAACAAACTGGTTGGTACAACAGAGATCCTGGAGAAGTGGTTGCAAGTTCAGAACTTATGGATGTATTTAGAGGCCGTTTTCGTCGGTGGAGACATTGCTAAGCAATTGCCAGCGGAGGCTAAGCGTTTTGCTACAATTGACAAGACATATGTAAAAATAATGTATCGTGCTCGTGATATTGTAAATTGCGTGGAAACTTGCGTTTCTGACGATACTTTGAAACAATTACTTCCGCATCTAATTGAACAATTAGAGGCATGTCAGAAGTCGCTTACTGGGTATTTGGAGACAAAGCGATTAATCTTTCCGAGATTTTTCTTTGTTTCCGATCCAGTTCTACTGGAAATTCTGGGTCAAGCATCAAATCCACAATCTATTCAGCCACATTTGCCAAGTATATTTGATGCAATGTATACGGTAGACTTTGATGATAAGGATCGTATTATAAACATGAATTCTGACAACGGTGAAACGATTCCGCTTGAACGACCAGTTAATTGTCTTGGAGGCGTCGAGATATGGCTTAATACTTTGCTGGATACAATGAAAGATACAGTGCGAAACATGATAGCTAATATAGCTCAGGCAATGGCTGGAGATCCTGAATTTGAGTTTTTGTCAGGATTTTGGAATTTCCCTGGGCAGGCAAGTTTGTTAGGAATGCAAATATTGTGGACAAGCGACGCGGAGTACGCTCTAAAGAAGGCTAGAGTTGATAGATATATTATGAGGCTTACAAATCAAAAGAATTTAGATTTATTAAACGGATTAATCGATCAAACTGTGAAGGATTTAGTGCCGCTCGATAGAACAAGGGTCGAAACTATGATCACTATACACGTTCACCAGAGGGATATATTTGACGACTTGGTGAAACTGAGAATAAAAACGCCGACAGATTTTGAATGGCAAAAACAAGCTCGATTTTATTATTTCGAGGATACTGATGAATGTATTGTATCAATAACAGACGTTGACTTCATTTATCAGGACGAGTATCTAGGGATCACGGAACGTTTAGTAATCACGCCATTGACTGATCGTTGTTACATAACCCTATCTCAAGCTATTGGTATGAGCATGGGCGGAGCGCCCGCGGGACCAGCTGGTACAGGGAAAACTGAGACCACCAAAGACATGGGGCGAACGCTCGGGAAGCTTGTTATTGTCTTCAACTGCTCAGATCAAATGGACTTCAGAGGCTTGGGGCGTATATATAAAGGATTAGCACAGTCTGGTACTTGGGGATGTTTTGACGAATTTAACAGAATTGAACTGCCCGTTCTTTCAGTAGCTGCACAGCAAATTTATATTTGCTTAACTGCCCGCAGAGAAAAGAAGGAATTCTTTATTTTTAGGTATATATTCAAGATAATTATTTACGAGTATATAGAAGGATTATAA

Protein sequence:

>DPOGS203785-PA
MSGEAGDKPAEGGENPAGDPPEPGENTAEAPQEEGEQANAGAVEETAVKIDEVARKMSRKKSVVASTSALGVQSIIDIDRTALEAILDVSSRLQDIQKKSKISMSTLALGHESYKDKQAKAKEARSNRMGGVKSQSRFLLENAAEILNKTIEYVMEGVYDADIHIDILDSALVEGGRNCFVLCDALLPPLKMESGRFVPNQKGKMERTYISDAATIGTEGMCVAMYRIKNKAIDIKNVAEDYFLVLFDMNQETENVVSGIFKTMKRVYVPAIQTCQAWGDLNPPNPRSTDIIKTYISKIMLFIDYLAKTKIDLDCCTKFKINLVLYEEELSDLEKMKAAITKTHVLEEICFYVKQWVKQITMVLVQSQQLRREPSNIGPLAELDHWRRQLTSFTSIIEHIKSDPCQMYIHTLIRAKSKLLKKWRMLDNQVTDYYNEAFDNVRYLYALEKYCEPLYRCDPLTMQQYLPGLIYTVRMIFATSRYYNTTKQISTLLVKVTNQILNMCMDYLTNGDRKTIWNQDKLNFISKAKLCLNLYSFYRECYNETQMEMMEAADERPFDCSEMYIFGKFETFRKRLLKIIDLFQTYITYYVLNKTTLEGIEEYAVNFNKLFKVISSKTYDALDHRRPDFDKDYKTYKDNVATQELLLENFMIASVNKCPTTEIALHLLERFKRLKLDCLYLEDQYYDLISKYTAEIEAIRDRYNEERENPDLPRNMPPVSGRVMWIRFYDKNIKCPMKEFMKHHEVITHMNTQRCIKLYNVMSIVFTEFELIYHRAWMENVGQVRLGLIAPLLIRHPVTNLFIVNFNIYIPECIREVEYMWQLGLSVPDSAQIVAYSKDKIFADYERIKFLVERNNQIRRSMPKLYLPLLRAQLIKLDQAFQPGLSIITWTSLEIPSYCDNIETVLDEVDLFIKEVVDMKEARIDAILQSIATTLLVYLPKTAVDPNSFYEENLIRRDEIANEIQQKSWNAELAVIELINKFLDSVPSKQIRDLKDNWLDTEKALKQVTSATRVFPEDAAFMEIENPDRFEPMHAINECNELFAYFATKCLEALIKCTRQSLDLLRKRASVSSFLTMTTDPEEQKKLKPLMLTMMYLEIPKILIKPSLEEIQSAFSQVVLNCIMDIHRNVYMWGQQELIKKEKMGEHSLTAARSMSATSRSGSTLIGIRSYFRMVSEHKDIVRAVMALQGMMYKFKPDIEKLLTGYGRFSHLWAEDRVKQVQDFVDTNPLNVIIRDMFKKYENQTDEVVHLPERHIIGSIQIDMEKIKLALHIESIEWKRILGKLLSQAYRERVLKMMQFINDRMKAMSKKIKDLDDVRVAMICLELIREEFIGMDIELDLIEESYATFSQFNIDIPKEDADMVYGLRYAFQNMLLTSQQVQQRIVDMQGPLQTELSDGVAAFNVDVLKFDADYDAFGPMTPGLSAREARLVIMFQSRFDELWRRFEMYSNGEKLFGMEVKDYPILHQKKKEFNLLSKLYSLYLAVMNSIDGYFETPWVSIDIEQIVSQLAEFDLRCRKLPRGMKDWPAFIDLKNKIDDFNQTCPLLELMADKSMKDRHWKRLENLMHCVLDVESPSFLLADVMEAPLLKYKEDVEDICISAVKEKDIEAKLKQVIADWAVVDLTFAPFKNRGELLIKPQETLDIITLLEDSLMVLNSLASNRYNAPFKRDILLWINKLVGTTEILEKWLQVQNLWMYLEAVFVGGDIAKQLPAEAKRFATIDKTYVKIMYRARDIVNCVETCVSDDTLKQLLPHLIEQLEACQKSLTGYLETKRLIFPRFFFVSDPVLLEILGQASNPQSIQPHLPSIFDAMYTVDFDDKDRIINMNSDNGETIPLERPVNCLGGVEIWLNTLLDTMKDTVRNMIANIAQAMAGDPEFEFLSGFWNFPGQASLLGMQILWTSDAEYALKKARVDRYIMRLTNQKNLDLLNGLIDQTVKDLVPLDRTRVETMITIHVHQRDIFDDLVKLRIKTPTDFEWQKQARFYYFEDTDECIVSITDVDFIYQDEYLGITERLVITPLTDRCYITLSQAIGMSMGGAPAGPAGTGKTETTKDMGRTLGKLVIVFNCSDQMDFRGLGRIYKGLAQSGTWGCFDEFNRIELPVLSVAAQQIYICLTARREKKEFFIFRYIFKIIIYEYIEGL-