Monarch geneset OGS2.0

DPOGS203593
TranscriptDPOGS203593-TA3705 bp
ProteinDPOGS203593-PA1234 aa
Genomic positionDPSCF300063 - 969870-975087
RNAseq coverage6x (Rank: top 87%)
Annotation
HeliconiusHMEL0167260.082.18% 
BombyxBGIBMGA005685-TA0.047.56% 
DrosophilaCG4168-PB1e-17533.41% 
EBI UniRef50UniRef50_E0VKV30.036.73%Chaoptin, putative n=1 Tax=Pediculus humanus corporis RepID=E0VKV3_PEDHC
NCBI RefSeqXP_002426747.10.036.73%chaoptin, putative [Pediculus humanus corporis]
NCBI nr blastpgi|2420120340.036.73%chaoptin, putative [Pediculus humanus corporis]
NCBI nr blastxgi|2420120340.037.30%chaoptin, putative [Pediculus humanus corporis]
Group
KEGG pathwaydme:Dmel_CG51957e-31 
 K05401 (TLR3)maps-> Toll-like receptor signaling pathway
Orthology groupMCL12737 Insect specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS203593-TA
ATGGTGTTGGGCGATGGCAGCGCGCGGTGGGCGCTGCGAACGGCGTTTGTTTGCTTGCTCATGGGCGTGCTTTCCCCGGAACGTCTAGAGCCCTGCGCGGCAAGTCCACTCTGCTCCTGCCGCGCTGCCCACATGTCCTGCACTGCTGTACCATTACATAGGTTTCCAGAATGGCCACAAATAGAACTGCAGCACCTGGACATAAGTATGTCGAATCTTGAAGTAATACCCGAAAGTGCTTTAGACGGTTTGAAGCTTCAGACTTTGGTATTAGTTGCAAATAGAATACACTACATCGAGATCCACGCTTTTAGCTCCATGGCGAATACTTTAGCATCCTTAGATTTAAGCTACAACGAATTTACTGAAATTCCAGAAAATGGTTTGAAAGACCTAAAAGTACTTAATTGGTTAAATTTACAAAACAATTATATAGCTGAGATAAATCCCGGCATAAAATGGCATCATTTGGAGGATACTTTGACTAGTTTATCTTTGAGTAATAACCAAATAACAGAGCTGAGACCTCGGTCTTTTACATTTTTATATCATCTTCTACAACTAGATTTAGAAGGAAATTATCTCCGTGTCATAAGTTCAAATTCATTACCATCATCCCTAACAGTCCTTAAATTATCCAACAATTTCCTACATAAAATATCCTGTGATTTAATATTTAAACTGCCTAGGTTACAAATGTTACATATAAGACATAATTGGATAACATTCGAAGTTAATTCATCAAGTGTAAATAATAGAACTAAGAAACTAGAAAAATTAGATTTAAGTAATAATAATATAAATGACTCAACAGATATTGTAATTTTTCGGGAAATACAAATACGGCAAATAATACTCGATCTCAATGAACTGTCTGTGGTCCCAAGATCCTTATATTTAAATAACAGAGTTGAGAGGCTTTCAATATCGTATAACAAACTTAGCTCTATTTACAGAGAAGTTTTTATATCTCTCAAAAATAGTCTTGAACATTTGGAGGTAGAGCACAACAACTTATCTCATTTACCTGATAGTTTGGCGCAGGTCTTGAGACTTCGACATTTATCGTTAGCTTACAATCAGCTTGAAGAGTGTCCGCCTCTCCCGAGTCGTATTCAAACGTTATCAATTGCTGGTAACTTTCTTACTTCGATACCTTCTGTACTTCAAACATTAGAATCAGGTTCAATTCGTTATCTCGACTTAAGCTACAATAGAATATCGAATTTGTCACCGAATGAATTCCAAGACTGGTCTTCGTCTCTAGGGACTATAAACCTGAAAGGAAACAGGATTGCGCAGATTTATAAAAACGTTTTTCCCGCTCACATGCCGGTACGGGACATTAACTTGAGCTTTAACGATTTATACTACATACATCCTCATTCCTTTTCCAATTTAACTGGCTCTTTACATGTTTTAGAATCTTCTGCTACACTTTTCAGTGGATATTTTCCGTTTGAGATGAATGACGGTTTAGAAAATTTGAATTGGTTATCTTTTGACAACAACGACTTTCATATTCTAAAGTTATCAGAAATGTCCTTATTTCAAAGTTTAAAGTACTTAAATCTAGACTACAATAGAATCGTAGAAATTATTGTTGACGAGGATGGTTACAACATATCGTTATCTCTTAATGATGTGAGAATATCGTATAACTTTATAAGCCTTATTCGGCCTAAGACCTTTTCACAAATGCCCGAATTAAGAAACTTAGATTTATCTTATAATCGTATCAATAACTTGACTAAGAACAGCTTTAGCAACTTACCCAATTTAAGATATTTATCTCTTGCGGGAAACGTAATCGACTCCATAGAAGTAGAAACATTTGTAAATTTACCAAAACTAGAGATACTAGAACTTCAGGGAAACAACTTAACGTATTTGTCTCTTTACTCTTTATGCAATGTTTCCAATGGTCTTGATACGTTTACACTTAATATAAGTCGAAACAAACTAGGCTCAATTGAAGGAGACGTGACTATTGCTATAAATATTTTTGACGGATCACATAATGACTTTCATGAAGTGCCAAATAACATTTTTCTCGCCGCTGAATCTTCGATAAGGCAAATTATATTATCACATAATAAAATTACTCACATTTCTGGTGATGTTTTTGGACAGTCCATTTATCTAGAGATATTAGATTTACACAAAAATAGAATAAGCGTTATAAAAAGAAAGTCATTTACAGATCTTATATCTCTGCAAATATTAGATCTATCTTATAATAGCATTTTTCAATTATCTGTAGAACAATTTTATAACTTACGTAAACTGAGATATTTAAAGATGGACCACAATAATGTTAGACTTCTTCCACGAGACGTTTTTAAAAATACAGTTATAGAGCATTTGGATTTAAGTTTTAATGAAGTTTCCCTGTTTCCAGTAACTGCGCTCTCGCAAATTGGATTTACTTTAAGATACCTGGATTTATCACATAACAAGATTGAATATTTGGATAGCAACATTTTTCGGAATACACAATTTTTATCAAACCTCAATTTAGCTCACAATTTGTTAACCGTTTTATCCGATAACACGTTTTTCTGTCTCGGAGTTTTGCGAAGCTTGGATTTAAGCTTTAACTCGATTAAGGCAAATTTTAAAGAACTGTTCCATAACCTCCCTCATTTAAGGCATTTAAATCTTGCAAGTATAAGTTTAAAGACAGTGCCTTATCTGCCTTTAACAAATTTAACAAGCCTAAATTTAACGTCAAATTACATAACAACGTATAAAGAGTCTGACATGAAGAGATTAGAAAATCTTCGACATTTAGATCTTAGTCATAATCGTCTCACCTCTTTAGTGCCAAAGATGTGGATTCATTTAAGGAACTTAAATGTACTAGATATTTCATATAATCCTATCGTAAGAATAACGCCAAATAGTTTTAAGTCATTAAGCAACTTATCGTATCTTAATTTGAATGGTCTTAAGTATTTAGATATAGTTGATCAAGATTCTTTCCGTCCCTTAACATCCTTACGATCCTTGCGTATCCAGACGTGGTCAGCAATAAATCATTCAACATTTCGATTAGCTAATATTACATCATGTCTCCCATCACTGTATAAATTGTCTGTGCATTGGACCGATGAAGTTATGAATAACCAACTACATGGAATTGACGCTCGAAAAATCAGATACTTAGAAATTAAAGGATCTAAATTAAGGAGCATAGCAGATGGAGCATTTGAGCCATTTAGTAACAGTCAAGAGATATACATTAGAATAAGTGAGACGTCTTTAACAAAATTACCTGCAACATTTATAAGACATCTCTCCCAAGTTCCTCAATTAGGAATCGATTTAAGCTATAATCAAATATCGAAGTTAGATCCAGCTATATTTTACCCCAATTTTACAAGTTGGAGTCACGTCGCTACAAAATTACTTTCAGGAGGATTAATTCTAACGGGAAATCCGTTGCGGTGCGAGTGTGAATTGGCTTGGCTGGGCGCATGGTTGCGACGATGGTTACAAGAGAATGAGGCTAATGGGGAATTAAGACGAGCGGTCCGAAGTGCCACCTGCAAAGACCAGCTAGGGAGACCTGTTCCGCTCCTTCAATTACGTGCCGACGAAGCCGATTGTCACGCTAGTGCGCTGTCGAGTGATGCACAACCCAACTATAGCAACGTCATTTACACATTTGCAATCACAGTATTGTTTATTACACTTAGATGA

Protein sequence:

>DPOGS203593-PA
MVLGDGSARWALRTAFVCLLMGVLSPERLEPCAASPLCSCRAAHMSCTAVPLHRFPEWPQIELQHLDISMSNLEVIPESALDGLKLQTLVLVANRIHYIEIHAFSSMANTLASLDLSYNEFTEIPENGLKDLKVLNWLNLQNNYIAEINPGIKWHHLEDTLTSLSLSNNQITELRPRSFTFLYHLLQLDLEGNYLRVISSNSLPSSLTVLKLSNNFLHKISCDLIFKLPRLQMLHIRHNWITFEVNSSSVNNRTKKLEKLDLSNNNINDSTDIVIFREIQIRQIILDLNELSVVPRSLYLNNRVERLSISYNKLSSIYREVFISLKNSLEHLEVEHNNLSHLPDSLAQVLRLRHLSLAYNQLEECPPLPSRIQTLSIAGNFLTSIPSVLQTLESGSIRYLDLSYNRISNLSPNEFQDWSSSLGTINLKGNRIAQIYKNVFPAHMPVRDINLSFNDLYYIHPHSFSNLTGSLHVLESSATLFSGYFPFEMNDGLENLNWLSFDNNDFHILKLSEMSLFQSLKYLNLDYNRIVEIIVDEDGYNISLSLNDVRISYNFISLIRPKTFSQMPELRNLDLSYNRINNLTKNSFSNLPNLRYLSLAGNVIDSIEVETFVNLPKLEILELQGNNLTYLSLYSLCNVSNGLDTFTLNISRNKLGSIEGDVTIAINIFDGSHNDFHEVPNNIFLAAESSIRQIILSHNKITHISGDVFGQSIYLEILDLHKNRISVIKRKSFTDLISLQILDLSYNSIFQLSVEQFYNLRKLRYLKMDHNNVRLLPRDVFKNTVIEHLDLSFNEVSLFPVTALSQIGFTLRYLDLSHNKIEYLDSNIFRNTQFLSNLNLAHNLLTVLSDNTFFCLGVLRSLDLSFNSIKANFKELFHNLPHLRHLNLASISLKTVPYLPLTNLTSLNLTSNYITTYKESDMKRLENLRHLDLSHNRLTSLVPKMWIHLRNLNVLDISYNPIVRITPNSFKSLSNLSYLNLNGLKYLDIVDQDSFRPLTSLRSLRIQTWSAINHSTFRLANITSCLPSLYKLSVHWTDEVMNNQLHGIDARKIRYLEIKGSKLRSIADGAFEPFSNSQEIYIRISETSLTKLPATFIRHLSQVPQLGIDLSYNQISKLDPAIFYPNFTSWSHVATKLLSGGLILTGNPLRCECELAWLGAWLRRWLQENEANGELRRAVRSATCKDQLGRPVPLLQLRADEADCHASALSSDAQPNYSNVIYTFAITVLFITLR-