Monarch geneset OGS2.0

DPOGS207873
TranscriptDPOGS207873-TA3444 bp
ProteinDPOGS207873-PA1147 aa
Genomic positionDPSCF300101 - 187403-190846
RNAseq coverage28x (Rank: top 76%)
Annotation
HeliconiusHMEL0102380.068.70% 
BombyxBGIBMGA008348-TA0.058.93% 
DrosophilaNpc1a-PC0.036.82% 
EBI UniRef50UniRef50_Q7PS030.035.93%AGAP000579-PA n=1 Tax=Anopheles gambiae RepID=Q7PS03_ANOGA
NCBI RefSeqXP_002009690.10.036.81%GI15499 [Drosophila mojavensis]
NCBI nr blastpgi|1951305010.036.81%GI15499 [Drosophila mojavensis]
NCBI nr blastxgi|1951305010.036.72%GI15499 [Drosophila mojavensis]
Group
Gene OntologyGO:00160209.2e-75membrane
GO:00081589.2e-75hedgehog receptor activity
KEGG pathwaydmo:Dmoj_GI154990.0 
 K12385 (NPC1)maps-> Lysosome
InterPro domain[424-1141] IPR0033929.2e-75Patched
Orthology groupMCL10165 Multiple-copy universal gene
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS207873-TA
ATGACAAACTCTATGCTTCTGGCTGCTGGTGTCCTCGGAAGATGTCCGACGTGTCTCGGAAACTTCGTGAGACAGATATGTGAAATGAATTGTGCGCCTGATCAAGCACGTTTCGTGAACGTCACGACGATGGTAACTCCGGATAATGTTTTATATGTAAATGAGATCAATTACAGGCTGTACAATGATTTTATGATTGATGCGCATAAATCATGTTCCGGCGTGATCGTGCCGCAATCCGGTATCCCTGCTATTAATCTGATGTGTGGTAACGCTCCCGTGTGCGACGCTGACGCTTGGTTTGGCTTCTCCGGAAACATTTCCGTTAATCCAATCGCTCCCGTTCAAGTAAATTTCCTTCGATGGCCAACACCTGAAGATTCTATGAACGCAAGAGCGCCGTTGTGCAATGAAACGCTAGCTGGAAATATCCCGTGCAGTTGTATAGATTGTCTCGCAAACTGCGGAACTTTAGAAGTTGAAATTCCAGACATTTGTGAAGTGCTAAGCGTCAACTGCATCGGATTTTCGGTAGGGATAACCTTTTTTGTGCTCACTGCTATTATTTTCATTATTTTAACTCTGCGAGAGTATAGAAAATACAGAAGACAAATATCTGACAGCGAAGACTTGAAATATGTGTATAAAGTAAATGTGGTAATCAAAATTTTTCAAAAATGTTTCCAAAATATCGGTATATTCACATCAGATCATCCTGTTTTGATGATACTTTTTACATCATGGATAGCGTTTGGCGTGTCGATCGGAATATCGCAGATTATTGTTACTGCAAATCCTATAGAGCTTTGGTCCGCACCTGATTCCCGTAGTCGTCAAGAACTTAATTATTTTAACTCCCGTTTTGGTCCATTTTATCGCGCCTCTCAGGTTTTCATGACATTTAATGGTCTAGATCCATTTACAGTTGGTAACATTACATACGGCCCAGCTTTCCGAGTTGAAGCAATACAGGAATTAATTAAACTTGAAAATGCTATTATAGACATCGGGAAGGATGACAATACAGTCACATTAACGGAAGTATGTTATGCACCTACTCGTTATCCTGGAGTGGAAAAAAGATTTGATCAATGTTTGTCTATGTCTATAGCAACTTATCTTCCCGATAGAAATAATATTAACAATGAAACATATTTAAACTCTATACAAGGCTGTATTAATAATTACCTTGCACTAAACTGTTTGGCTGACTGGGGAGGTGGGGCCGATCCCGACATGTCGTTTGGCGGATTTAGTGATAAAAATTATTTAGAAGCTAAAACTTTAATTATAAATTATCCTATAGCAAGTCATTTAAGACAGGAGGATATGGTTCCCGTTTTTGAATGGGAAAAGAAATTTATAGATCTTATGCAGGATTATGAAAAAAATTGGAAATCAGATTTTGTTGATATAGCGTTTGGGGCTGATAGATCAATTGAAGACGAAATAGATAGGGTATCTAGAGCAGAAATTGTTCCCATTGCTATTAGTTATTTAATAATGTTCTGTTACGTTATTCTTGCACTGGGAAACGTGACGAGACTAAAATCGTTCTTTGTTGAATGCAAAATCTCGGTCGCTGTCTGTTGTATCATTATTGTTATAATTGCTATTGCTTGTGCAGCGGGTATCTTAGGATACACTGGTATTACAATATCTTTGTTAGCTTTAAATGTCATTCCATTTTTCATTTTGTCCGTTGGTATAGATAATGTTTTTCTCATGGTAAATGAATTGCATTATATAGAAAGTAATCTCAAATCTTTTGAAGATTACAAGGAAGACTTGAGTTTTAATATGAAAAGACGCTACGTTTTTGGTAAAATGATGAAAAATGTGGGACCGTCAATGTTTGTTTCTTCATTGACTCAAATTTCTTGTTTTAGTATCGGTACTATTTCTAATTTACCAGCTGTGAGAACGTTTGCCATATTTGCAGCAATCGCATTAGGTTTTTTGTTTTTGTTTCAAATAACAATTGTGGTTGGTATTTTGTCAATTGATTACAGGCGAACTGTTCAAAATAGATATGATATCTTCTGTTGTATTCGGAAAAAAGTACTTGATGATGAAAATCCTTTACAAGATGGTGTCCGTAACCAAGGTATAATTCAAAGGTTTATGGAGCCTTATGCTAATTTTATTTTAAATTGGCGTGTTAAAATAACTGTAGCTCTTCTATTTATGGCTATGATAGGAGTGAGTGTAATACTTATACCTCAAATTGAAGTAGGTTTGGATCAAGAAATGGCTTTGCCACAAGATTCGTTTGTATATAAATATTTACAAGCAGTCAATAACATTCTGCCAGCAGGTCCACCAGTATTTTTTGTTGTTAAAAGTGGTCTTAATTTTACGAATCATGATCATCAGAACGTACTCTGCGGGGGACTTACATGTAACGAGGATTCACTTTCAACACAAATATTTGTAGCATCACGGAATACGGAAACTACGTACATTCAAAAGAGTTCAAATTCTTGGCTGGATGATTTCCTCGAGTGGACAACTTTGCCCGGCTCTTGTTGCAAGTATAATTCAACAGACGGTGGGTTTTGTTCAAGTAAAGACGAATCGCCAGAGTGCGAGTACTGTTCTATTGAAAGATCTGATTATGCAGGTGGCTTAAGACCAGCAGCAGAAGCTTTCGGAAAGCATATTCCAGCATTCCTCAAAGATCCACCTGGCGAGATTTGTTCCAAGGGTGGATTGGCAAGTTACGGTGGTAATGTCAATTACGTGTTAGACTCACAAGGTCTAGCAACAGTTTACGATACAAAATTTATGGCATTTCATAAATCACTGGTAACTTCAAAGGATTACTTTTTGGCTGTTAAAAACGCATACGAAATCTCTGCAAACATAACTAAAACTATACAAACTCGTACAGGATTAGATGTAGAAGTATTTCCATATTCGGTATTCTATGTCTATTACGAACAGTATTTGACTATTTGGGAAGATGCATTTGCTTCTATTGGATTCAGTCTTCTCGGAGCTCTATTTATAAATTTCCTAGTAACCGGTTTTAATTTCTTAACCACTGGTGCTTTGTTATTGAATGTTATAATGATTGTAGTTGAATTGATGGGCGTAATGTTCATATGGAATATACCTCTGAATGCCGTTTCTACTATAAACTTAATTGTGGCTATTGGTATCGCTGTTGAGTTCTGTAGTCATATGGCGTACGCGTATGCAACTAGTAAATGTCCCCCGAAAGAAAAGGTCCACGATGCCATCAAAAAGGTTGGATCTACGATAATCACCGGCATAACTCTGACTAACGTCCCGATCATAGTTCTAGCATTTTCGTATACTGAGATTATTGAAGTGTTCTTCTTTAGGATGCTGTTTAGTTTGGTGATTTTAGGATTTTTGCATGGTATGGTGTTTTTCCCTGTGTTGCTAAGTTTCTTGAACGATATTAAACATAGATAG

Protein sequence:

>DPOGS207873-PA
MTNSMLLAAGVLGRCPTCLGNFVRQICEMNCAPDQARFVNVTTMVTPDNVLYVNEINYRLYNDFMIDAHKSCSGVIVPQSGIPAINLMCGNAPVCDADAWFGFSGNISVNPIAPVQVNFLRWPTPEDSMNARAPLCNETLAGNIPCSCIDCLANCGTLEVEIPDICEVLSVNCIGFSVGITFFVLTAIIFIILTLREYRKYRRQISDSEDLKYVYKVNVVIKIFQKCFQNIGIFTSDHPVLMILFTSWIAFGVSIGISQIIVTANPIELWSAPDSRSRQELNYFNSRFGPFYRASQVFMTFNGLDPFTVGNITYGPAFRVEAIQELIKLENAIIDIGKDDNTVTLTEVCYAPTRYPGVEKRFDQCLSMSIATYLPDRNNINNETYLNSIQGCINNYLALNCLADWGGGADPDMSFGGFSDKNYLEAKTLIINYPIASHLRQEDMVPVFEWEKKFIDLMQDYEKNWKSDFVDIAFGADRSIEDEIDRVSRAEIVPIAISYLIMFCYVILALGNVTRLKSFFVECKISVAVCCIIIVIIAIACAAGILGYTGITISLLALNVIPFFILSVGIDNVFLMVNELHYIESNLKSFEDYKEDLSFNMKRRYVFGKMMKNVGPSMFVSSLTQISCFSIGTISNLPAVRTFAIFAAIALGFLFLFQITIVVGILSIDYRRTVQNRYDIFCCIRKKVLDDENPLQDGVRNQGIIQRFMEPYANFILNWRVKITVALLFMAMIGVSVILIPQIEVGLDQEMALPQDSFVYKYLQAVNNILPAGPPVFFVVKSGLNFTNHDHQNVLCGGLTCNEDSLSTQIFVASRNTETTYIQKSSNSWLDDFLEWTTLPGSCCKYNSTDGGFCSSKDESPECEYCSIERSDYAGGLRPAAEAFGKHIPAFLKDPPGEICSKGGLASYGGNVNYVLDSQGLATVYDTKFMAFHKSLVTSKDYFLAVKNAYEISANITKTIQTRTGLDVEVFPYSVFYVYYEQYLTIWEDAFASIGFSLLGALFINFLVTGFNFLTTGALLLNVIMIVVELMGVMFIWNIPLNAVSTINLIVAIGIAVEFCSHMAYAYATSKCPPKEKVHDAIKKVGSTIITGITLTNVPIIVLAFSYTEIIEVFFFRMLFSLVILGFLHGMVFFPVLLSFLNDIKHR-