Monarch geneset OGS2.0

DPOGS210037
TranscriptDPOGS210037-TA3330 bp
ProteinDPOGS210037-PA1109 aa
Genomic positionDPSCF300017 - 1510845-1514174
RNAseq coverage168x (Rank: top 51%)
Annotation
Heliconius% 
BombyxBGIBMGA000468-TA0.070.80% 
Drosophiladisp-PA0.035.93% 
EBI UniRef50UniRef50_Q7QB810.039.96%AGAP004140-PA n=1 Tax=Anopheles gambiae RepID=Q7QB81_ANOGA
NCBI RefSeqXP_001654542.10.038.25%hypothetical protein AaeL_AAEL010401 [Aedes aegypti]
NCBI nr blastpgi|1571261130.038.25%hypothetical protein AaeL_AAEL010401 [Aedes aegypti]
NCBI nr blastxgi|1700452110.039.13%dispatched [Culex quinquefasciatus]
Group
Gene OntologyGO:00160203.5e-09membrane
GO:00081583.5e-09hedgehog receptor activity
KEGG pathwaynvi:1001207604e-06 
 K06225 (PTCH1)maps-> Basal cell carcinoma
    Pathways in cancer
    Hedgehog signaling pathway
InterPro domain[440-557] IPR0033923.5e-09Patched
Orthology groupMCL12005 Multiple-copy universal gene
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS210037-TA
ATGTTATCTGCTTATGCCAGGTTTATTGTTCGCTACTCTTACTTTTTCCTTTTTATTATAATAGTAATATCGACAGTCCTGACAGTCATTCCACTATTATGTCACGAGATACCATCCTTTTCCGATCCAGTGGTCGGTTTTGAAACAAGAGGGACTACATTAGCGCACCGATTTATTGCTTGGGAAAATCTTAATGATGAAACACGACCGTCTAAAAGGCTAGCAGTTAATCCTAAGGAAATAGAAGATCAAATACGAATGAATGAAACATACAACAAGAAAAAACAGGATAAATCAAGATCTGGCAAAAAACATCCCAAAAAAAAACACAGAAAGAAGTTGCACAACAACACTGGATTTGCGAAAACATTGTTTAATTCGCCAGAGTTTAATGCTAGCAAGGGCCATGTCCATTGGGGCTATGGTAAAAATGTTTCCTTTGAAGATGAAAATACAGTTTTTCTTAAAGATCACACAAGGAATCAATGGAAATCTATACTTAAAATGCAGCAATCTTCTGGAAATGTAGTATTTCATAATTATGCCTCTGGTGTGTGTGGGGCACCTGTTGCTGATTATGCACATTTGGTGGTGTCTTCTACAGATGGAAAATCAATGCTCTCTTTCGAAAATGTTAAAAGAATGTGTCAATTGCAGTCCCTGCTCATTGAAATGGGTGAAGAAGAGTTCTACAACTTATGCCAACGACCATTACATTCAGAAGAACTCTGCTGTCCTACATGGAGTGTGCCAAATTATATAGCTTTAATATCTGGTAAGGATTCATGTGAAAATATTACAAAAAGCGATGTTGAAAATGTTGTGAATATTTTATTAAAATGTGCAAGTTACTTTCATAACTTTACTTTGATGGCGTCATGCGAATTAGGTAGATGCAGGGTACCAAGCTACTGTTCACAGTACGATGCTGTATATAACTTACTATTTTATATTATAGACTCTAAAGCTTTTTCTCCCCCAACATTCTCGGAAACATTTGTCGAGAATGTTATGATTTTTCTTCCACTACCCAGCAGTGGCACAACCCTACCTTACTACATGAAACTACAAAACTTTGGTTGGTCCTATGAAACTCTTGTGGTCCCCGCGATTGACTTTGGTTTAAAAAATGCTTTATTTGACCTGTGGATAATAGAAGACACTTGGCTAATGGGCCTTGGAGGCCTTTTTGTATTCATTTGCATTTGGATTTATACCAAATCTCTACTTCTCACTATCTTGTTGTTTACCGCAATCACATACTCCCTTGGAGTTGCATATTTTCTTTATGTATACGTCTTTAACTTGGAATTTTTTCCATTTATGAATTTATTAGTGATAGTCGTTGTGATTGGTATTGGGGCTGATGATGCTTTCCTCTATGTAAAAGTTTGGAATATGATCAGCAAGCAGCTCATTAAAGATAATATTGTGTGTGACAATGACGATTTAGAAAATATAAAAAATGTATCCAGTGCTGGCGAGACTATTCTTGTGCAAATACTATCGGAGACTTTAAAGCACTCCATTCTTGCAATATTCATCACAACCTTGACAACTGCTATTGCATTTTACGCTTCATATATCAGTTACATTCCTGCGATTAATTGTTTCAGTGTTTTTGCTGGGACGGCAGTATTAGTCAACTTTTTTCTTATGGTCACTTGGCTGCCAGTATCAGTATATATATTAGATGTAAAATTATGTATTAATAGATGGACATTGTTAGGTGCAATTAGTGATGCTGTTAATGAGATTGGTGAGGATATCAAAGTTATATTAAATAGATTTATAATAACTTGTATAATGAGGTTGCATATATGTTTAGTAGTGATTCTGGGTGCTATAGGAATTGGCAGTATTGTAGTCGTTTTTTACTATCCGGGACTTCAACTTCCAGACTCTAAACAGTTTCAGTTGTTTCAATCTTCACATCCTTTTGAACAATATGATATTCACTACAAAGCAAAGTTTTTATTCGAAAGATTCGGCCGCAACACAGAGATCGGTGCTAAAATGCCTCTCAGATGGGTTTGGGGTGTCCAGGCTGTTGACAATGGAGATCACATGAATCCCTTCTCAAAAGGAGAACTCGTTTTTGACACAAGTTTCAATATTTCAAATCCAAATTCCCAAAAATGGCTGTTAGAGTTCTGTACTAAAATAAAAAGGCAGCCGTTTTATCAGCAAACTTTGGGACCTCTTTTGCCAAATTGCTTTATTGAAAGTTTCAAAGCGTATATGAGTAGGAGGTGCATAGATAATATCGACAAGATTAACAGATCGCCATGCTGCGAATCATCCCGATTTCCTTACGATACAGAAGTTTTTAACTTTTGCATCATAAAAGCTATGGAGTCGTTATACCAAACACCCCGCGAATTGTTTATGCCTGGAGTCGCCGGTCCTAAATTCTTGAGACGTTCAAATCCCCCCACCATTGCCGCAGTGGTCGTAGAGTTTGAAAGTGTCGTACCTTATTCGATGTCATATAAGGAGATGGATGATTTTTATCTTCAAGTCGAGAACTGGACGGTTCAAGAATTGAAAAATGCTCCTGAGGGGATGAAGCATGGATGGTTTCTATCTGACCTTCAATTCTATGACTTACAAAACACCTTAGCAAGTGGTACTGTGGTAGCTCTACTGTTGTCAGCTGGTTTAGGTTTTATGGTACTTGTTCCGTCAACGTTCAGTTTTATAGTCAGCTCCTGTGCTCTATTGGCCATGATATTTTCGTCGACCGTTACAATAGCCATATTAGTATTAAACGATTGGAAGTTGAATATATTAGAAAGTATAGCAATATCGACATCAGCAGGGTTAGCTGTAGATTTTAGTCTGCATTATGCATTAAGTTATACAAACTCTAATGGACCTAAATCCACAAGAGTTAAATTCGCTCTTTCGGCATCATCAGGACCTACCGCAGCGGCTGCTCTTACAACAGGTTTCGCTGGCATATTTTTAATACTTTCGAATCTTCTCCCCTATTCACAAATAGGGACGTTCCTTGCATTAATAATGTCAGTCAGTTGGATTTATTCGACATTTTTTCTATGTTCTCTATTGTATTTGTTCGGGAGGAATTCCGCTAAAGAAACGCCTGCCGATGAAACCAAATCCATTTCACGTGTAAGTTCAATATGTTCTGCTGTGCCGAACTTAGAGAGTCACGAGTTAGAACATTTAGCAGACAGCAATCGCACAAATATTACACACTCCCATAGTACTTGCGTTAGCGCAACGACAGTGGTCATCCACGACGACGCTGAGAACGCGCTGGAGAAAGCTGAGAAGAAACCTAGCGTTGATATAATTAACGACTGA

Protein sequence:

>DPOGS210037-PA
MLSAYARFIVRYSYFFLFIIIVISTVLTVIPLLCHEIPSFSDPVVGFETRGTTLAHRFIAWENLNDETRPSKRLAVNPKEIEDQIRMNETYNKKKQDKSRSGKKHPKKKHRKKLHNNTGFAKTLFNSPEFNASKGHVHWGYGKNVSFEDENTVFLKDHTRNQWKSILKMQQSSGNVVFHNYASGVCGAPVADYAHLVVSSTDGKSMLSFENVKRMCQLQSLLIEMGEEEFYNLCQRPLHSEELCCPTWSVPNYIALISGKDSCENITKSDVENVVNILLKCASYFHNFTLMASCELGRCRVPSYCSQYDAVYNLLFYIIDSKAFSPPTFSETFVENVMIFLPLPSSGTTLPYYMKLQNFGWSYETLVVPAIDFGLKNALFDLWIIEDTWLMGLGGLFVFICIWIYTKSLLLTILLFTAITYSLGVAYFLYVYVFNLEFFPFMNLLVIVVVIGIGADDAFLYVKVWNMISKQLIKDNIVCDNDDLENIKNVSSAGETILVQILSETLKHSILAIFITTLTTAIAFYASYISYIPAINCFSVFAGTAVLVNFFLMVTWLPVSVYILDVKLCINRWTLLGAISDAVNEIGEDIKVILNRFIITCIMRLHICLVVILGAIGIGSIVVVFYYPGLQLPDSKQFQLFQSSHPFEQYDIHYKAKFLFERFGRNTEIGAKMPLRWVWGVQAVDNGDHMNPFSKGELVFDTSFNISNPNSQKWLLEFCTKIKRQPFYQQTLGPLLPNCFIESFKAYMSRRCIDNIDKINRSPCCESSRFPYDTEVFNFCIIKAMESLYQTPRELFMPGVAGPKFLRRSNPPTIAAVVVEFESVVPYSMSYKEMDDFYLQVENWTVQELKNAPEGMKHGWFLSDLQFYDLQNTLASGTVVALLLSAGLGFMVLVPSTFSFIVSSCALLAMIFSSTVTIAILVLNDWKLNILESIAISTSAGLAVDFSLHYALSYTNSNGPKSTRVKFALSASSGPTAAAALTTGFAGIFLILSNLLPYSQIGTFLALIMSVSWIYSTFFLCSLLYLFGRNSAKETPADETKSISRVSSICSAVPNLESHELEHLADSNRTNITHSHSTCVSATTVVIHDDAENALEKAEKKPSVDIIND-