Monarch geneset OGS2.0

DPOGS210251
TranscriptDPOGS210251-TA3792 bp
ProteinDPOGS210251-PA1263 aa
Genomic positionDPSCF300196 + 732208-746046
RNAseq coverage269x (Rank: top 40%)
Annotation
HeliconiusHMEL0213500.040.52% 
BombyxBGIBMGA002383-TA2e-4536.76% 
Drosophilaeater-PB1e-13536.66% 
EBI UniRef50UniRef50_B4JHF94e-14336.27%GH18950 n=10 Tax=Drosophila RepID=B4JHF9_DROGR
NCBI RefSeqXP_001989724.18e-14436.27%GH18950 [Drosophila grimshawi]
NCBI nr blastpgi|1950365322e-14236.27%GH18950 [Drosophila grimshawi]
NCBI nr blastxgi|1950365320.036.00%GH18950 [Drosophila grimshawi]
Group
KEGG pathwayssc:4455203e-29 
 K06252 (TN)maps-> Focal adhesion
    ECM-receptor interaction
InterPro domain[146-343] IPR0090301.5e-08Growth factor, receptor
Orthology groupMCL11207 Insect specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS210251-TA
ATGCGTTTCATTATTTTCATCTTCATAGTGTTGTGTTCCGCTAGTGCCTTTGAAGCTTTGAAAGCTCATGATCCTGGTGTATGCGTTGTTTCCCGAAGTGTACGCAAAACTAGACTCAAATATTACAAAGTGAGAAGCATGTGCAAAGGCAAGAGGTGCATTATAAAGAAGAGCAAAGTCGAGAGCTATAAAGTTAATCAAAATGAAAGTGTATGCTGTACTGGTTGGGCCTACTCCGCCGTGCTGGACGCCTGTTCTCCAAGCTGCAGCATGGGTTGTGTTGGAGGTCGATGTGTCTCTCCGGAGGTCTGTCAATGCGATCCCCCTGCCACATTGCATCCATTACATAACAACGTGTGCGTCACCTGCGAGCCGGCATGTGAAAACTCCAAATGCGTTAACAACACCTGCATCTGCTTTGAGGGTTATCAGAAAATAAATAACACTTGCCAACCGGTTTGTGACTCCTGTGTTCACGGATTGTGTGTGGCGCCGAACAGTTGCCGGTGTCATCCTGGTTACGGTGGTGAGAATTGCGAGCCCCTGTGTGATAACTGTGATAACGGTGTTTGCGGTGAACCCAACGTGTGTTCGTGTAGGGAGGGGTATCTACGAAACGCTAGCGGCTGTCATAAACCTTGCCCGGCGGACTGCAAATCTTGCGATAGTCAAGGCCAGTGTCAGGACGGGGTTTGCCACGGATTCATGATGAAGGGAAGACTATTAGAGCGATGCTGTGACGGTTGGGAATATGACAACCGAATGCGTCGCTGCAAGCCTTCCTGTTTAAGCGGCTGTGGAGATGGCGAATGTGTGGCGCCTCAGAGATGCGAATGTAAACCACCGCTTATACTAGACAGCAGTAAAAAGTGCGTCCATCCGAAACCACGTTGTGATTTACCTTGCACGAACGGTGCCTGCACAGCGGACAATGTATGCACATGTGATGCGGGTTATACACAGAAAGATACGTACACTTGCGTGCCAAAGTGTGGACAGTCCTGTATAAACAGTGTTTGCGTTGCACCTGACACTTGCCAATGTCTGGATGGGTTTGAATCTCAAGGAAAATGGAAATGTGATCCGGTATGTGACGATTGTAAAGATGGTAAATGTGTCGCACCGAACACGTGCCATTGTAATAGTGGATACTCTAAAGTGAACGGCAAATGCGTACCAGTATGTGAGGGCGAATGCCAAAACGGATTTTGCGCAGGACCAAATAAATGCGAGTGTAATTTGGGATACGAGATTGATCCTTTAGATAGATTCACTTGCCGCCCGGTCTGTAATCCGGCTTGCGTGAACGCGTCATGTGTGTTCCCAGGCACATGTTCCTGCTATCCAGGATATGAATCACTTACTGCAAATATTTGTAAGCCAAAATGTGATGACTGTTTGAATGGAGATTGCATTGGACCAAACGAATGTCGTTGTCAAGAAGGTTATGAATTGATCGGAACAAAATGCAAGCCTGTATGTAGTCAGATATGTGTCAACGGATATTGTTCAACACCAGACACCTGTAGCTGTAATAATGGTTACGAATTGGATGCTCGCGATAAGTTTACTTGTAATCCAATTTGTAAAGAAAAATGTATTAATGGAACGTGTGTAAGTCCTGATATATGCCAATGCTTTGAAGGCTACGAAAAAACTAGCAACGACAATTCTTGTAAACCGAAATGTTTAAGTTGTGAAAATGGGATTTGTATAAGACCTGACGTTTGTTCGTGCGATGACGATTATGTTTTATATAATGGAACATGTGTCCCCGTTTGCTCGAGTTTATGTATCAATGGGTATTGTAAATCACCAAATGAATGTGGCTGCCTGGATGGTTATATTAGAAATTCCTCGAATCCCGCAGCATGTTACAAGCCTTGTTCTGGCCTCTGCAACAACGGCATCTGTAACATAGATGGCAACTGCATTTGTGATCCCGGCTACGAGTTACATCAAAATGGATCCTGTGTTGCCATAACCATGGTGCATTGTGAGAATTGCAATGGTACTTGCGGAGACGACGGTCATTGTAAGTGTTGGGATGGAATCACGTGTTCCAATATCACCTTCATCGAGCCAGCAAGTGTGAAGTCAGCTGAAGTGTTAGCAGGTCTACAATTAACGTGGTTGCTGGGAGGTTGTATAAGTTTCCTTCTCCTCGTTCTGGTAATTGTGGTCATGGCACAAATGTGGCGGAAGAGACAAGAATTCGTCACGAAGTCCGTTGATGGTGTAGGAGGCAACCAGTACGGCAGTGTCGTTTACACGGTCCCAGACACTCTTATGAAACGAAATGTCAGCGACGAAGCCTGTAGTGATAATGATGAGGCCGAGGAAGTCACAGCCCAGGATAAACTTGAAGCGGCTGAACGTCTTCTAGCGAGATATAGAGAAACTGAAAACAATGTTTGTCAGCCCTACTGTTCTAAAGGATGTTTAAATGGTATTTGTACAAGTCCTGAAAATTGCACTTGCAATGATGGTTGGTATAAAGAGGAGGAAAAATGTAAACCATATTGTGAGTTCGACTGCGGTGGTGGCACATGTGTAGCCCCAAATAGTTGCGTATGTAATCCAAATTACATTAAGGCTGAAAACTTAACATGCGTACCTCATTGTTCCCAAGGATGTGCAAATGGAATTTGTGTTAGCCCAGAAAATTGTGTTTGTAACAAAGGATGGGCTAAGAGTAATGATCTAAACGTCTGTTTGCCACATTGTGAGTTTGAATGTGGCGGAGGTATTTGTGCCAGTCCAAATGTTTGCGAATGTTATGCTGGTTATATTATGTCTGCTAATGGAACATGTATACCCCATTGTCCTCAAGGCTGCCCACACGGTCAGTGTGTGCAACCAGGAAATTGTAGCTGTGAAAATGGATGGTATAAAAACGAGACTCATGACGAGTGCCGTCCTATTTGTGATAACAATTTTATAAATAGTGTTTGTGTTGCACCAAATACATGCGAGTGTTTATCTAACTACACTAAGGCTGAGAATGACTCATGTGTACCTTATTGCTCTTCGGGATGTCCAAATGGCACATGTGTTAATCCAGAAGAATGTGAATGCAATGATGGCTGGCAAAATAATGAGAATGGTATTTGTGAACCAAAATGCAATAGCCCATGTGGAAATGGAAAATGTATAGAACCTGATGTTTGTGAATGCTTTCCTGGATACAAGTTCAATATTGACAATGATGTGAAATACTCGAATGGTCTATGCATCCCTGAATGTACGGGATGCAATGGAACTTGTATAGCACCAAATAATTGTGTCTGTGATAGTCCACTACAAGCTGTAAACGTAACAGAGGACGGACAAAAATGTGATTGCATCGATTTTTGTTTCGAAGGTCAAAATATATGCCGAGGTACTGCTTGTGTTTTGAACGATACTTATGTTTCTACATCTGACGGCTTGTACGATACGATGGAGAGTACAATCATCAGCACGATTACTGACGAGGTGAGAAGTGACGGCATGACAACTGATAATATTTTAGAAGAAACATCAAGTTCGTCTTTTGATTCGGATACTTTAAGCGGAAGCCAAGGAATTTACCAGATACCATACTGGGCCTATTTTGCAATTCCGTCTATAACAATAGTTTTAATAGTATCCAGTATCCTTATCTGTAATCGACGAGCCATATCACAATATTGTAAGGGCAGCAGTTATGTTGTTGAAGATGACAAAACATTACATGGAAGTGTTTCTTTCAACAATGTCCGTTCAAATCCCTTAAAACCCGAACCTGAACTGATCTCAGGAGATATTTAG

Protein sequence:

>DPOGS210251-PA
MRFIIFIFIVLCSASAFEALKAHDPGVCVVSRSVRKTRLKYYKVRSMCKGKRCIIKKSKVESYKVNQNESVCCTGWAYSAVLDACSPSCSMGCVGGRCVSPEVCQCDPPATLHPLHNNVCVTCEPACENSKCVNNTCICFEGYQKINNTCQPVCDSCVHGLCVAPNSCRCHPGYGGENCEPLCDNCDNGVCGEPNVCSCREGYLRNASGCHKPCPADCKSCDSQGQCQDGVCHGFMMKGRLLERCCDGWEYDNRMRRCKPSCLSGCGDGECVAPQRCECKPPLILDSSKKCVHPKPRCDLPCTNGACTADNVCTCDAGYTQKDTYTCVPKCGQSCINSVCVAPDTCQCLDGFESQGKWKCDPVCDDCKDGKCVAPNTCHCNSGYSKVNGKCVPVCEGECQNGFCAGPNKCECNLGYEIDPLDRFTCRPVCNPACVNASCVFPGTCSCYPGYESLTANICKPKCDDCLNGDCIGPNECRCQEGYELIGTKCKPVCSQICVNGYCSTPDTCSCNNGYELDARDKFTCNPICKEKCINGTCVSPDICQCFEGYEKTSNDNSCKPKCLSCENGICIRPDVCSCDDDYVLYNGTCVPVCSSLCINGYCKSPNECGCLDGYIRNSSNPAACYKPCSGLCNNGICNIDGNCICDPGYELHQNGSCVAITMVHCENCNGTCGDDGHCKCWDGITCSNITFIEPASVKSAEVLAGLQLTWLLGGCISFLLLVLVIVVMAQMWRKRQEFVTKSVDGVGGNQYGSVVYTVPDTLMKRNVSDEACSDNDEAEEVTAQDKLEAAERLLARYRETENNVCQPYCSKGCLNGICTSPENCTCNDGWYKEEEKCKPYCEFDCGGGTCVAPNSCVCNPNYIKAENLTCVPHCSQGCANGICVSPENCVCNKGWAKSNDLNVCLPHCEFECGGGICASPNVCECYAGYIMSANGTCIPHCPQGCPHGQCVQPGNCSCENGWYKNETHDECRPICDNNFINSVCVAPNTCECLSNYTKAENDSCVPYCSSGCPNGTCVNPEECECNDGWQNNENGICEPKCNSPCGNGKCIEPDVCECFPGYKFNIDNDVKYSNGLCIPECTGCNGTCIAPNNCVCDSPLQAVNVTEDGQKCDCIDFCFEGQNICRGTACVLNDTYVSTSDGLYDTMESTIISTITDEVRSDGMTTDNILEETSSSSFDSDTLSGSQGIYQIPYWAYFAIPSITIVLIVSSILICNRRAISQYCKGSSYVVEDDKTLHGSVSFNNVRSNPLKPEPELISGDI-