Monarch geneset OGS2.0

DPOGS214078
TranscriptDPOGS214078-TA4311 bp
ProteinDPOGS214078-PA1436 aa
Genomic positionDPSCF300014 - 2546840-2551150
RNAseq coverage1x (Rank: top 95%)
Annotation
Heliconius% 
Bombyx% 
Drosophila% 
EBI UniRef50UniRef50_D7G5P73e-0733.91%Similar to Mucin-1 (MUC-1) (Polymorphic epithelial mucin) (PEM) (PEMT) (Episialin) (Tumor-associated mucin) (Carcinoma-associated mucin) (Tumor-associated epithelial membrane antigen) (EMA) n=2 Tax=Eukaryota RepID=D7G5P7_ECTSI
NCBI RefSeq%
NCBI nr blastpgi|3555622081e-1534.11%hypothetical protein EGK_15525, partial [Macaca mulatta]
NCBI nr blastxgi|2198477342e-4127.63%laminin G domain-containing protein [Chloroflexus aggregans DSM 9485]
Group
KEGG pathway 
Orthology group 
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS214078-TA
ATGGACGTGAATCCCCGAAATGTTTTAAGAGAAATTTGTAATTTGTTTGGAAAGATAAAGCCACATGGTTGTGTGAATCCCAGCAGCATGCCAAAAGATCCTAAAAATGGTCCAGCAGATTCCAATTCAAATATAAAACCTACTCCTAAAAATAAAGAACAACCTCCTCTAACAACAGAAAGTGAAAGTACAGGACAAACCATAGAAACTTCCGGTGTGACAACATCAGAACTTTCCACATTTCCAGATAGGAGGCCATATTCATTTTCAAGCACAAACTCAACTAATATTGTAACCGAAATGTCTTCGTTAGTAACAACTTCAGATCCTGAAAATAATTTTATGACTGAAAGAAGTTCCATTATCAATGAGGCTGCTTCCCTAGGTCCTGAACAAATAACAAATCCCGAAAAATCCGGATTAAATGAATTACCACTTGCGAGTACATCCACAACTTTAGCTTTAGAAACAAGCCCTTCGGTCACAAAGTCTCAAACAGGTGCACATATAACAAGACCTCATAAAATAAAGCCGCCAAAAACAAAACCACATATAACAAAGCACCCAAAACATAAACCTTCAGTAACAAAACTACCAAAATCACATAAAACAAAACACACTGTAACAGTACAACCAACAACTATAAGTTCAACCCCTATTATAACTGTTGTAACTGAAACTACGCTGTTTCCTTTAGAAACATCATCACTCGACCCTATGAATCGGCCGGAAATATCTAGCCTAGCAACAGAAACCTCATTTACACCAATTTCAACACCGAGAGTCACTGATATGATGACAGAATCATATATAACTTCGAAAAACCCAACTATGGATACTCAAAATCCCAACATATCTATTACGACGAACGAAACTTCTTCACCAAGCGACGCAAAGCCACCGATTTCAACACCAGAGATTACTAATATAATAACAGAGACACCTTTAACTTTCAATCCTATTGAAACTACCGCCCGGGGAGAAAATTCATTACCAAGTGTGACTATGACATCCATGAAAATTTCAGGCGATTCTCAAACACCGACAGTAACGACTGTACCTGGGGAAAATCCAGCTAGTGGAACAACTGTCTCACCCGGACAGACTCCTTTACCTGGTGGGACTCATCCACCAAATCTGACTTCTCTTCCTGAAGAAAGTCCAGATTCTGAAGAATCTGCTGAATCAGAAGTAACACATCCACCTTCAGTAACGACTGCCCCGGAAGGAACATACAAACCCGAGAATGGAGTTACTGCCTCATCAGGACAAACCAGTGCACCCGCTGAAAGTCATCCACCTAATATGACTTCCATGACATCCATGACAACGTCAGGTCATTCTCAAACACCGATAGTAACGACTATACCTGGGGAAAATCCAGCTAGTGGAACAACTGTCTCACCCGGACAGACTCCTTTACCTGGTGGAACCCATCCACCAAATCTGACTTCTCTTCCTGAAGAAAGTCCAGATTCTGAAGAATCTGCTGAATCAGAAGTAACACATCCACCTTCAGTAACGACTGCCCCGGAAGGAACAAACAAACCCGAGAATGAAGTTACTGCCTCATCAGGACAAACCAGTGCACCCGCTGAAAGTCATCCACCTAATATGACTTCCATGACATCCATGACAACGTCAGGTCATTCTCAAACACCGATAATGCCTGGGGAAAATACTGCTAGTGGAACTACAGCCTCGCCTGGACAGACACCTTTACCTGGTGTAACACATCCACCAAATCTAACTTCTCTTCCTGAAGAAAGTTCAGATTCAGAAGAATCTGCTGAATCAGAAGAAACACATCCACCTTCAGTAACGACTGCACCGGAAGGAACAAACAAACCCGAGAATGGAGTTACTGCCTCATCAGGACAAACCAGTGCACCCGCTGAAAGTCATCCACCTAATATGACTTCCATGACATCCATGACAACGTCAGGTCATTCTCAAACACCGATANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTTCAGATTCAGAAGAATCTGCTGAATCAGAAGAAACACATCCACCTTCAGTAACGACTACACCGGAAGGAACAAACAAACCCGAGAATGGAGTTACTGCCTCATCAGGACAAACCAGTGCACCCGCTGAAAGTCATCCACCTGATATGACTTCTATGATATCCATCATAACGTCAGGTAATTCTCAAACACCGATAATGCCTGGGGAAAATACTGCTAGTGGAACTACAGCCTTGCCTGGACAGACACCTTTACCTGGTGTAACTCGTCCACCAAATCTTACTTCCCTTCCTGAGGAAAATCCCGATTCAGATGCAACTGCTGAATCAGCAGCAACCCATCCACCCACTGTTACAACTGCTCCCGAAGAAACAACAGAGTCTTGTGGCTGTTCCGATTCAGAAAAATCTCACGAACCAACAGATAACGAAGAGTCATCCAAAAAAAAACCTCTTATAGACATAAATCTAGATGTTTTACTAAAACCGCTACTGGGAAATATCTTATAA

Protein sequence:

>DPOGS214078-PA
MDVNPRNVLREICNLFGKIKPHGCVNPSSMPKDPKNGPADSNSNIKPTPKNKEQPPLTTESESTGQTIETSGVTTSELSTFPDRRPYSFSSTNSTNIVTEMSSLVTTSDPENNFMTERSSIINEAASLGPEQITNPEKSGLNELPLASTSTTLALETSPSVTKSQTGAHITRPHKIKPPKTKPHITKHPKHKPSVTKLPKSHKTKHTVTVQPTTISSTPIITVVTETTLFPLETSSLDPMNRPEISSLATETSFTPISTPRVTDMMTESYITSKNPTMDTQNPNISITTNETSSPSDAKPPISTPEITNIITETPLTFNPIETTARGENSLPSVTMTSMKISGDSQTPTVTTVPGENPASGTTVSPGQTPLPGGTHPPNLTSLPEESPDSEESAESEVTHPPSVTTAPEGTYKPENGVTASSGQTSAPAESHPPNMTSMTSMTTSGHSQTPIVTTIPGENPASGTTVSPGQTPLPGGTHPPNLTSLPEESPDSEESAESEVTHPPSVTTAPEGTNKPENEVTASSGQTSAPAESHPPNMTSMTSMTTSGHSQTPIMPGENTASGTTASPGQTPLPGVTHPPNLTSLPEESSDSEESAESEETHPPSVTTAPEGTNKPENGVTASSGQTSAPAESHPPNMTSMTSMTTSGHSQTPIXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSDSEESAESEETHPPSVTTTPEGTNKPENGVTASSGQTSAPAESHPPDMTSMISIITSGNSQTPIMPGENTASGTTALPGQTPLPGVTRPPNLTSLPEENPDSDATAESAATHPPTVTTAPEETTESCGCSDSEKSHEPTDNEESSKKKPLIDINLDVLLKPLLGNIL-