Monarch geneset OGS2.0

DPOGS213776
TranscriptDPOGS213776-TA1917 bp
ProteinDPOGS213776-PA638 aa
Genomic positionDPSCF300212 + 302663-311407
RNAseq coverage0x (Rank: top 99%)
Annotation
Heliconius% 
BombyxBGIBMGA009261-TA7e-2338.21% 
Drosophila% 
EBI UniRef50UniRef50_P041483e-0628.57%Fibrohexamerin n=3 Tax=Obtectomera RepID=SI25_BOMMO
NCBI RefSeqNP_001139413.15e-0728.57%fibrohexamerin precursor [Bombyx mori]
NCBI nr blastpgi|2255432831e-0528.57%fibrohexamerin precursor [Bombyx mori]
NCBI nr blastxgi|574720054e-1225.93%minus agglutinin [Chlamydomonas incerta]
Group
Gene OntologyGO:00055762.9e-14extracellular region
GO:00051982.9e-14structural molecule activity
KEGG pathway 
InterPro domain[473-625] IPR0099112.9e-14Fibroin P25
Orthology groupMCL20947 Lepidoptera specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS213776-TA
ATGTTGTCTTGTTTAGTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCTGGTGTAGGACGGGGCGGAATTGGTAATTTGCGGAATACTGTCTCACAGCGTAAGTTTATGGAATTAGTTAACAAGTATAAAATTTGTATTAATACGAATACATTGAAAAAGAAATTCATGTTGTCTTGTTTAGTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCTGGTGTAGGACGGGGCGGAATTGGTAATTTGCGGAATACTGTCTCACAGCGTAAGTTTATGGAATTAGTTAACAAGTATAAAATTTGTATTAATACGAATACATTGAAAAAGAAATTCATGTTGTCTTGTTTAGTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCTGGTGTAGGACGGGGCGGAATTGGTAATTTGCGGAATACTGTCTCACAGCGTAAGTTTATGGAATTAGTTAACAAGTATAAAATTTGTATTAATACGAATACATTGAAAAAGAAATTCATGTTGTCTTGTTTAGTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCTGGTGTAGGACGGGGCGGAATTGGTAATTTGCGGAATACTGTCTCACAGCGTAAGTTTATGGAATTAGTTAACAAGTATAAAATTTGTATTAATACGAATACATTGAAAAAGAAATTCATGTTGTCTTGTTTAGTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCTGGTGTAGGACGGGGCGGAATTGGTAATTTGCGGAATACTGTCTCACAGCGTAAGTTTATGGAATTAGTTAACAAGTATAAAATTTGTATTAATACGAATACATTGAAAAAGAAATTCATGTTGTCTTGTTTAGTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACCGGCTCACAGCTTCCCGGCGTAGGACAGGGCGGAATTGGTAATTTGGCCAATACTGGCTCACAGCATCTCACCCAAGGACCATTACCGATATCGAGTGTAATATTAGGTGATGAAACTAACATAGAGAGGCCGTGTCAATCATTCGATATTTACTGTATCAGACGTTACTTCAAAAAGAACAGCAAATGTCAAGAAGTTTTAGGACCCGTTCCAGATCCGTACTATAGAGCCCAGACGTCAGATATATTAGGTAAACCAGAAAATGTATATCATACCAGTAGCTGGCCATATCTCAAAAGAAGAGACTTCTTCACCGTGTCCACACCTGACGATGAGGGCTACATCGAAAAACCTTGTAGGATTTACGACGTAAATTGTATAAGGCAATTTTTTGCGGAACACTCCCGTTGTAATATAACTTACGGGCCTGTCCCAGACCCGTTGTACGATCCCACATACACTCTCTATTTGCCAAGAATTAATGTAACCCTAACTTCATTAAAAGTGGAATACACAGGACTTAATGGAAAAATCGTAGAGTTTTACATAAACCCCAAGACTGATAAATTGGTGCTATCAGTCAATTTTGAGGGTCTCAGTTTTGGCTCAAACGACAATTACTTCCAATTTGCAAGAGTCGGAAGAGAACCTCTCGTTACGAATACATTCCTTAACGTATCTTACACAATCGTGAGTTCAACAATCACCATACCTAATTTGAAAGATTTGCAACTTCAAAGTAGTGAAGTTTTTTCATTCTCGGACACACCGGATGTACCTATTTTCGATGTTGGACCCAAAGCTTTCGGTGGTGCATGTTCGACTTCTTCCAACAGCTGTTGA

Protein sequence:

>DPOGS213776-PA
MLSCLVPGVGQGGIGNLANTGSQLPGVGRGGIGNLRNTVSQRKFMELVNKYKICINTNTLKKKFMLSCLVPGVGQGGIGNLANTGSQLPGVGRGGIGNLRNTVSQRKFMELVNKYKICINTNTLKKKFMLSCLVPGVGQGGIGNLANTGSQLPGVGRGGIGNLRNTVSQRKFMELVNKYKICINTNTLKKKFMLSCLVPGVGQGGIGNLANTGSQLPGVGRGGIGNLRNTVSQRKFMELVNKYKICINTNTLKKKFMLSCLVPGVGQGGIGNLANTGSQLPGVGRGGIGNLRNTVSQRKFMELVNKYKICINTNTLKKKFMLSCLVPGVGQGGIGNLANTGSQLPGVGQGGIGNLANTGSQLPGVGQGGIGNLANTGSQHLTQGPLPISSVILGDETNIERPCQSFDIYCIRRYFKKNSKCQEVLGPVPDPYYRAQTSDILGKPENVYHTSSWPYLKRRDFFTVSTPDDEGYIEKPCRIYDVNCIRQFFAEHSRCNITYGPVPDPLYDPTYTLYLPRINVTLTSLKVEYTGLNGKIVEFYINPKTDKLVLSVNFEGLSFGSNDNYFQFARVGREPLVTNTFLNVSYTIVSSTITIPNLKDLQLQSSEVFSFSDTPDVPIFDVGPKAFGGACSTSSNSC-