Monarch geneset OGS2.0

DPOGS206752
TranscriptDPOGS206752-TA1296 bp
ProteinDPOGS206752-PA431 aa
Genomic positionDPSCF300316 - 3591-8559
RNAseq coverage1x (Rank: top 94%)
Annotation
HeliconiusHMEL0111662e-3651.17% 
BombyxBGIBMGA009721-TA5e-1532.82% 
Drosophila% 
EBI UniRef50UniRef50_C5DTP03e-2148.44%ZYRO0C10120p n=1 Tax=Zygosaccharomyces rouxii CBS 732 RepID=C5DTP0_ZYGRC
NCBI RefSeqNP_001112374.11e-1238.75%chorion class CB protein M5H4 precursor [Bombyx mori]
NCBI nr blastpgi|2545801971e-2048.44%ZYRO0C10120p [Zygosaccharomyces rouxii]
NCBI nr blastxgi|1499294542e-3236.67%minor ampullate spidroin-like protein [Nephilengys cruentata]
Group
Gene OntologyGO:00073042e-28chorion-containing eggshell formation
GO:00052132e-28structural constituent of chorion
GO:00072752e-28multicellular organismal development
GO:00426002e-28chorion
KEGG pathway 
InterPro domain[144-329] IPR0026352e-28Chorion protein
Orthology groupMCL19879 Lepidoptera specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS206752-TA
ATGTCTCCCATCGCTGTAGCATTGCTGTGCATCCAAGCTTGCTTGGTTCAGAATGTATACAGCCAGTGTCTGCGAGGACCGTTTGCGCCTGGATTTGCTGATTCCAGGGCTTACGCTCTAGAAGCAGGTCTTCCTGGTCTAAATGGCTTCGCATTGGATGCTGGATTGGCTGGTCCATATGCTCTGGAGGCAGGTCTTTCTCCAGCATTCGGTTATCCAGCCGCTTTATCCGGATTAGCTGGTGCTGGTGCTTACGGAGGTGCTGGTATTGGCGATATAACAGTCGCTGGTGAGATGCCCGTCGCTGGAACCACCCTCGTCGCTGGACAGGTGCCTATCCTAGGATCTGTTGGATTCGGAGGTCTTGTAGCCGCTGGTGGAACCGTCTCCATCGCTGGAGGGTCCAGGCATCCAACACTCAACATGTTCAAGACTGTTCTCGTAGTTTGCGCTCAAGCGCTCTTCGTCCAGTCCATTGCTGGACAGTGTCTTGGAGCTGGATTCGGTCCTCTCGCCGCTGAAATTCCTCTGTCTGCTGCCAACTGGGCTGGTATGTCTGCTGGTCCTTGCGGTGCTGCTGGTCTCTTTGACGGTTCTTGGTCTGCCGCCGGTGGTCCCTTCTATGGTGCTGGTTACGGACCTGCTGCCGCTTCTGCCTCTCATGGAGCTTTACCTGTATCCAGTGCATCCATGATCCCACCAAGTGGAGTGTCTGTACGATCAGACAACGCCATCGAAGGACCTCTCGCAGTCTCCGGTGCTCTGCCATTCCTGGGAACCGTAGCTCTGGAGGGCGCTCTGCCCACCGCTGGTGCTGGTGCAGTGGCTTACGGTGCCGGTAACGGAGAAGTCGCCATGTTGTCTGAAGATATCGGTGCCGATGGATTCAACTCCCTGGCTGGTGGTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGTTATGGAGCTGGTGCTCTTGGCTATGGAGCTGGTCCCCTTGGCCTTGCAGCTGGTCCATTAGGATACAACGGCGCTTTATCTGGCCTAGGATATGCACGAGCTGGTTGCGGCTGTGGCTCACGACTCATCTAA

Protein sequence:

>DPOGS206752-PA
MSPIAVALLCIQACLVQNVYSQCLRGPFAPGFADSRAYALEAGLPGLNGFALDAGLAGPYALEAGLSPAFGYPAALSGLAGAGAYGGAGIGDITVAGEMPVAGTTLVAGQVPILGSVGFGGLVAAGGTVSIAGGSRHPTLNMFKTVLVVCAQALFVQSIAGQCLGAGFGPLAAEIPLSAANWAGMSAGPCGAAGLFDGSWSAAGGPFYGAGYGPAAASASHGALPVSSASMIPPSGVSVRSDNAIEGPLAVSGALPFLGTVALEGALPTAGAGAVAYGAGNGEVAMLSEDIGADGFNSLAGGLGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGALGYGAGPLGLAAGPLGYNGALSGLGYARAGCGCGSRLI-