Monarch geneset OGS2.0

DPOGS201253
TranscriptDPOGS201253-TA4752 bp
ProteinDPOGS201253-PA1583 aa
Genomic positionDPSCF300037 + 307093-312411
RNAseq coverage9x (Rank: top 85%)
Annotation
Heliconius% 
Bombyx% 
Drosophila% 
EBI UniRef50UniRef50_G6CX590.099.94%Putative uncharacterized protein n=2 Tax=cellular organisms RepID=G6CX59_DANPL
NCBI RefSeq%
NCBI nr blastp%
NCBI nr blastxgi|1234164384e-3120.76%viral A-type inclusion protein [Trichomonas vaginalis G3]
Group
Gene OntologyGO:00036766.2e-11nucleic acid binding
KEGG pathway 
InterPro domain[15-77] IPR0066126.2e-11Zinc finger, C2CH-type
Orthology group 
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS201253-TA
ATGAACTTTAAGGATGGCACTGAATTTGTTTACTACGACGAAAATATTTTCAGGTTTCCAAGAGATAAAGATTTGTGTCAGAAATGGGTGGACGCCGTTCGTCTTGAACGACATGACCCTTGGTGGAATTCTACTAAGGCGTCCAGAATATGCTCCATTCATTTTAAAAAATCGGATATGATGTCCACCCCCTGTAAAGTCAATGTACTAACCAAATCTGCGGTACCAATTTGTACGATGGTGTGGTATGACAGAGATAGTAATGTATCGTCCAATTTATCACTTCCTACAGAAAATATAAATATCTATGACAATATAACAAAGGCACACGAACTTAAAGAATCTAATCCAAAGGTGCTTGAAGAGTCAAGTACTAACGTATCTGATGATAACGGCCTCGCTTGCCAAGAGTCAGATAAGGTCTTCGATATATTAAAAGAAACCAAAAAGCAACACTTGAATGGAAGTCCAGAGACGGAGTTAGCAAATGAGAGTACATCACAACAAGGAAGTAAAGACCAAGAAGAAGCCATCGATATAGCAGAATTTATAAAATTTAATACAAAAGATACATGTATAAAGCTAAATGATAATACTAGTATAATATTGAAAGAGGATGTCAATGAAAAATCAATCAATACATGTCAGATGCCAAATTCGAGTAAATGTCTAACAAAACCCTTAGAAGTTAACAATTTTAAATTACTTGAAAATAAGGAATCTAAGGATGATAGAAGCGATGAACCAAAAATAGATTTGTGTTCAGGCGAGATACAACAAATTGATTTAAAATCCACTTTTATTGGAAAAATATTAAAAACTTATTTACCGAAAAGAAAGTTTAAGAAATCGCGTCAAAAATTTATTACAGAAGTATGTAAAGACAATGACGAAAACAAATCGATAGATATAAAAAGTGTTAATGATGACTTACCCAATAATCTGTTTAACGAGACGGAAATTAAAATACCCGATAGGCCAATTAATGATACAGAATCGTCTAATGAAATAATAGATAAAAATAACGCAGTCTTCTTCGAAAAGTGTTTAGAGAACGATGATAATGTAGGCGATGGAAAGGAATCGCGGAAAACAGACTTCAATGACATACATTTAGACATTGTTGGAAAACAACAATTAATCTTAGACAAACAATCAATTAATGATATATGTAATGAATCTATTGAAAATATGTGTGTTCAAACAAGTAGAGAATTTCAAATAGGATCAAATTTGAGCGCCAACAGTAATATGATAAAGGACTCAAATACACATTTAATTTTAGAATTAGACACTCAACTTTATACAGAAACCGATGTGGTTGGTAATATTATAGACAGCTTCAAAGAATCCTGTGAATTAACTAATGAACAAAACAATCAACCAAATGACGTCACCGAAATAGCACTAATAACAGAATTAATAGATACTAATGAAAGTATACCAATGAGCGATGAAGTAAATACTTCGTCACATAGAAACGAATTGTCATTGATAAATATATTTGATCCTATACAACCGACCAATGATTTAATTTCTGAAACACAATATGAAATACTTACAGATTTTGATAATAATGCACCAGAATCCCAGCAAAGTAATGATATTTTTAATAATGCTAAATTTCCAACGAAAAATGATCTATTTAATACAGAGACATCGGAAAATATCGATATTGGTTTGGAGAATTTACAATGTGAAGTAAAACTCAATTCAACGTTGAATGAATTTGATCCCAAAAAGGGAGAACAATATGTGAGTTTTGTTAGCATTGAATCATCTTTAAACAATAGTAATTTAGACACAATCAGGCAATTAGGTGCATCAGAAATTGATAAAGAAGGAATTAGTTTTTTAAGTAAGGACGTTAGAATAAACGTTAATGGTTACGAGGAAGGAGATTTAGAACACCAAATAATCCTACAAAAAGATGTCCTAACATCAAGAGAAGATGAGAGAAATAAAGTTATTGTAAATAATTTAATATGGGAAGGAAATCAAGAAGACCTAATTCTGTCAGCCAACCTAAAATGCGATAATTACAGTCATTGTGAAAATAATTATGCAATACAGAGTAATGACCGGTCTGATAGACAACTTTCAGAGTTATGCAACGTCGATAACAATAAAACTCATAATGAAACTTACTTTCCGGAGTTATTGAAACATTTAACGGCTAAGCCTAAAATGGATTCACTTGTAGAATTATGTACGAATTCATTAACAGAAGTAGATAAAAAAATATTTTCAAAATATGGTAATATGGCACTTGTTAATAAAAAAAGATTGCAAGATATATATGGATATAACCGCGAAGAAATATATAAAAATCTTGACATAGATAACGGTATGTCCACTATATCAGAGAATAATATAAACATCAGTGAGGGAGAGCAATTTAATGCTGTTTCTGATCAATTAGAATCAAATTTAGATGACAGTATGGAATTAATAAATGGCTTGGATCCAAGCATTGCGGAACAAATATTAAGTGAAGAAACTATAACCAGTAGCACCAACTTTATAGAAACTGTGGGTAGGCAATTAAAAGATAAAGATGAAAACATCACCACTAGCGAGTTAGGAGAATTAATTCAAAATGAAATGTTAACTATCCCAGAAGATACAATCGTGAAAATTAATGAAAATATTAGCGAAGGACTAACAAATAAAGATTTAGGAAAGCTTTGTGGTAAATTTGGCTTAGATTTCGAAAATGCGTCACCAATATCTGGAATAGCCGAAGAAAACATCGAAGACGAAGACATACAAGTCATAGAGAGTAACTTGGACATAGATAAAGAAAACACTTCGGAATTTGACTTCAGTTTATTGTTAGAAAATTCACTACCAGATACTGAAGCAGAAAACCCTGATGATGACTTTGATTGTAATGAAAAAAATTCGCCCGCGGACCTGATGGATTTAGCTACAGTTGACATACCTGAATCGATAGATGGCATTTTAGATGAAGAGGGCTCTCTGTTCGAAAATTTGGATTTACTGGAAAGTAGTAGTCTTGATTCAAACGAAGAACTTAAGATGAAACGTAATGAACTTAATGTGACAAAAAACAACGAAGAACCATTGTCGGTGCCACATTGTGATGAATTACGAGAATGTTTATCTATAGCAAATATTTGTGAAATGGAAAAAGAACAATCTAAAACTTGCGTTTCACATTTTGATTCAAAAGCGAAACAACTTGTCGAACGTTTAATCGAATCCAGTGCTAATTTGAATTTAAGTACAGAAGAGCAATCTAAGGAGCAATTTGCTGGAAAGTGCTGTGTTTCATTAAAAGAGCTCTATAATGAAACACTTGAACAATATAGGCTTAATTTAGAAAATATAAAAAAACACATTTTAGACGAGTGTTGCGACAAGCAGATAAAAAATAATATTAGCACATCAAATGGTCAACACTTTAAGTCTTTCCGGTTAAATGAAGATGTTAGTAGCAATGTTCCTTCAGATTTACGGGATATAGGATTTGAAAATGACATCAATTTACTTCAGAAAATAAATAACTCCAGTATTCATGGAGCTCATGAGCTTCAAGGTCAGAAAAATGATGAGATAATTGATGAGTTGGTTGACCTGAGTGATATTCTTTTTAAAGATAACGTAACACCTTTTAGTATGGACTTAGAAAATCAAGATAGAGAATTAAAGAGTATTCGAAGTAATAATAGTGATCCTATTGAATTAAACGTAATAAATAACCAGAAAAATCCCTATGCGCTTGAACAAGAAAAAGAGCTATTTAATGATCGAGATGTTGATATGTCCAATATTGATGAAATCCTTGACGAAATTTGTAGTGAGCAATGCTTAGAAGCAGAAAATGAATCATTGGATCAAATTAAGGAGCCTAAGAGCAATAATAATAATATGACAAACATGAAACTAAATTTAAGAGAAAACAGTAACCGGATATTGAAAGATCTTTATAATAAAAGTGTTGAAATGTCGAGAAGTTTGAAAAAAGATAAACATAATGCTTCTGTGGGATATGATTCTGCTAAAATAAGCTCTGTAACAGGGAGACGGCTTAGTGTCGAGCAACTTAAAAGAGAAATATTTGATCAATGTTTCAGTTCTGAATGTGGGAATAGTTGTAAGAAAGGACATCACAATACAACAAAAAACAAAATCTCACGATTTAAAACGCAAGATATTGAAATTGCTAACAACTTCGACATTAAAAAGCGATCCAAAAAGAAGCAAAAACATAGAAAACAACCTAGTACGAAAAAACAAAAAAATAAGTCGACCTGTTTATCACCCTGTAAAGAGAAAATAAAATTAAAATATAAGGAGTTCAGTATTGATTTACTTAAAGGGCAATGTTTTGAATTTAGTCAAAAAGGAATTGAAGATGAGGCCAATATCAACGAGAAGAAAATCAAGAGAAAATGTAATGACCCAACTTTGGAGTCAAGGAAGATTCAATGCACTGAATCGTTGATCGAAGAAAATAAATGTGGTCAGTCCATAGAGCTAACTCTCAAGAAAAACGATTCTACTGACACCAACATTCAAGACAGTAACTGTAATACATTAAAGGAACTTGAGGCGGAGTGTCCTAATTGTGGATTTGTTACTAATGACGATGACGTCGACCTGAGTATCAAAGAACCACTAACAGTGATAAATAAGGGTATGTTATTGAATAACATGGAAAAGAAAAGTAATGGAAATGACGGAAACAAAAATGTCCCTCTTCGATCAACTAAGGAAGATGAATAA

Protein sequence:

>DPOGS201253-PA
MNFKDGTEFVYYDENIFRFPRDKDLCQKWVDAVRLERHDPWWNSTKASRICSIHFKKSDMMSTPCKVNVLTKSAVPICTMVWYDRDSNVSSNLSLPTENINIYDNITKAHELKESNPKVLEESSTNVSDDNGLACQESDKVFDILKETKKQHLNGSPETELANESTSQQGSKDQEEAIDIAEFIKFNTKDTCIKLNDNTSIILKEDVNEKSINTCQMPNSSKCLTKPLEVNNFKLLENKESKDDRSDEPKIDLCSGEIQQIDLKSTFIGKILKTYLPKRKFKKSRQKFITEVCKDNDENKSIDIKSVNDDLPNNLFNETEIKIPDRPINDTESSNEIIDKNNAVFFEKCLENDDNVGDGKESRKTDFNDIHLDIVGKQQLILDKQSINDICNESIENMCVQTSREFQIGSNLSANSNMIKDSNTHLILELDTQLYTETDVVGNIIDSFKESCELTNEQNNQPNDVTEIALITELIDTNESIPMSDEVNTSSHRNELSLINIFDPIQPTNDLISETQYEILTDFDNNAPESQQSNDIFNNAKFPTKNDLFNTETSENIDIGLENLQCEVKLNSTLNEFDPKKGEQYVSFVSIESSLNNSNLDTIRQLGASEIDKEGISFLSKDVRINVNGYEEGDLEHQIILQKDVLTSREDERNKVIVNNLIWEGNQEDLILSANLKCDNYSHCENNYAIQSNDRSDRQLSELCNVDNNKTHNETYFPELLKHLTAKPKMDSLVELCTNSLTEVDKKIFSKYGNMALVNKKRLQDIYGYNREEIYKNLDIDNGMSTISENNINISEGEQFNAVSDQLESNLDDSMELINGLDPSIAEQILSEETITSSTNFIETVGRQLKDKDENITTSELGELIQNEMLTIPEDTIVKINENISEGLTNKDLGKLCGKFGLDFENASPISGIAEENIEDEDIQVIESNLDIDKENTSEFDFSLLLENSLPDTEAENPDDDFDCNEKNSPADLMDLATVDIPESIDGILDEEGSLFENLDLLESSSLDSNEELKMKRNELNVTKNNEEPLSVPHCDELRECLSIANICEMEKEQSKTCVSHFDSKAKQLVERLIESSANLNLSTEEQSKEQFAGKCCVSLKELYNETLEQYRLNLENIKKHILDECCDKQIKNNISTSNGQHFKSFRLNEDVSSNVPSDLRDIGFENDINLLQKINNSSIHGAHELQGQKNDEIIDELVDLSDILFKDNVTPFSMDLENQDRELKSIRSNNSDPIELNVINNQKNPYALEQEKELFNDRDVDMSNIDEILDEICSEQCLEAENESLDQIKEPKSNNNNMTNMKLNLRENSNRILKDLYNKSVEMSRSLKKDKHNASVGYDSAKISSVTGRRLSVEQLKREIFDQCFSSECGNSCKKGHHNTTKNKISRFKTQDIEIANNFDIKKRSKKKQKHRKQPSTKKQKNKSTCLSPCKEKIKLKYKEFSIDLLKGQCFEFSQKGIEDEANINEKKIKRKCNDPTLESRKIQCTESLIEENKCGQSIELTLKKNDSTDTNIQDSNCNTLKELEAECPNCGFVTNDDDVDLSIKEPLTVINKGMLLNNMEKKSNGNDGNKNVPLRSTKEDE-