MonarchBase - Protein-coding gene

DPOGS200485
Transcript	DPOGS200485-TA	3690 bp
Protein	DPOGS200485-PA	1229 aa
Genomic position	DPSCF300158 - 130318-134456
RNAseq coverage	37x (Rank: top 73%)

Annotation
*Heliconius*	HMEL004385	4e-19	32.96%
*Bombyx*			%
*Drosophila*			%
EBI UniRef50			%
NCBI RefSeq			%
NCBI nr blastp			%
NCBI nr blastx	gi\|123438677	4e-26	20.43%	viral A-type inclusion protein [Trichomonas vaginalis G3]

Nucleotide sequence:

>DPOGS200485-TA
ATGTCTTTCGATCTCATCATGGAGCCGAATAAAGATGAACGAGTCAGAAAATCGCACAGAGGACTGTTACAAATGTTTAGACCTGGAGGATGTCTCAGCATTCACAACGATGAAGAAGAATACTCCTATATGCCGGGCACTTCTAACGAATTAAATAGAAGCTCATCTGGACAGGAAGACTTCCATGTTAAAACTACGAATGAGGCATTTTCTTTAAAAAAGAATGTTTTTTCTCCCTCTTACACGACTACATTTAAAACACCTAAGCCATTTTTGGGTAAATGCAAACCTGGTGGCTGCCTTGATCCACCGTTTGGTGAAGAGAAGTACATTTACAAACCTACGTTCGAGGACAACCAAATTGCAGAGAAATCTCCACACACAAATGATATAAATAAAATGCTGCTAGATTCAGATAAAAATAAACCGGAATTAGGAATAAAAAAACAAACTTTGGATCAAGAAGTAGAAGATTTGCATGAATCTTACACCGATTTGACCGAGAATATTGAAGATTCAGAATCTCTTGTTACTTACCCATTACCAGTATCATCTAGTTATATTAAAAATAGGGACAGTCAAAGTAAAAAGGACAGATCTAGAATCAACTCTGAACAAACATCTCAAAAATTAACCAATGAATTTCCTGTTTCATTTTTTATGCCTCCTAGAAAAGAGAAAACAAAACAATTTAAGACCTATGATGATTACAATGACAAGGAAACTAAGGTAAAAGAGGCATATATTAACAATGAGTATGCAATGCAAAGTCAAACACCTAGCGAAATGTTCTCGGATTCATTGACAACGACACATCCATCGCGTGAAGAACCTTCACAAGACGTAACACGGGAACAAGAAACATCTGTGAAATCGATACATTCATCGAGAAATGATGATATTTCTAAGGAACCAGTAAAATCTGAAGGTTTAGATTATATTTCTGATATCAAAGCTTTAAGAAAAGGTGAGGAAATATTTTCACAGGAACAAGTTACTGCAAACGATAAATCCGGGACAGGAAATCAGAACATACGATCTAAGTTGCCAGAAAGTCATATTGATACATCGTATCAATCTGACAAAATGAATTCAATACAAAAGATGGAAGTAGAAAACATAGTGAGTGAGGATAAAAATATAGAACCTGAAAAAAAACACAGTTCAGCAAATGTTAAGTTAAGCAGTGAAAAGTTAAAAATAAACTCACTTTCTGAATTAAACAATCATTCAGATAATTCAGAAATAAATAGTATTGCTGACAAACCTGTGGAAGGAGAAACTGGATTACGCAACGGAATTAATAATCTTTTAGACCCAATTGAAAAAGAGAAATTTAAAAAGAATTCTTTAAAATATGAAACTTCAAAAGATTTTGGGGTAAACGTTGGGAAGCATGATTCAACAAACCTAATCAAGCCTAATTTAAAATTCAGCCATGAGGAATTAACTAAAACATCAATTGATGATCCAACCAAAATTTTAACATACTCAAGTAGTGAAAGCATTAATGATAAAGATATTAAAATAGAAAATCAATTACGTGATGGAGTTGAAAGTAATTTAGATCCAACGCAAAAGGAAATGTTTGAAAAAGATTCTCTTAAATACGAAGCTTTAAGACATTCTAAGGAAATAATTACAAATGATGACACTATAAAAGTAAGAAAATCTAATGTAAAATTAAGCAAGGAAGATTTAGCTGAAATATCGATGGATCAATTAAACAGGTTTTCAAAAGATCTAAAGAATGAAAGTATAACTGACATCAACGTTAAAAGAAAATCTCAATTGCCTAATAAAACGAGTAGCATTTCAGATCCAATGCAAAAAGATGCTTTAAAATACGAAGCTGTAATAGATTCTGGCCCAAAAATCACAAATGAAGACCCAATACAAATCGAGAAAACTGATGTAAAGTTAGGCCAAGAGGAAATAACAAAAATTTCAATTGATCAATTAACCAAGCTCATTGACCAGGCAGAAAATGAAATTATTTCTGACACAAGTGCTAAAAGTGAAATCCGATTAACTAATGAATTGAGTAACTTGTTACACCCAGCCACTAAAGAAGTATTTGAAAAAGACTCTTTAACATACAAAGATTTAAAAGATTCAAGTAAAATAACTTTACAAAGCAGCGACGGGGATGGCATTAGTAATATTAAAAATTTTGTTCCCTTACAAAAGAAATCATTGGATTCTAACGACAATGCTGAAGTAAATTTAAAAGAACCAACTAAGAACCTAGACGAAATTATAACGTTGCCAACAGAAAAATTAGTATTTCAGAATAAAACAAGTGTAAATGAAGACTTTGAGAGACATTCTGAAAGTTCCAATAAAATAAATAATAAAGTCTCAGATATCGCAATAAAATCATTGTCATCTAAAATATCACTTAATGAGAAAACTGCTGACTTAAATTTGGAAAATCTTAGTAAGAAAAGCTCAAAATATATCGTATTTGAAAAACCACTAAGTGCTGGTTCTGATGATTTGAAAGAAACATCTCTTGAAAATAAATCATCGACATTTAAAGACTTACCAACAAACAATATCGATTCTAAAAGTATGTTAATATCTTACGAAGAAAATCACGACATAGATAATGATAAAAATGGAAGTCTTCGTAACATATCATTAAAACAAGAAATAAATCAATCAAGTTCTCATCATTCAAGAGACAGTCAATTAAGTCTTTTAAAAAAGCTCAGTTCTCTACCACAAATTCAAAATTCAGAAGGCATACTGTACGATAATGTTCAAGATAAAAATACATTCGACAACTCCTCTCATGAATTTACTGATTCTAATATTTTACGAACTGGCCAATACTTGAATAATACTCCAACAAAAATAAAAGACGGCGATAGAGAAGGGATTGATTTAAAACAAAATATCTTACTTCATAAAGGTCTCGACAATAATTTGGATGAATGGATAAGGAAGGATGAAAAGTCCTTTCAAAATTATGTTACAAATAATGTTAACGAAGATATTTTAAGTACATCTCAAACCAATGATTTCATTGAAGACAGCACTCAATTAGATAAAGGTCCGAGAGAAACAGTCGATCATGAATTAATGTCCCTCAAATCTGGTAATAGGGACCAAGGCATTAGTAAAGATTATGCAAAATCACAAGTTTATGACTCGTCAAGTGACATAAAACACACAAGCTCTTCTATATTCCTCAATTTTGCCTTCCACTCGTTAGCAAACGAATTTGGCTACACCATTACAACATTAGATCCTACAACAGATTTAACTGTATACCCACAAAATAAAATAACTACCATTAAAACTGCTCTTAAAGAAAATGATAAAGAAATTAGAATAAGGATGGATTCCGAAACCGATATTATAATTCAAATAAAAAGGAACCATAAGCGTAACGAAGGGTCTAAAAGCATCGTATCTAATGAGGGAAGGAATTTGATGCGTGGATACTGTTCAGAAACAATAATCAATAAAGATCAATTTTTTAAAAATACTCTTAAAACAGTTTATGACACGTTGGTGCCGATAGAAAAAATAATATCCAATCTTAAGGAAGAAGCAGATGTGCTATATCGGGAACAATTATTACTGAGAAAAATTTTGTCATCGAGGGAAATGAAGTCTAAAAGAATTATCCGCACTAATAAAAATTGTAGCTGCCTAGAAAAGGAAATGGGAATCAAGTGA

Protein sequence:

>DPOGS200485-PA
MSFDLIMEPNKDERVRKSHRGLLQMFRPGGCLSIHNDEEEYSYMPGTSNELNRSSSGQEDFHVKTTNEAFSLKKNVFSPSYTTTFKTPKPFLGKCKPGGCLDPPFGEEKYIYKPTFEDNQIAEKSPHTNDINKMLLDSDKNKPELGIKKQTLDQEVEDLHESYTDLTENIEDSESLVTYPLPVSSSYIKNRDSQSKKDRSRINSEQTSQKLTNEFPVSFFMPPRKEKTKQFKTYDDYNDKETKVKEAYINNEYAMQSQTPSEMFSDSLTTTHPSREEPSQDVTREQETSVKSIHSSRNDDISKEPVKSEGLDYISDIKALRKGEEIFSQEQVTANDKSGTGNQNIRSKLPESHIDTSYQSDKMNSIQKMEVENIVSEDKNIEPEKKHSSANVKLSSEKLKINSLSELNNHSDNSEINSIADKPVEGETGLRNGINNLLDPIEKEKFKKNSLKYETSKDFGVNVGKHDSTNLIKPNLKFSHEELTKTSIDDPTKILTYSSSESINDKDIKIENQLRDGVESNLDPTQKEMFEKDSLKYEALRHSKEIITNDDTIKVRKSNVKLSKEDLAEISMDQLNRFSKDLKNESITDINVKRKSQLPNKTSSISDPMQKDALKYEAVIDSGPKITNEDPIQIEKTDVKLGQEEITKISIDQLTKLIDQAENEIISDTSAKSEIRLTNELSNLLHPATKEVFEKDSLTYKDLKDSSKITLQSSDGDGISNIKNFVPLQKKSLDSNDNAEVNLKEPTKNLDEIITLPTEKLVFQNKTSVNEDFERHSESSNKINNKVSDIAIKSLSSKISLNEKTADLNLENLSKKSSKYIVFEKPLSAGSDDLKETSLENKSSTFKDLPTNNIDSKSMLISYEENHDIDNDKNGSLRNISLKQEINQSSSHHSRDSQLSLLKKLSSLPQIQNSEGILYDNVQDKNTFDNSSHEFTDSNILRTGQYLNNTPTKIKDGDREGIDLKQNILLHKGLDNNLDEWIRKDEKSFQNYVTNNVNEDILSTSQTNDFIEDSTQLDKGPRETVDHELMSLKSGNRDQGISKDYAKSQVYDSSSDIKHTSSSIFLNFAFHSLANEFGYTITTLDPTTDLTVYPQNKITTIKTALKENDKEIRIRMDSETDIIIQIKRNHKRNEGSKSIVSNEGRNLMRGYCSETIINKDQFFKNTLKTVYDTLVPIEKIISNLKEEADVLYREQLLLRKILSSREMKSKRIIRTNKNCSCLEKEMGIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: