MonarchBase - Protein-coding gene

DPOGS204751
Transcript	DPOGS204751-TA	2109 bp
Protein	DPOGS204751-PA	702 aa
Genomic position	DPSCF300231 - 212844-221326
RNAseq coverage	37x (Rank: top 73%)

Annotation
*Heliconius*	HMEL011472	1e-13	37.04%
*Bombyx*			%
*Drosophila*			%
EBI UniRef50	UniRef50_O01418	1e-14	32.17%	Gag protein n=7 Tax=Endopterygota RepID=O01418_BOMMO
NCBI RefSeq			%
NCBI nr blastp	gi\|2055275	4e-14	32.17%	Gag protein [Bombyx mori]
NCBI nr blastx	gi\|2055275	4e-25	28.81%	Gag protein [Bombyx mori]

Nucleotide sequence:

>DPOGS204751-TA
ATGGGTTGCGACGCGGAAACCTCCTCGAGCGCCTGGTTGTTACCGGTCCCTCACGGATTACGGTCCGGGGGGAAGGGTAGCAGCTGGGCCTGGTGCAATCTGGGCAACGACGGAGAACGATGTTTGCATAGCAGGCGTCTTTCTTCGGCGGCTAATATCCGCAGGGGGGGGATAGTCTCATGGTCCGGATGCGTGGGTTTCGTTTTCGGAGCCTACGCAATTGGTTCGTGGGACTCTAGGGGTGGCGCGGTCGTGTGGCCGTATGGCCTGGCCGGTGAGTGCGGGCCGGCCTTGTGGTCGTTAGACTCTGGGCTGGCCGGCGTGTGGGTCGGAGAGGGGCCCGAGGACCCCCATCCGTGGGCTAGGGCTCCTTCTCGGAATCTGTGCGAAGGGGCTGGCGTGCCGGTCTCGGAACTCTGGGGACGCAGGACACTCGGCGGTAATACCACTCGTCAGCTCCTCTGCAGCAGGGGACTCCGGCGACGTGGTATCCAAGAGTGTAGTGGTGGTGAGGGCGTGCCATTTTTGGCGTGCCGTTTTCTGGTTCCCCAGCTCTCCTGTATCAGGAGACCCCGGGGATACCGGATCTGTCACTTCGTGACGTTGCCGAGTGGATTCGTCTGCTCTCGGCACAACCCGCTCCCCAGCTCCCCTGTATCAGGGGACCCCGGGGACGTGGGATCGGGCGGCGGGCGGTCTTCTAGACTACTCGCCGGCCAGACCGTAACCCTCATTGAGAGGACACGGGGGCGTCAGCTGCGAGGAGTAAACCTCTATAAAAAATCCCCAAATTCTCCTAGTTGCGGGGCGCGGCTAGGGGATGCTTCTTCGGGAGCGGCTGGGGGGTATCTCAGCCACCGAGCGACCAAGGGGCTCCCGCCCCCGAGGCGGGACGACGATGACTCTCTGGGACGAGGTGCAGTGGGCACGGGACCTGGCTTGGGAAAAGGACACCGATCAGCAAAAGATTTGGACAAGGTGATGGTGGTAAGCTCTGACGAGGAGCCTGTAGACGCGTCGGCGGTGCGACCAGTGGCGCGCCAGCCACTAGCGTCCAACGGTGAGAAGGGAAGAGCAACCAGAAGGAGCCCGCGTACAACGAGCGGAAGTGAGATGGAGACGGAGGAGACGCGCTCCGCCTTCTTCGCCGGTACGCCGACGAGCCTGGCGCCTCTCCGGAAGCGGCCAGCGACAAGAAGACAACCAGGCGGGAGTTCGTCTGGCGGAAGTGACAAGGCTTCCTTCGCTACTGCGGTGAAGAGAGGACGGGCAGTTGAGGAAGGCGAATCGAACTCGGAGGAGGAAAACGTGGCGAGGTCGACGCGTCGGGTCGAGGTGGCCCTTTCCTCGGTTAAGACGCTGCCAGCCTCGTGCCTCGCGAAAGAGATGGAGAGGGCCCTGAGCGTCATAGTCGACGTGGCCCTCAAATCCAAGAATCTGAAGGGCGGATGCGTCAGGGCATTGAAGACGTCGGCGGCACTCCTGGGGGAGGCAAAAGAGATTCTCCTGCAGCGGACCAGCGGCGAGGAGAATGAGATTCTCCGAGCCCGGCTAGAGGAAGAAAGGAAGAAGAGCTCGCTGCTGGAGAAGGAGCTGGGGCTCCTGAGAGAGGGGCAGGCCCGCTTGCGGGCAGACATGGACCTGCTCGCCACTGCCCCGAAACCAGCACGAGACGAGAAGAGCGAGGAGGAGCTTCGCGGGTCCCTCATGAGGGACCTAGGTGCCATGATGGACGCGAAGCTCCAGGGGATCGCAGACCGGCTGCTCCCCGAAAAGCGCCTGAGGCCGCCCCTAGCGGCGGACAAGAGGCCACCCCCAGCGCCTGCGTCGGCTGCTGTGGCTGAGCCGGCAGGTAGAGTGGCGAGCAGGAAAAAGAACGGTGCCACAAGAGAACAGGAGAAGACGGCGAGACCTCTACCCCCGCCGCCTCCATCCATGGACAAGACATGGACGGAGGTGCGTCCACCTTCACCCGCCTCTGGGGGTGTGCGGCGGGCAGCCAGCGCGGGGGCGCTGCCGCCTGCATCACAGCGCACACCTCTAGCGATGGCCAGATACGGCCGTGCGCTCCGGCCACAACAAAGCCCTCCCCCACCCGGGGGGGCGTGA

Protein sequence:

>DPOGS204751-PA
MGCDAETSSSAWLLPVPHGLRSGGKGSSWAWCNLGNDGERCLHSRRLSSAANIRRGGIVSWSGCVGFVFGAYAIGSWDSRGGAVVWPYGLAGECGPALWSLDSGLAGVWVGEGPEDPHPWARAPSRNLCEGAGVPVSELWGRRTLGGNTTRQLLCSRGLRRRGIQECSGGEGVPFLACRFLVPQLSCIRRPRGYRICHFVTLPSGFVCSRHNPLPSSPVSGDPGDVGSGGGRSSRLLAGQTVTLIERTRGRQLRGVNLYKKSPNSPSCGARLGDASSGAAGGYLSHRATKGLPPPRRDDDDSLGRGAVGTGPGLGKGHRSAKDLDKVMVVSSDEEPVDASAVRPVARQPLASNGEKGRATRRSPRTTSGSEMETEETRSAFFAGTPTSLAPLRKRPATRRQPGGSSSGGSDKASFATAVKRGRAVEEGESNSEEENVARSTRRVEVALSSVKTLPASCLAKEMERALSVIVDVALKSKNLKGGCVRALKTSAALLGEAKEILLQRTSGEENEILRARLEEERKKSSLLEKELGLLREGQARLRADMDLLATAPKPARDEKSEEELRGSLMRDLGAMMDAKLQGIADRLLPEKRLRPPLAADKRPPPAPASAAVAEPAGRVASRKKNGATREQEKTARPLPPPPPSMDKTWTEVRPPSPASGGVRRAASAGALPPASQRTPLAMARYGRALRPQQSPPPPGGA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: