MonarchBase - Protein-coding gene

DPGLEAN20108 in OGS1.0

Genomic Position	scaffold5109:- 269-2752
	See gene structure
CDS Length	2484
Paired RNAseq reads	102
Single RNAseq reads	228
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA001404 (3e-06)
Best Drosophila hit	ND
Best Human hit	ND
Best NR hit (blastp)	reverse transcriptase [Papilio xuthus] (0.0)
Best NR hit (blastx)	reverse transcriptase [Papilio xuthus] (0.0)
GeneOntology terms	GO:0006278 RNA-dependent DNA replication GO:0003964 RNA-directed DNA polymerase activity GO:0003723 RNA binding
InterPro families	IPR000477 Reverse transcriptase
Orthology group	MCL10007

Nucleotide sequence:

ATGGCGGTGGAGGCGTCGATCGTCCAAGCCTGGACCATGCGAGTTGAGCAGCCCGTTGAG
GTGGATGAGGAGGCGCGCAAGTTCCGCCGGAGTCTATGGCGGATTTGCGATGCGTCGATG
CCCCGTGTCGCGCAACGCCCTCCCAGACGCCAGGTGTATTGGTGGACGCCGGAGATCGCG
CAGCTGCGTGCAGTCTGCGTGGTGGCGAGGCGCCAGTACACCCGACAACGAAGGCAGCGT
CCTCGCAACGAGGCCGTCGAAAGTCGGCTTCGTGACGTCTACAACGAAGCGAAGAGCGAG
CTTCGGCAAGCTATCTGTAGGTCGAAGGATACGGCTCGTGAGGAGCTACTCGTGCGTCTA
GACAATGACCCGTGGGGGCGTCCGTATCTCGGTGCCCGGAATAAAACCCGGACCCAGACG
GCCCCGATCACGGAGAGTCTAGAGCCGGAGCTGCTGCGACGCGTCGTTTGTGCTCTCTTC
CCCGAGGAGGTCGCGCACTCGATGCCAACGGCAGGCACTTCTCGCGAGCTGGAACGGGCG
GTAACTATTGCGCCCGTTACTCTGGAGGAGCTCGAGAGGACTCTGTCACCGCTAAAGGCC
AAGAAAACCGCCCCCGGGCCGGACGGTGTCCCCGGACGCGTCCTGGCTCTCGCTCTGGGC
GAGTTGGCCGAGTGGTTCTTGGAGATCCTCAATGAGTGTTTGAGGACGGGCCGCTTTCCA
TCGGTTTGGAAAGAAGGACGGCTCGTTCTCCTCCAGAAGGTAGGTCGACCTGCAGACTCG
CCGTCTGCCTACCGTCCGATCGTGCTGCTAGACGACGCGGGTAAGCTCTTTGAGCGAATA
CTAGCCAACCGCGTCGTCGCTCACTTGCGCAGCGTAGGGCCCGATCTGGCCGAGTGCCAG
TATGGTTTTCGGGGTGAGCGTTCTACCATCGACGCCATCTCGAAGCTGAGGAGTCTTGCG
GATGATGCCGTGTCGAGGGGTGGGGTGCTGTTGGCGGTGTCCTTGGATATCTCCAACGCA
TTTAACACCCTTCCTTTCGGCGTCATTGAGGAGGCCCTCAGATACCATGGTCTGCCACTC
TACATCCGGCGGACCATCGGGTCTTATCTCCGCGGACGAGAGATCTCGTTCGTGGGGTGT
GACGGCCGGGTTCATCGCCATGAGGTGCGCTGCGGCGTTCCGCAGGGGTCGGTTCTTGGG
CCGCTCCTGTGGAACTTGGGCTACGACTTCGTGCTACGCGGTGCCCTCCTAACCGGGCTG
AGCGTCGTTTGCTACGCGGACGACACGCTCGTTGCAGCCCGAGGCGAGGACCTGGAAGAG
GCGACGGTGCTTGCTGAGGCGGGAGCCGCCTTGGTCGTGCGGCGCATCGAAATGCTCGGG
CTGAGGGTGGGCCTGGATAAAACAGAGGCCCTCCTGTTCCACAGCCCTCGAGCCAGACCG
CCGACGGGCGCCAGCATCAACATCTGCGGCGTCCGCGTCGAGCTCAGTTCCCGGATGAAA
TATCTGGGGCTGACTCTGGACGGAAGGTGGAGCTTCCGGGAGCACTTTCGCGGTCTAGTT
CCGAAACTCCTCGGGACGGCGAACGCGCTCGGAAAGCTTCTGCCAAATCTCGGTGGTCCC
AGCGCGACATGCCGGCGTCTGTACACCGGTGTGCTGCGCTCGATGGCGCTGTACGGAGCT
CCAGTGTGGGCCGGTGCCCTCACATCGCCGAACGTGACGGCGTTGCACAAAGTGCAGCGC
GTCATGGCGGTGAGGGTGGTACGGGGATACCGCACTGTCTCCCACGAGGCGGCTTGCGTG
CTGGCTGGGACGCCTCCTTGGGACTTGGAAGCTCAGGTCCTGGCGGAGGTTTACCAACAG
CGCGCACGAGCTCGTTCCCAGGGTGTGAATCCACCCCGGGAACAGGTGGAAAGTTGGCGT
CGCTCCGCGCAAGTGGCGCTCTTTCGTCGTTGGAAGCGACGGCTCTCTGTGCCAAAGGCC
GGGTTGCGCACCGTGGAGGCGGTTCGGCCGCTCCTCAGGGAGTGGGTGGATCGCCGACAT
GGTTCCTTAACCTTCCGGTTGGTGCAGATCCTTTCGGGACACGGCAGTTTCGGAAGGTAT
TTGTGCCACATAGCCGGGAGAGAGCCGACGTCGGCGTGTCATCACTGTACTTGTACGGAA
GACACTGCCGACCACACGCTGGCGGAGTGCCCTGCGTGGGAATCGGAGCGGCGCGAATTA
TCCACGGTGGTTGGCGCGAACCTCTCGTTGTCGGCCGTTGTTAAGGCAATGGTGGGTAGC
GGGAGGGCCTGGGCGGCGGTGGTCTCTTTCTGTGAGGTTGTCATCTCGCGGAAGGAGGCT
GCCGAAAGAGTGAGGGAAGACGATCCCTCCTCGATGCCGATGCGCCGACGGAGACCGGGT
CGTAGGCAGCGGGATATGCCCGCCGAATGCCTCCCCAATGAGAGGAGCCTGCGGGTGTCG
GAGGGGAAATCCGATGCCCGGTGA

Protein sequence:

MAVEASIVQAWTMRVEQPVEVDEEARKFRRSLWRICDASMPRVAQRPPRRQVYWWTPEIA
QLRAVCVVARRQYTRQRRQRPRNEAVESRLRDVYNEAKSELRQAICRSKDTAREELLVRL
DNDPWGRPYLGARNKTRTQTAPITESLEPELLRRVVCALFPEEVAHSMPTAGTSRELERA
VTIAPVTLEELERTLSPLKAKKTAPGPDGVPGRVLALALGELAEWFLEILNECLRTGRFP
SVWKEGRLVLLQKVGRPADSPSAYRPIVLLDDAGKLFERILANRVVAHLRSVGPDLAECQ
YGFRGERSTIDAISKLRSLADDAVSRGGVLLAVSLDISNAFNTLPFGVIEEALRYHGLPL
YIRRTIGSYLRGREISFVGCDGRVHRHEVRCGVPQGSVLGPLLWNLGYDFVLRGALLTGL
SVVCYADDTLVAARGEDLEEATVLAEAGAALVVRRIEMLGLRVGLDKTEALLFHSPRARP
PTGASINICGVRVELSSRMKYLGLTLDGRWSFREHFRGLVPKLLGTANALGKLLPNLGGP
SATCRRLYTGVLRSMALYGAPVWAGALTSPNVTALHKVQRVMAVRVVRGYRTVSHEAACV
LAGTPPWDLEAQVLAEVYQQRARARSQGVNPPREQVESWRRSAQVALFRRWKRRLSVPKA
GLRTVEAVRPLLREWVDRRHGSLTFRLVQILSGHGSFGRYLCHIAGREPTSACHHCTCTE
DTADHTLAECPAWESERRELSTVVGANLSLSAVVKAMVGSGRAWAAVVSFCEVVISRKEA
AERVREDDPSSMPMRRRRPGRRQRDMPAECLPNERSLRVSEGKSDAR