MonarchBase - Protein-coding gene

DPOGS208731
Transcript	DPOGS208731-TA	4398 bp
Protein	DPOGS208731-PA	1465 aa
Genomic position	DPSCF300043 + 233089-238470
RNAseq coverage	185x (Rank: top 49%)

Annotation
*Heliconius*	HMEL015249	79.57%
*Bombyx*	BGIBMGA003396-TA	76.97%
*Drosophila*	DNApol-alpha180-PA	45.30%
EBI UniRef50	UniRef50_E0VHS7	46.39%	DNA polymerase n=1 Tax=Pediculus humanus corporis RepID=E0VHS7_PEDHC
NCBI RefSeq	XP_002425588.1	46.39%	DNA polymerase alpha catalytic subunit, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242009635	46.39%	DNA polymerase alpha catalytic subunit, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242009635	46.21%	DNA polymerase alpha catalytic subunit, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0003887	0	DNA-directed DNA polymerase activity
	GO:0003677	0	DNA binding
	GO:0006260	0	DNA replication
	GO:0000166	0	nucleotide binding
	GO:0006139	1.5e-117	nucleobase, nucleoside, nucleotide and nucleic acid metabolic process
	GO:0003676	1.5e-117	nucleic acid binding
	GO:0001882	8.8e-31	nucleoside binding
KEGG pathway	phu:Phum_PHUM210770	0.0
	K02320 (POLA1)	maps->	Purine metabolism
			DNA replication
			Pyrimidine metabolism
InterPro domain	[41-1210] IPR004578	0	DNA-directed DNA polymerase, family B, pol2
	[776-1225] IPR006134	2e-120	DNA-directed DNA polymerase, family B, multifunctional domain
	[529-997] IPR006172	1.5e-117	DNA-directed DNA polymerase, family B
	[324-797] IPR012337	1.9e-67	Ribonuclease H-like
	[363-700] IPR006133	9.4e-35	DNA-directed DNA polymerase, family B, exonuclease domain
	[1249-1427] IPR015088	8.8e-31	Zinc finger, DNA-directed DNA polymerase, family B, alpha
	[953-1075] IPR023211	8.3e-25	DNA polymerase, palm domain
Orthology group	MCL12211		Single-copy universal gene

Nucleotide sequence:

>DPOGS208731-TA
ATGGCAGAGTCCTTAGCGACTTCCAGGGCCAAACGGCAAAAAGTTGACAAAACTGGTCGTTTGTCGGCTTTAGAAAAATTAAAACAACTAAAGGGGAAAGGCTCTAAACATAAATACGATGTGGATGAATTGGAGAATGTGTATGACTTAGTTGATGAGTCTGAATATAGTAATCGGGTACTACAGCGACAAGAAGACGACTGGATTGAAGATGATGGGACAGGATATGTGGAGGATGGTCGAGAAATATTTGATGATGATGAGATTGATGATACTTATGTGGCAAAAGATAACAAAGAAACAGGCAGAGGCCACAAAAGGAAAGCTAAGGTTGCTCCCCAGCCGGCTGGGAAAGGAAATATAAGAAATCTCATAGGTGCTATGCCAAATAAAAAGAAAGAGGATGCCAAAATATCAGATGACAATATTTTATCAGATATCATGTCAGATTTAGATGGTACTACATCATCTATAGCAAAGCAAAAGCTTGTTGTTCCGAAAAAAAACATAGTTGACTCAAGTAAGAGAGACGCCCAGAATTATTTTAAAAATTTGTCATCGTCTGTTAAAAAACCGACACCACCTGTAAAAAAGGAAGAAACTGTTGTTGTGGATGTTGATAATGTTGAAAAGCCAAAGAAATCTACATGGTTAATAGACAAAGAAATAAAAAAAGAAGTAGAAGAGTCTCCTAGTCAAATTATAGAAGAATTTGCAACTCAAGATATAGACTTTGGTGACGATTTCAGCAATGATGCGGAACTACCACAAGTTCCTATTAAAAAAGAAGCTACAATGACTGACATATTACAAGATGTCGCTGAAGATTTTAAAGAAGATTTTGATATATTTTCAGTAAAGACAGAGCCCAAAGAATTGAAGGCCTTATCAAGTAATTGGTCCCAGAATGATAATCAAGTTGTTGTCAACATACAGAGTGATGTACAGTTGCCTTTACAGAAGAATAAGGATGGGGACCAAGTGTTGAAGTTTTATTGGCTCGATGCTTGGGAAGATAAATATGTTAAGCCGGGAGTTGTGTATTTGTTTGGAAAAGTATATGTTAATCCATCCAAGAAGAAAGAGGGTTGTGCTTCATGCTGCTTAGTGGTGAAAAATGTCAACCGACAATTGTTTCTTCTTCCAAGAGAATATAAATTAGATCCCATAACCTTGGAGGCGACAGATCAAGAGGTAACCATGATGGATGTTTATGAAGAATTCAACAACTGTGTTGCTAGTGAAATCGGTTTAAAAGAATTCAAGTCAAGGAAAGTTACTAAAAACTATTGCTTCAATTTACCAGACATACCCTCCCAATGTGATTACTTGGAGGTCAAGTATTCGGCTACTTTTCCAATACCACCAGTAGGAAAGAAATATTTGACATTTTCACATATATTTGGTACCAACACATCTTCTCTAGAGAGCTTCCTGCTTGATAGGAAGATCAAGGGTCCATGTTGGTTGGAGGTGAAAAATGCTGAGAGTGTTCAAGCCAAAGTGTCTTGGTGCAAATTAGAAGCATCATGTGATAAAATGGAGAATGTGGCCGTCATAAGAAATGACAGTGATTTAGAACCACCTCCTATTGTTATTGCTACTTTAAATATGAGGACAGTTAGTGATCCAAAAACAAGTAAGACAAAAATCTTGATGATGAGTTGTCTAGCTCACAACTCTTTCCCTATACACAAGCCGCCACCGAATCCACCTTTCCATCAACACTTTTGTGTGATGACAAAATGCAATGACATGTGGCCAATTGATTTGAAACAGCAAATGCAACAATATAGAGCGACAAAATTAACGAAATGTGACAACGAGAGGGAGCTCCTCAACTACTTCATGGTACAGTTTTGGAAGCTTGATCCGGATTTAGTTGTTGGTCATGACTTGCAAGGATTCCAGCAGGATTTGCTCATAGGCAACATATTAGACCTGCGTATTCCGAACTGGTCTCGACTCGGTCGCTTAAAGAGATCAGTGGCTCCGCAAAAAAAATTCGCAGCGAGAAGTGCTTTTCTTGGGAGACTAGTCTGCGATATAAAACTATCTGCGATGGAACTTATAAGGGCACGGAGCTTCGATCTAGATTCTCTGTGTGTTAGTGTTCTGAAAATGAAAGAAGGGGAGAGAATTGACGTATCGATCGAAGACTTGCCCCGATATAATGAAAGTTCAAGTGACCTTTTACAATTAGTGTCACTAAGTATGCAGGATGCTTCATACATTCTGAAGATAATGTGCGAACTCAATGTGATACCACTGGCTCTGCAAATAACGCAAATAGCGGGCAATATAATGTCCAGAACTTTGATGGGCGGACGGTCGGAAAGGAATGAGTTTTTGTTACTGCACGCTTTCACTGAAAAGAACTACATTGTGCCTGATAAAATATATGGAAAGAAGGCCGACGGTGACGATGACGAGCAGGACGAAGCCGGAAATGTATCAAAGAAACAAGCTAAGAAGAAAGCGGCGTACGCTGGAGGCCTGGTGCTCGACCCCAAGAAAGGCTTCTACGATAAACTCATACTTCTAATGGACTTCAACTCGTTATATCCAAGTATCATTCAAGAATATAATATTTGTTTCACGACGATCAAAAGAAAGAACGGCGCTTCATCAGATGATGACATCAATAACCTGGTTCTGCCCGCTCCCAATACGGAATTCGGAGTACTGCCCACACAGATAAGAAAACTAGTTGAAAGCAGACGGGAAGTAAAAAGACTAATGAAATCACCGGACCTTGCTTCCGAACTGTACATGCAATACAATATTCGGCAAATGGCGTTGAAGCTCACTGCAAACTCTATGTATGGCTGTCTCGGCTTTACACATTCTAGGTTCTATGCAAAACCTTTAGCTGCTTTAGTCACTATGAAGGGTAGAGAGATTCTCATGGACACCAAGGAAATTGTTCAGAAACTAAATTATGAAGTGGTCTACGGTGATACCGACAGTTTGATGATCAACACCAACTGTTTGGACTACGATTACGTGTTTAAGATAGGCAACGACTTGAAAAGAGAAATCAATAAGAAGTACAAACAGATCGAATTAGATATTGATGGAGTATTTAAATATCTACTTCTCTTAAAGAAGAAGAAATATGCTGCTGTAGTGGTCAGTAAGAGCAAAAGTGGTGAATTCATTTATAACCAAGAGCACAAAGGCTTAGATATAGTCAGGAGAGATTGGTCGCAGTTAGCCGCAGAGGCCGGAAAATTTATCCTAACGCAAATTCTTTCCGAGCAGACGGCTGACGAAAGACTAGAAAGTATACAGAATCATTTAAACAAATTGAAAGAAGATTTAGTTAACAGCAAAATGCCTTTATCGCTATTGACAATAACTAAGCAATTAACCAAAAATCCTAACGAATACGCAGATAAGAACAACCAGCCGCACGTCCAGGTAGCTCTGAGATTGAACAGCAAAAATAGCAGACGTTTTAAAAAGGGCGACATAGTTCCGTATATAATCTGTGAGGACGGCACAGCGAATAGTGCGACGCAGAGAGCTTATCATATAGAAGAATTGAAAAATTCCGAACATCTTAGCGTCGACTACAAATATTACTTGGCCCATCAATTACACCCCGTCATATCTCGTATATGCGAACCCATCGAGGGTTTGGATCCGGCTCGAGTAGCGGACTGCCTCGGCCTGGATCCCTCCGGCTACCGTCAGATAACAAAGAAAGAAATCTCCAATACAGATACATACGAAGTAGAGAACGATAAAGAAAAATACAGATATTGCAAAGAATTCACGTTCATATGTGTCAACGAGCAATGTAGAACTGAGAACAGAATACGAGACACGTTCAGGCAGGTGGAGAAGGAGAGCGTCACGTTCCTGGAGCGGTGTCAGAACGAGAAGTGCGCTGTTAAACCTATCGACTACTTAGCGTGTATACAGAATCAGCTGTCGTTACAAATGCGCCAGTATCACAGCGAGTATTATACAGGGTGGTTGGCGTGCGAGGACCCCGCGTGCGGGTACCGCTCGCCGCGACTGCCGCAGACCTTCGCCGCAGGATATCCGCTCTGCAGGCTGTGCGAGAAAGGCGTCATGTTCCGGGAGTACACGGAGAAAGACCTGTATTTACAAATAAACTTCTTTTTGTTTCTGTTTGATGTTAACAAGCATAATACGACAAAAACAAAAATAAGCCCTAATATTTTGTCAGCCTTCCAAGTCTTGAAAGTGATGGTTGAAGAGGTCCTTGCGAACTCGGCGTACGCTATTATAAACTTGTCAAAATTGTTCAGATTTTTTGGTGTCGATAACAGAGGCGGGAATAATATTAAGTCTGAAGATCTCGAAATCGACATTCTTCCAGAGACAGAACACATAGACGCCCTACTGGAATTGGGGACTTACTGA

Protein sequence:

>DPOGS208731-PA
MAESLATSRAKRQKVDKTGRLSALEKLKQLKGKGSKHKYDVDELENVYDLVDESEYSNRVLQRQEDDWIEDDGTGYVEDGREIFDDDEIDDTYVAKDNKETGRGHKRKAKVAPQPAGKGNIRNLIGAMPNKKKEDAKISDDNILSDIMSDLDGTTSSIAKQKLVVPKKNIVDSSKRDAQNYFKNLSSSVKKPTPPVKKEETVVVDVDNVEKPKKSTWLIDKEIKKEVEESPSQIIEEFATQDIDFGDDFSNDAELPQVPIKKEATMTDILQDVAEDFKEDFDIFSVKTEPKELKALSSNWSQNDNQVVVNIQSDVQLPLQKNKDGDQVLKFYWLDAWEDKYVKPGVVYLFGKVYVNPSKKKEGCASCCLVVKNVNRQLFLLPREYKLDPITLEATDQEVTMMDVYEEFNNCVASEIGLKEFKSRKVTKNYCFNLPDIPSQCDYLEVKYSATFPIPPVGKKYLTFSHIFGTNTSSLESFLLDRKIKGPCWLEVKNAESVQAKVSWCKLEASCDKMENVAVIRNDSDLEPPPIVIATLNMRTVSDPKTSKTKILMMSCLAHNSFPIHKPPPNPPFHQHFCVMTKCNDMWPIDLKQQMQQYRATKLTKCDNERELLNYFMVQFWKLDPDLVVGHDLQGFQQDLLIGNILDLRIPNWSRLGRLKRSVAPQKKFAARSAFLGRLVCDIKLSAMELIRARSFDLDSLCVSVLKMKEGERIDVSIEDLPRYNESSSDLLQLVSLSMQDASYILKIMCELNVIPLALQITQIAGNIMSRTLMGGRSERNEFLLLHAFTEKNYIVPDKIYGKKADGDDDEQDEAGNVSKKQAKKKAAYAGGLVLDPKKGFYDKLILLMDFNSLYPSIIQEYNICFTTIKRKNGASSDDDINNLVLPAPNTEFGVLPTQIRKLVESRREVKRLMKSPDLASELYMQYNIRQMALKLTANSMYGCLGFTHSRFYAKPLAALVTMKGREILMDTKEIVQKLNYEVVYGDTDSLMINTNCLDYDYVFKIGNDLKREINKKYKQIELDIDGVFKYLLLLKKKKYAAVVVSKSKSGEFIYNQEHKGLDIVRRDWSQLAAEAGKFILTQILSEQTADERLESIQNHLNKLKEDLVNSKMPLSLLTITKQLTKNPNEYADKNNQPHVQVALRLNSKNSRRFKKGDIVPYIICEDGTANSATQRAYHIEELKNSEHLSVDYKYYLAHQLHPVISRICEPIEGLDPARVADCLGLDPSGYRQITKKEISNTDTYEVENDKEKYRYCKEFTFICVNEQCRTENRIRDTFRQVEKESVTFLERCQNEKCAVKPIDYLACIQNQLSLQMRQYHSEYYTGWLACEDPACGYRSPRLPQTFAAGYPLCRLCEKGVMFREYTEKDLYLQINFFLFLFDVNKHNTTKTKISPNILSAFQVLKVMVEEVLANSAYAIINLSKLFRFFGVDNRGGNNIKSEDLEIDILPETEHIDALLELGTY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: