MonarchBase - Protein-coding gene

DPOGS214594
Transcript	DPOGS214594-TA	1710 bp
Protein	DPOGS214594-PA	569 aa
Genomic position	DPSCF300050 - 303228-304937
RNAseq coverage	74x (Rank: top 66%)

Annotation
*Heliconius*	HMEL006970	0.0	87.57%
*Bombyx*	BGIBMGA005125-TA	0.0	80.18%
*Drosophila*	DNApol-iota-PB	2e-114	35.69%
EBI UniRef50	UniRef50_Q9VHV1	3e-112	35.69%	DNApol-iota, isoform A n=12 Tax=Drosophila RepID=Q9VHV1_DROME
NCBI RefSeq	XP_001868410.1	5e-117	41.74%	DNA polymerase IV [Culex quinquefasciatus]
NCBI nr blastp	gi\|170067256	1e-115	41.74%	DNA polymerase IV [Culex quinquefasciatus]
NCBI nr blastx	gi\|170067256	2e-117	40.66%	DNA polymerase IV [Culex quinquefasciatus]

Group
Gene Ontology	GO:0003887	1.1e-36	DNA-directed DNA polymerase activity
	GO:0006281	1.1e-36	DNA repair
	GO:0003684	1.1e-36	damaged DNA binding
KEGG pathway
InterPro domain	[254-372] IPR017961	1.1e-36	DNA polymerase, Y-family, little finger domain
	[2-164] IPR001126	3.9e-35	DNA-repair protein, UmuC-like
Orthology group	MCL14989		Single-copy universal gene

Nucleotide sequence:

>DPOGS214594-TA
ATGGTGCAGAAACCAGAACTGCGCTGTTTTCCGCTAGGAATCCAACAGAAAAACATCGTTGTAACCAGTAATTATGAAGCCAGGAAGTACGGTATACGAAAGTGCATGCTCGTGTCTGATGCTTTAAAAGTATGTCCGAATTTAAAACTTATTAACGGCGAAGACTTACATGATTATAGAGCGGCGTCCAATAAAATATTTACAGTTTTACAAACGTTTAAGTGTCCAGTGGAGAAGTTAGGAATGGATGAAAATTTTATTGATGTCACAAATATAGTACAAGAAAGAATAAAAAATGTTAATTTAAAAAGTATCACAGTATCAGGTCATTTATACACTGAGTCCAACGCAGAGTGTGTGTGTGGTTGCCATGCAAGACTGAAAGTAGCATCACAAATAGCCTCTGAAATGAGGCATAAAATTTACGACGAATTAGGTTTTACTACTTGTGCTGGGATAGCACACAATAAACTGTTGGCTAAGCTTATATGTCCTTTAAATAAGCCTAATGATCAAACAACAATTTACCCCGAGCATGGCGTCAGTTTTATGTCTACCTTGCAAAGTGTCCGCTCAATACCAAGTATAGGATCCAAAACTACTGAAGCCCTCATCTCTCAAAAAATTATCACTGTGAGGGATTTACAAGAAGTTTCTATAGAAGTATTGAAAAAGCATTTTAGTTCTGACATGGCGGTGAGACTTAAGAATTTAAGTGTCGGTGAAGATAATACTCCAATTAAACAAACGGGCAGGCCTCAGAGTATAGGTTTAGAAGATAGCTTTAAGACTGTGAGTGTTAAGAGTGAAGTTGAAGAAAAATTTCAAGCATTGCTTCAAAGGCTGTTGATTCTAGTGAGAGAAGATGGACGCATTCCAGTATCACTAAGAGTGACTCTGAGGAAAAAAGATGTGAAACGATTAAGCAGTCACAGAGAGTCCAGGCAGTGTCAGGTATCTCCTTCCATCTTCACAATTAACAATGGAACACTCACAGTTACAGATTCTGGTAGGCAGAAGCTAATGAGCATAATAATGAGATTATTTAACAAATTAATTGACTTATCGAAACCATTCCATTTAACTTTAGTGGGTTTGGCATTCACAAAGTTCCAAGAGCGTATGACAGGTAGAGGGTCCATTGTCAATTATTTAATGAATGATATATCGGTCCAATCCGTACTCAATATTACAAATGACTGTGATACTTCAGCTTCTTCTATGGATTATTCGGCTGCGTCTCCTAGTAGTAGTACCACCACTGATCTATCTGACGGTGAAGTGGAACCATCACCTAAGAAACCTAAAAAGGGAACCTGGATAGCTAAAAGACGTTGCTTATCAAAGGAGGAAGTTGCATCTCCTAGTAAACTTAAAGTAGGCGAGTTGAGGCTCAATTCTAAAGAACTAGAAAAGGTTTCTGAATTAAGATTAAATTCCAGAGACAGGTCACTAACCCCTAGAGCGAGTCCTGCAAAAGACAATCTCTCTGATACTTCAGACACTACAAAGGATGCAGCTGACAGTAAATGTGACATTTGTCCTAGTTATGTAGATAAAGAAGTCTTTAATGCTCTCCCTGAAGAAATGCAACAAGAACTGAAAGCCATGTGGAAGAATCCCTCCAGTTCAGGGGTCAGAAGTAGCCCCAGAACATTGAACAAAGCTAAACCGAACACTCTTTTAAAATATTTTGTTCCAAACAAATAG

Protein sequence:

>DPOGS214594-PA
MVQKPELRCFPLGIQQKNIVVTSNYEARKYGIRKCMLVSDALKVCPNLKLINGEDLHDYRAASNKIFTVLQTFKCPVEKLGMDENFIDVTNIVQERIKNVNLKSITVSGHLYTESNAECVCGCHARLKVASQIASEMRHKIYDELGFTTCAGIAHNKLLAKLICPLNKPNDQTTIYPEHGVSFMSTLQSVRSIPSIGSKTTEALISQKIITVRDLQEVSIEVLKKHFSSDMAVRLKNLSVGEDNTPIKQTGRPQSIGLEDSFKTVSVKSEVEEKFQALLQRLLILVREDGRIPVSLRVTLRKKDVKRLSSHRESRQCQVSPSIFTINNGTLTVTDSGRQKLMSIIMRLFNKLIDLSKPFHLTLVGLAFTKFQERMTGRGSIVNYLMNDISVQSVLNITNDCDTSASSMDYSAASPSSSTTTDLSDGEVEPSPKKPKKGTWIAKRRCLSKEEVASPSKLKVGELRLNSKELEKVSELRLNSRDRSLTPRASPAKDNLSDTSDTTKDAADSKCDICPSYVDKEVFNALPEEMQQELKAMWKNPSSSGVRSSPRTLNKAKPNTLLKYFVPNK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: