MonarchBase - Protein-coding gene

DPOGS207064
Transcript	DPOGS207064-TA	3396 bp
Protein	DPOGS207064-PA	1131 aa
Genomic position	DPSCF300001 + 2277434-2283460
RNAseq coverage	386x (Rank: top 31%)

Annotation
*Heliconius*	HMEL010199	0.0	60.85%
*Bombyx*	BGIBMGA013112-TA	0.0	62.96%
*Drosophila*	l(1)1Bi-PA	8e-26	21.41%
EBI UniRef50	UniRef50_UPI00022CA839	6e-141	31.60%	UPI00022CA839 related cluster n=1 Tax=unknown RepID=UPI00022CA839
NCBI RefSeq	XP_001603225.1	3e-144	34.19%	PREDICTED: similar to DNA polymerase v [Nasonia vitripennis]
NCBI nr blastp	gi\|328787590	9e-145	31.14%	PREDICTED: hypothetical protein LOC725618 [Apis mellifera]
NCBI nr blastx	gi\|156537125	6e-164	33.01%	PREDICTED: DNA polymerase V-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0003887	1.1e-59	DNA-directed DNA polymerase activity
	GO:0003677	1.1e-59	DNA binding
	GO:0006351	1.1e-59	transcription, DNA-dependent
KEGG pathway
InterPro domain	[46-1110] IPR007015	1.1e-59	DNA polymerase V
Orthology group	MCL15594		Insect specific

Nucleotide sequence:

>DPOGS207064-TA
ATGAAAAACGAGATCAATATGGATAAACCTGAGAAAGCAGTAACTGCTTCATTGCTAGACGCTTTTGATTTATTTAAGTCACCGACAGATGATTTAAAAATCCTTGCTGGCCTTAAGATACATTCGCGTCTACGGGAAAATGAGGGTGGAAAGGAACTACAGTATACATTAAAAAGACTAGTTAGAAGTCTTGGCGCGAACATCGCTGAGTTGCGGATGGGCTATTTTGCTGCACTTGTTACAATCCTGACTAGGTTTCCAGAGATAACAGTAACGCAGCTGCTAGAATTGATCAAAAAAGAACTCCATGCCAGCGGATCATCTAAGAGTGAAGTTGGGGATGTTGCTTTAGGTCACATTCTGGCATGCGGGGCTGTTTTTCGTTCAGGCCTTATGTTAAAATGTACTGAGGAAGAACAAAAGGAAGTATTGCAACTTTTTGAAACAGCTAGCAGTAAGAAGTCATATTTGAGTACTGTGGCAACCCTAGTCTTTATTGATTTTATTAATAATCTCGATGAAGAACAATTTGCTACAATAGTTTGGCCGAACATAAAGCAGAACTACAAAAAAGCTATAAACGAACACAATTTAGACTCTTTATATTTTTTAATGATTGTTAATGAAAAGTTTCCTAAGAAAGTCAAGCTGAGGAAGTTGATTGGTGTGCCAGAACTGTTACACGAAGATCACATTTCAGATATATGTGATAAATTAATGACAGGCGTAGACTTCAATTCATTAAGCCACCCAATATACCAGGAATGTGGTAAACAGATTGCTAACTCACCACATCTTTCAATTTTTTGGAATAAAATTGACAGTCATCTTGTAAAACATAACAGGAACAGAGAATTGGTTTCATTAAATATTTTGAATACTGTTCTCCTGAATTTAAAAGACAATGTTGAAGTCATACCAGATCTGCTGAGTGACAACTTTTTCAAGTTGTTCATGGACTGGTTCAAAGGTTTACAGACAGCCAGCAAAATAAGGAATAAGAGAGACAATGAAGATGATTCCAAAATAATGGTTAAAAAACAAAAAGAAGTTCTCATGTCTCTAGCCAAGGCATTACAATTGCCATCTGTTGATAGCAAAATAAGAGTGAAAACTTTGGACAAGTTATTATTTAGCCCGGGTGAAATTAATTTCACTGAGATAACTGGATCTACAGTTGTTAAATCTATTACTGCTGGTCTAGATGTTGATGGTCTCAAGAAAATGGCAAAGTCATTGAAAAAGGTCTTCCTCAATTCCTCCAAGAAAGTTATTAAAGAGGGTGTGGAAAGGAACTGGTACAATAATGAAAGGGTTAAAGCAGCTGAGTTGATATCATACATGGTCAGTCATGAAGCTGTGAAGGACGACGCTGAATTTAAAATAAAATACATGCAATTGCTTATGTGCTTTGGATTTTTCAAAATCGGCGGTGATGAAAGTGTTGCCGTTAGTAGTAGCCTAGCAGGGTCTATAAAAGCTTGCTTCTACCGATGCTTCACATCCCGCTTTTCAAACGTCGAAGGTTTGGTAACAGTATTGTCATCACTCAGTAGTTTCATTACATCTATGATGACCAAAGAAAAGGTGCGATCAAAGCTCGAGAAACAGTTTGACAAAGAGAACATGGACTGTTGGGAAATGTTAACAAAAGTATGCGGCAAAATAGAAAAGAACCAATCTAAGTCGAAGGTCGAGAATGTCTTTCTTATTTTATTATACCAGCTCGGTTTGTTCCTCTTCTCGGAACCGACACATGTGAAAATTGCCTCCAGCTCTATTATAGAACTCAAAAGTTGCTACGAGCATTATATGAAAGACAGAAAAGCAAAGACAAGTAAGAAAGAAAACTCAATCAAAGATGAACCTGAGTGGATAGAAGTTGTGACTGAGGTGTTGCTGTCGATTTTGTCGATTGAGTCAAGTGTTTTGCGCTCAGTAGTACAATGTGTTTTCAGACTTCTGTGGGAGTATTTGACACCATCCTCTATAGCGCAAATTGTTTCGGTTCTCGACCCAGAGAGCGAAGCTAATCCGTTAGGACAAGAAAGCGATTTGGAAGACGATGAAGGAGAATTTGATGATTCTGATGAAGAAGGAAATGAAAATTGTCAAGAAAATGAAGAAAACGGAGAACACAATGATAGCGAGGAAAGTGAAAGTGAAATGGATGATGACGATGATGATGAGAAGGATTTGAACACGCCAGACCAGTTACGAATGGCCATTCAGAAGGCTCTCGGAAATACTACAGTCGACACTGACGTCGAAAGTATAGACGCTGATATGATAACAGAAGAGGAAGGCAAGAAACTTGATGAGGCTCTTGCTGAAGCATTCAAACAGTTCCATCAAGGCAAAAATAAGAAAACCAAAAAGGAACGCAAGAATAAAAAATCACTTTCAGATTTCAGAATCAAAGTACTAGATTTAATTGACATTTATCTGGAAAAGGATCCGGCTATGGACATATGTTTAAATATGATCGCCCCATTGACTAGATGTCTCGAGTTTTGCATGCAAGATAATCAGTTTAAGGAACTGGAAAATAGAGTACGGAAAACTATTAAGGGTCTATCGAAAATAAAGAAGTTCGCATCCACTGACGACATAACACCTGACATTTTGGCCACTTATTTGAAATCCGTAATAGAAAAGGGAGAACGATCCCACTTCATGTACCAAGCTCTTGGTGACGTTTTAACATATTTTTCAGTTTTTATAATAAACTGTTCACAAAAGATTGAAGCCCAACCGACCCAGACACCTAAAAAAAACAAGATATCTACTTTAAATGACCTTCTGAAAGAGACTGTTGACAATTTTTTCCACAATCGTAGCTGCTTATTACCAATTATTTTCTTCCATAACATTCTTCAATTAGAATGGCCTGGTAAATATAAATTAGCATCGATTGTAGTGAAAAATGTATTTAATCCTAAAGTGAGACAATTTAAACGGAACGAAGGAGTACAACTCCTATCTGGCTTCTATTTATCAATGAAAAGATTTAAGCCTATTTCTGAAAGCTGTTTTGCTGAGTTAGCTAATATAGAGAAAAATTTCAAAGAATCTTTTACAGCCACACTTGAAAGCAATGAGATGGACGTTAAACCTAATTTCATTGATTCCCTCAAGAAATTACTTAATGTTATGAAAAATCTTTATACGCAATGTAATCAGGAATCCCAACTTGATTTTGAATCAATGTTCAATGCATTAACGAACTTCAAAGTAGCTGTTAAGAGTACAAACAATGTTGAAGAATCAAAACAGATCATCGAAAATGGAAATAAGCCGAGTAAAGAGCAAAACAAAAAAAAGAAAAGAAAAGCTCTAACTAATGGGGTTATAGACCCACCGGTTAAGAAATCAAAAAACAAAATAAGTGAATAA

Protein sequence:

>DPOGS207064-PA
MKNEINMDKPEKAVTASLLDAFDLFKSPTDDLKILAGLKIHSRLRENEGGKELQYTLKRLVRSLGANIAELRMGYFAALVTILTRFPEITVTQLLELIKKELHASGSSKSEVGDVALGHILACGAVFRSGLMLKCTEEEQKEVLQLFETASSKKSYLSTVATLVFIDFINNLDEEQFATIVWPNIKQNYKKAINEHNLDSLYFLMIVNEKFPKKVKLRKLIGVPELLHEDHISDICDKLMTGVDFNSLSHPIYQECGKQIANSPHLSIFWNKIDSHLVKHNRNRELVSLNILNTVLLNLKDNVEVIPDLLSDNFFKLFMDWFKGLQTASKIRNKRDNEDDSKIMVKKQKEVLMSLAKALQLPSVDSKIRVKTLDKLLFSPGEINFTEITGSTVVKSITAGLDVDGLKKMAKSLKKVFLNSSKKVIKEGVERNWYNNERVKAAELISYMVSHEAVKDDAEFKIKYMQLLMCFGFFKIGGDESVAVSSSLAGSIKACFYRCFTSRFSNVEGLVTVLSSLSSFITSMMTKEKVRSKLEKQFDKENMDCWEMLTKVCGKIEKNQSKSKVENVFLILLYQLGLFLFSEPTHVKIASSSIIELKSCYEHYMKDRKAKTSKKENSIKDEPEWIEVVTEVLLSILSIESSVLRSVVQCVFRLLWEYLTPSSIAQIVSVLDPESEANPLGQESDLEDDEGEFDDSDEEGNENCQENEENGEHNDSEESESEMDDDDDDEKDLNTPDQLRMAIQKALGNTTVDTDVESIDADMITEEEGKKLDEALAEAFKQFHQGKNKKTKKERKNKKSLSDFRIKVLDLIDIYLEKDPAMDICLNMIAPLTRCLEFCMQDNQFKELENRVRKTIKGLSKIKKFASTDDITPDILATYLKSVIEKGERSHFMYQALGDVLTYFSVFIINCSQKIEAQPTQTPKKNKISTLNDLLKETVDNFFHNRSCLLPIIFFHNILQLEWPGKYKLASIVVKNVFNPKVRQFKRNEGVQLLSGFYLSMKRFKPISESCFAELANIEKNFKESFTATLESNEMDVKPNFIDSLKKLLNVMKNLYTQCNQESQLDFESMFNALTNFKVAVKSTNNVEESKQIIENGNKPSKEQNKKKKRKALTNGVIDPPVKKSKNKISE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: