MonarchBase - Protein-coding gene

DPOGS200570
Transcript	DPOGS200570-TA	3534 bp
Protein	DPOGS200570-PA	1177 aa
Genomic position	DPSCF300119 + 462796-475263
RNAseq coverage	82x (Rank: top 64%)

Annotation
*Heliconius*	HMEL005491	3e-88	54.86%
*Bombyx*	BGIBMGA009359-TA	0.0	59.44%
*Drosophila*	tam-PA	0.0	44.56%
EBI UniRef50	UniRef50_E2A680	0.0	46.04%	DNA polymerase subunit gamma-1, mitochondrial n=4 Tax=Formicidae RepID=E2A680_CAMFO
NCBI RefSeq	XP_395230.3	0.0	42.56%	PREDICTED: similar to tamas CG8987-PA [Apis mellifera]
NCBI nr blastp	gi\|328789753	0.0	42.56%	PREDICTED: DNA polymerase subunit gamma-1, mitochondrial [Apis mellifera]
NCBI nr blastx	gi\|328789753	0.0	41.60%	PREDICTED: DNA polymerase subunit gamma-1, mitochondrial [Apis mellifera]

Group
Gene Ontology	GO:0005760	0	gamma DNA polymerase complex
	GO:0003887	6.5e-52	DNA-directed DNA polymerase activity
	GO:0003677	6.5e-52	DNA binding
	GO:0006260	6.5e-52	DNA replication
	GO:0003676	8.2e-07	nucleic acid binding
KEGG pathway
InterPro domain	[48-1167] IPR002297	0	DNA-directed DNA-polymerase, family A, mitochondria
	[741-1084] IPR001098	6.5e-52	DNA-directed DNA polymerase, family A, palm domain
	[166-362] IPR012337	8.2e-07	Ribonuclease H-like
Orthology group	MCL10155		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200570-TA
ATGAGGAATATTAAAAAACTGTGCCACATTTATCGTCGGGGTTACAGCAATGATATATTGCCATCAAGTGAATCCGTGATAATAAGACAGAATAAACCTGAAAAGGATATTGATAACCTCGAAACACCTGTCGAAATTCATCCTGAAAATGATCCTAAAGAATTCAGAGTCAATGATGTGAATATACAAATGATATCAAAAAATATTTACGACCAGCTCTTTCGGACTCCGCAACCCACTTTAGATGCTGGTTTGATTAAAAGTTGCCTAAACCATTTAGAAAAGCATGGCATAGATATCAAAAAGAGTACATACTTACCAGATGTACAACTTAAAATACCAAAGTTACAAGGAAAGGATATTGAGGAACATTTTTTTAATATCGGAGAGACACAGTGTGCCCCATACAGAACCCTGTTACAAAAACTATCAACAAACAACTTACCTAAATTACCAAAGAGCGGATGCATTGTCGAAGATAACTCCATAATCAATGTAACACTGATTCAGATATATAAAAATACGTATGGCTGGGTCAGTGAACCTCTGGCAAATGATAACAAACATGAACATCACAACTCTGTGAGGTACGAAGACCTGATACCTTTAGAAACCGATGGCTTTGAACCAGTAGGTGATATAACGAGACCGAGGATGGTGGTTGGTCACAATGTATCATATGACAGGTCCAAAATTAAAGAACAATATTGGTTGAACAAGACTGGTGTACGTTTCATGGACACAATGTCAATGCACATATGTGTGTCAGGAGTAACCAGCTATCAGCGAACAGTTCTCAAAGACAAAAACAAAGAACCTCATCCTCATGATGACGAATGGAGAGAAGTCAGCTCCCTCAATGGACTCTCTGATGTGCATAGATTATACTGCGGTGTGGCCATAGACAAGCAGACTCGAGATGTATTCGTAGAGGGCTGCCTAGAGGATGTCCAGAACAACTTCCAAGACCTCATGAAGTACTGTGCCGGTGACGTCATCGCTACCCACAACGTACTCAGAGCGCTACTACCCTTGTTCCTAGAAAGATTTCCGCATCCTGTCACATTCGCGGGAATGTTAGAATTGGGTTCTGCTTATCTTCCTGTCAATTCGAATTGGTCACAGTACCTAGATTCAGCCGATACAGTTTTTGAGGATTTGAAATTGGAATCCCAACAGATACTCTCATCTAAAGCGGATGAAGCGTGTCGAATGATGGAGAACGAAGGTTACAAGGAGGATCCATGGATGTGGGATCAGGACTGGTCGGTACAGAAACTAAAATTAAAAAAAAATGCGACCAAGAAAAAAGATACTATAGAGTCAAAAAAACCAGCCAGTGAAGATGTAAATAGAATTAGTTCTAAATTTGAATTATTAAGTGACGAATATGTTGATAGTCTAAAGACCAATGAGAAAGTTACACACGATTTTGAGAATTTGAACAAAAAGTTTAAGTATTTATATGATTTGGGTGATTTATTGCCTGTAAAAAGACCTTTTTTGGCCGGATATCCAGCGTGGTATAGGAAATTGTGCACTAAACCAGGAAAGGACCCCGACTGGAGGGCCGGCGCTAATAATATTACTACCAGTATGCAGATAACTCCAAAGCTCCTGCGTCTCTCATGGGAAGGCTATCCTCTACATCACCTGCAGTCCGAAGGTTGGGGATTTCTAGTTCCATACAGTAGACATATAGCTGAAGACGCCAAGGAACCTCTGGTGCCGTTGGAGAAGATTCTGGAAATTTGTCCATTAATGACCTCTAAAGCTGATTACGTTGAGAGCGAACTACATATGCTGCCTCAGAATGTGGAGGAAGATTTAAGCAGGAGGGCGTATTATGCTCGTAAGAAGAAGGAAGAACAGGCGGTGGCCAATCAATACCATGGACTCGGGGTTTGGTGTGGAGTACAGATACAGGGTTGCTGTCATTTCCTGCGTCTCCCTCACAAAGATGGTCCGAAATATAAAGTAGGGAATCCGCTGGCGAGGGATTTCCTAAACATGTTCAGTCAGAACGTACTCTCTGCTCAAGGGAACGAGGCTGAGAAGGTTAGTTGGGAGTTGTATTACAACGCTACCACAGTTAGAGGTTTCCGATTGATACCACAAAAAACTACTCTTGATACATTATTACAATGTTCTCGTATCGTAAATCTTTTCGCGTCGGAACCAACTTGGATGACCGCTAGTAATGCTCAGAGCGACCGCGTGGGCTCCGAACTACGGTCTATGGTCACCGCTCCTCCAGGGTACCGCTTCGTTGGTGCTGATGTGGACTCTCAGGAGTTGTGGATAGCCGCTCTATTGGGTGACAGTTCGTTGATGTGTGGGGGGAGCGCGTTCGGGTGGGCGGTGCTAGCGGGGGACAAACGGACTAACACCGACCTACACTCACTGACAGCAGTCGCTGCCGGAGTGAGGAGGGATCACGCTAAAGTCATCAATTACGCCAGGATATATGGTGCCGGGCAGAATTTCGCTGAGAGATTGCTGAAACAGTTCAACCCGACTATGACGATATCTGAGGCGAAGAGCAAAGCCGCCAAAATGTTTACTACAACCAAAGGAAAAAGGGTTTACAGGCTGAAGGAAAAATTTATGGAGGGTTTCATGGACGAGGAGTCAGGAGATCAGGCGTACCGTCCCCAGACTGTAGAGATGACTTCGTACCAAGCGATGCGTCTGGCTAAACTGAGCGGCCGAACTACAGATGAGATGTTCGAGCGACCTCGGTGGGAGGGGGGAACAGAGTCGCACATGTTCAACAAACTAGAGGAAATAGCAGACGTATGTAACTATGGCCATGATAGGAACGCGTCCGGACAAAAACAAAATATTTGCATTGAAGAGTCTGAGACCATGCCCATTACACCGATCCGTCACATCGCCGTCACGTGGCCTATATGGAGCGTTAAAAATCGTCGGCGAAAATGTTTTGTTGGTGACGACGCGCTCCATGCACGACACGCGACGTTATCACAGCGATACGAGGTGGAGACGAGACGAAAATTGATTCTATCTGTAGAGTCATCGTGTCCTCGTACAAGTTTCCTCGAGGGGCGTCTGTCTCGTTCTTTGGAGGCGGCACATAACGGAGGCGGCACTAAACTGAACTGGGTGGTCCAGAGCGCTGCGGCTGACTTCCTACATCTCATGCTGGTTAGCATGACACATCTGCAGCCTTCAGCCAGATTTTGTCTCAGTTTCCACGACGAGGTCAGATACTTAGTTCCCGAGGAACATAAATACGAGGCAGCCTTGGCATTACAAATAACAAACCTTCTCACTAGAGCTTTCTGTTCACAGAGGGTTGGGATACACGATCTACCGATGTCAGTAGCTTTCTTCTCATCTGTGGAAGTCGATCGAGTTTTAAGAAAGGAAGCCAATATGGACTGTGTGACCCCTTCAAACCCTCATGGACTGGAAAAAGGCTATGGTATACCTAATGGAGAGTCATTGACGATATATGATGTCTTAGAGAAAACCGATTGTAACAGATTTTGTACCAAAGAAACGAAATAA

Protein sequence:

>DPOGS200570-PA
MRNIKKLCHIYRRGYSNDILPSSESVIIRQNKPEKDIDNLETPVEIHPENDPKEFRVNDVNIQMISKNIYDQLFRTPQPTLDAGLIKSCLNHLEKHGIDIKKSTYLPDVQLKIPKLQGKDIEEHFFNIGETQCAPYRTLLQKLSTNNLPKLPKSGCIVEDNSIINVTLIQIYKNTYGWVSEPLANDNKHEHHNSVRYEDLIPLETDGFEPVGDITRPRMVVGHNVSYDRSKIKEQYWLNKTGVRFMDTMSMHICVSGVTSYQRTVLKDKNKEPHPHDDEWREVSSLNGLSDVHRLYCGVAIDKQTRDVFVEGCLEDVQNNFQDLMKYCAGDVIATHNVLRALLPLFLERFPHPVTFAGMLELGSAYLPVNSNWSQYLDSADTVFEDLKLESQQILSSKADEACRMMENEGYKEDPWMWDQDWSVQKLKLKKNATKKKDTIESKKPASEDVNRISSKFELLSDEYVDSLKTNEKVTHDFENLNKKFKYLYDLGDLLPVKRPFLAGYPAWYRKLCTKPGKDPDWRAGANNITTSMQITPKLLRLSWEGYPLHHLQSEGWGFLVPYSRHIAEDAKEPLVPLEKILEICPLMTSKADYVESELHMLPQNVEEDLSRRAYYARKKKEEQAVANQYHGLGVWCGVQIQGCCHFLRLPHKDGPKYKVGNPLARDFLNMFSQNVLSAQGNEAEKVSWELYYNATTVRGFRLIPQKTTLDTLLQCSRIVNLFASEPTWMTASNAQSDRVGSELRSMVTAPPGYRFVGADVDSQELWIAALLGDSSLMCGGSAFGWAVLAGDKRTNTDLHSLTAVAAGVRRDHAKVINYARIYGAGQNFAERLLKQFNPTMTISEAKSKAAKMFTTTKGKRVYRLKEKFMEGFMDEESGDQAYRPQTVEMTSYQAMRLAKLSGRTTDEMFERPRWEGGTESHMFNKLEEIADVCNYGHDRNASGQKQNICIEESETMPITPIRHIAVTWPIWSVKNRRRKCFVGDDALHARHATLSQRYEVETRRKLILSVESSCPRTSFLEGRLSRSLEAAHNGGGTKLNWVVQSAAADFLHLMLVSMTHLQPSARFCLSFHDEVRYLVPEEHKYEAALALQITNLLTRAFCSQRVGIHDLPMSVAFFSSVEVDRVLRKEANMDCVTPSNPHGLEKGYGIPNGESLTIYDVLEKTDCNRFCTKETK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: