MonarchBase - Protein-coding gene

DPOGS213238
Transcript	DPOGS213238-TA	2547 bp
Protein	DPOGS213238-PA	848 aa
Genomic position	DPSCF300124 - 440499-449598
RNAseq coverage	198x (Rank: top 47%)

Annotation
*Heliconius*	HMEL013421	93.04%
*Bombyx*	BGIBMGA009517-TA	81.72%
*Drosophila*	Top3beta-PA	64.15%
EBI UniRef50	UniRef50_O95985	63.92%	DNA topoisomerase 3-beta-1 n=100 Tax=Eumetazoa RepID=TOP3B_HUMAN
NCBI RefSeq	XP_001606777.1	71.86%	PREDICTED: similar to prokaryotic DNA topoisomerase [Nasonia vitripennis]
NCBI nr blastp	gi\|383857261	71.95%	PREDICTED: DNA topoisomerase 3-beta-1-like [Megachile rotundata]
NCBI nr blastx	gi\|307184245	71.95%	DNA topoisomerase 3-beta-1 [Camponotus floridanus]

Group
Gene Ontology	GO:0003677	1.5e-95	DNA binding
	GO:0005694	1.5e-95	chromosome
	GO:0006265	1.5e-95	DNA topological change
	GO:0003916	1.5e-95	DNA topoisomerase activity
	GO:0003917	1.4e-12	DNA topoisomerase type I activity
KEGG pathway	nvi:100117184	0.0
	K03165 (TOP3)	maps->	Homologous recombination
InterPro domain	[1-847] IPR000380	0	DNA topoisomerase, type IA
	[2-634] IPR023405	1.2e-149	DNA topoisomerase, type IA, core domain
	[169-581] IPR013497	1.5e-95	DNA topoisomerase, type IA, central
	[288-544] IPR003602	1.6e-74	DNA topoisomerase, type IA, DNA-binding
	[488-627] IPR013824	8.3e-43	DNA topoisomerase, type IA, central region, subdomain 1
	[145-241] IPR003601	8.4e-34	DNA topoisomerase, type IA, domain 2
	[297-420] IPR013826	5.3e-27	DNA topoisomerase, type IA, central region, subdomain 3
	[3-137] IPR006171	3.5e-19	Toprim domain
Orthology group	MCL12894		Single-copy universal gene

Nucleotide sequence:

>DPOGS213238-TA
ATGAAGACAGCATTAATGGTGGCTGAAAAGCCGTCCCTGGCTCAAAATCTAGCAAATATTCTCAGTAATGGAAAATGCAATACCAACAAGGGCTCTAATTCAGCTTGCGCAGTTCATGAGTGGACAGGTACCTTCAAAAACGAACCTGTGAAATTTAAAATGACTTCAGTGTGTGGTCATGTGATGAGCTTAGATTTCACTGGCAAATATAATAATTGGGATAAAGTAGATCCCGTTGAACTGTTCATATGTCCTACAGAGAAGAAGGAAGCAATGCCAAGACTTAGGATTCCCGCTTTCCTAGCACAGGAGGCTAGAGGATGTGATTATCTCATTCTTTGGTTGGATTGTGATAAAGAAGGGGAAAATATATGTTTTGAGGTTATGTCCTGCGTTCAAAACTACATGAAAGGTGACGTATACTCACCAGCAGTGACATTTCGGGCGCGATTTTCAGCCATCACAGATAAAGATATTAAAACAGCCATGATGAATCTGGTTAGACCAAATGAAAGCGAATCTCGAAGTGTTGACGCCAGACAGGAACTAGATTTGCGTATCGGATGTGCCTTCACGAGATTCCAGACGAAGTATTTTCAAGGTCGCTACGGTGATTTGGACGCGTCTCTCATATCGTACGGTCCCTGCCAGACTCCGACACTCGGATTCTGTGTCCAACGCCACGATGACATCCAGACCTTCAAACCGGAAACCTATTGGGTGTTGAGAGTGACCGCCTCCACCTCCGAGGGCAGAGAGCTCCCGCTTGAATGGAAACGTGTCAGGAGCTTCGAAAAGGACATAGCTAACATGTTTCTGGTCGGCATCAAGGAATTCAAAGAGGCCACAGTTGTTAATATCCAAGCTAAAGAGAAGATAAAGTCCAGACCGACCGCTCTCAACACTGTTGAGTTGATGAGGGTGGCCAGTGCTGGTCTCGGTATGGGACCACATCACGCTATGCAGATTGCTGAACGTCTGTACACTCAAGGTTATATATCATATCCTAGAACAGAGACGACTAGTTATGGAGAGAATTTTGATCTCATTGGTAGTCTTCGTCAACAACAGAATTCTAACAAGTGGGGTTCTGAGGTACGAGCTTTACTGGCTAATGGTATCAATAAGCCCAAGAAGGGCCACGACGCGGGTGACCATCCACCGATCACTCCTATGAAGCCTGCCTCCGAATCCGAGCTGGAGGGTGACATGTGGCGTATATACGACTACATCACGCGGCATTTCATAGCGACACTGTCGCGCGACTGCCGCTACCTCAGCACGACCCTTACCTTCAGCGTGGGCTCCGAGACGTTCTATTACACTGGCAATACTCTGGTCGACGCTGGCTACACTGAGATCATGCATTGGCAGGCTTTCGGTAAGGATGAGTTCGTCCCAGTACTGAAGGTGGACGAGGTGCTTCGGGCACACGACCACCGCCTCGTGGAGTGTCAGACCTCGCCCCCGGACTACCTCACCGAGTCTGAGGTGATAACTCTGATGGAGAAGCACGGGATCGGCACGGACGCGTCCATACCTGTCCACATCAATAACATCTGTCAGAGGAACTACGTGAGCGTCGGCAGCGGGCGGCGGCTCGTGCCCACCAGCCTGGGCGTCGTGCTCGTACATGGATATCAGAAGATCGACCCGGAGCTAGTGTTACCGACGATGCGATCGGCCGTCGAGGAACAGCTCAACCTCATCGCAATCGGTCGAGCCGATTTCCACGCGGTGTTGACTCACACCACGGAGATCTTCAGGCGGAAGTTCCAATACTTCGTGAGGTCCATAGAGGCCATGGACCAACTGTTCGAGGTCAGCTTTTCGTCGCTCAAGACCAGCGGCAAGGCGCTGTCCCGCTGCGGCAAGTGCAGGAGATACATGAGATACATACAGGCGAAGCCCGCCCGCCTGCACTGCTCCCACTGTGACGACACCTACACGCTGCCCCAGCACGGCACGGTCCGCATTTACCGCGAGCTGAAGTGTCCTCTGGACGACTTCGAGCTGCTGTCCTGGTCCACCGGCAGCAAAGGGAAGAGCTTCCCGCTCTGCCCTTACTGCTACAATCACCCACCATTCAGGGATATGAAGAAGGGCTTCGGCTGTAACTCCTGCACTCACCCCACTTGTCCCTACGGCGTGAACTCCACCGGCGTCTCCGGCTGTGTCGAATGTGATGGAGTTTTAGTTTTGGATCCCTCGGCGCCGAAGTGGAAGCTGGCGTGTAACCGTTGTGACGTCATCATAAACGTGTTCGAGGACGCGAGCCGCGTGTCCGTGTGCGAGGCGGCGTGCGCGTGCGGCGCTCAGTTAGTGTGCGTCGAGTACCGCGCCGAGCGGACCAAGCTGCCGGCCGCGCTCACCGAGATGACCGCCTGCCTTTACTGCGAGCCGGCTTTCAGCGCGCTTGTGGAGAAGCATCGTGCGGTGGCGCCCCGGAGCGGAGGATCGCGAGGACGGAGCGCCAGGGGCAGAGGGAAACATCGCAACAAACAACCCAAAGACAAAATGGCCCAATTAGCGGCGTATTTCGTATAA

Protein sequence:

>DPOGS213238-PA
MKTALMVAEKPSLAQNLANILSNGKCNTNKGSNSACAVHEWTGTFKNEPVKFKMTSVCGHVMSLDFTGKYNNWDKVDPVELFICPTEKKEAMPRLRIPAFLAQEARGCDYLILWLDCDKEGENICFEVMSCVQNYMKGDVYSPAVTFRARFSAITDKDIKTAMMNLVRPNESESRSVDARQELDLRIGCAFTRFQTKYFQGRYGDLDASLISYGPCQTPTLGFCVQRHDDIQTFKPETYWVLRVTASTSEGRELPLEWKRVRSFEKDIANMFLVGIKEFKEATVVNIQAKEKIKSRPTALNTVELMRVASAGLGMGPHHAMQIAERLYTQGYISYPRTETTSYGENFDLIGSLRQQQNSNKWGSEVRALLANGINKPKKGHDAGDHPPITPMKPASESELEGDMWRIYDYITRHFIATLSRDCRYLSTTLTFSVGSETFYYTGNTLVDAGYTEIMHWQAFGKDEFVPVLKVDEVLRAHDHRLVECQTSPPDYLTESEVITLMEKHGIGTDASIPVHINNICQRNYVSVGSGRRLVPTSLGVVLVHGYQKIDPELVLPTMRSAVEEQLNLIAIGRADFHAVLTHTTEIFRRKFQYFVRSIEAMDQLFEVSFSSLKTSGKALSRCGKCRRYMRYIQAKPARLHCSHCDDTYTLPQHGTVRIYRELKCPLDDFELLSWSTGSKGKSFPLCPYCYNHPPFRDMKKGFGCNSCTHPTCPYGVNSTGVSGCVECDGVLVLDPSAPKWKLACNRCDVIINVFEDASRVSVCEAACACGAQLVCVEYRAERTKLPAALTEMTACLYCEPAFSALVEKHRAVAPRSGGSRGRSARGRGKHRNKQPKDKMAQLAAYFV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: