MonarchBase - Protein-coding gene

DPOGS206898
Transcript	DPOGS206898-TA	3573 bp
Protein	DPOGS206898-PA	1190 aa
Genomic position	DPSCF300001 - 1787073-1795398
RNAseq coverage	51x (Rank: top 70%)

Annotation
*Heliconius*	HMEL006856	0.0	61.88%
*Bombyx*	BGIBMGA012855-TA	7e-115	60.93%
*Drosophila*	CG2990-PB	1e-180	36.61%
EBI UniRef50	UniRef50_UPI00015B4EC2	0.0	38.35%	UPI00015B4EC2 related cluster n=1 Tax=unknown RepID=UPI00015B4EC2
NCBI RefSeq	XP_001606961.1	0.0	38.35%	PREDICTED: similar to CG2990-PB [Nasonia vitripennis]
NCBI nr blastp	gi\|322800176	0.0	38.97%	hypothetical protein SINV_05223 [Solenopsis invicta]
NCBI nr blastx	gi\|322800176	0.0	38.89%	hypothetical protein SINV_05223 [Solenopsis invicta]

Group
Gene Ontology	GO:0003677	3.9e-49	DNA binding
	GO:0005524	3.9e-49	ATP binding
	GO:0006260	3.9e-49	DNA replication
	GO:0004003	3.9e-49	ATP-dependent DNA helicase activity
KEGG pathway	nvi:100123335	0.0
	K10742 (DNA2)	maps->	DNA replication
InterPro domain	[230-428] IPR014808	3.9e-49	DNA replication factor Dna2
Orthology group	MCL15267		Single-copy universal gene

Nucleotide sequence:

>DPOGS206898-TA
ATGCAAGAAAGTTCGAGTTCCAAAAAGAAATCAGCTCCAAATAAGCAGCAGACAATCCTAAATTTCTTTGGAAATGCCTCAGACCTTAATAAAACACGTAATCAAGAAGCCTGTTCGGAAGGAAAATCTAAGTCACTTAAAAGAAAAGCCCATTCACCCTCAAAAATTCACTTAGACTCAATTTCACATAAAGTAACAGGGAAATTTAGTTCCGATAATAATACTACTAAAAAGTTAAGGATGGACACAAATACCTTAAACGATTTGAAAGGCAAACATATAGAACATGATGCTATAAAAGTGAAGTCACCTAAGAAGAAAAATATTTTAAGCTGCAAAAGTGGCTTAAGTTTAAACAAGGAAAGTAATGTTGAAAATATAATAAAGCATTATGAGCTTGAACCAATGAATCAAAAGGAAAATATATGTAATAGAAAAATTGAAATAACTTGTAGTTCAACTGATTTGTCAAATGACCTAAATATATCACAAAATGATTTTAACTCACAACCATCACATGATGGTTCCAGCTCAAATGAACAGAGGATTAGTCGTGCTGAAATCGATGATATATTCATAGACGACTTTGATTTAGAGGATATCAAAGATAATTTGGATTTGACAACCATGCAGAGGTGTAAGATACTTGATATCATAAAACATCCGCAGTCATTTGAAATCATATTGAAAAATAATGTAAATAATAGAGGAACTGTTTTCATAGAGGGAAATTGGTTGAACACATACCTGCAAACCGGGGATATAGTTAGCATTCTGGCATCTCGAGACTCGTCTGGTCGGTTTAGAATAAATAATACGCAAGGTCTCCTTGTGTTGAGGCCAGACCATTTAATATCTTCAACAAGTGTCGTCTCTGGTGTGTTCTGTAGACGGAAAGCTGTGTTACAAGAAAGATGGAAGGGAATTGATTCTGCATCAGTTACTATGACAATTGGTACATTGGTTCACGAAATGGTACAGAGAGCTTTAACTCAGAAAATTTCAAATGTGCCACAAATTAAAGTTTTATGTGAAAATATAATTAAGGAATCCATTGAGATGTTGTATGATGCTGGGATAACGGAGGCAGATGTGAGAACAAACATGCAGGTGTATTTAGAACCGCTGGCGGAATTTATGCAGACGTATGTGGTTAATGATAAAATGATTGACTCAAAGAAATATCAGTGGAAAGGTAAAGTAGAGAAAGTTTTAGACATAGAAGAGAATGTTTGCTGTCCTCAGATGGGTTTGAAAGGTAAAATTGATGCAACACTCAAAGTCACGATTCACAATAGAAAAGACAAAACCACAACAGTACCATTGGAGTTAAAAAGCGGTCGAGCAAGTGTTTCCGCAGAGCATACAGGACAGCTAGTATTATATGGTATGATGATGAGTGTCCTCGAAGGGAAGGATCCGGCCAGGGGGGACCAGAGGGGCCTGTTGTTGTACCTAAAGGACAAGATAAACATCACTGAAGTTAATTGTGATTATCCGGAGAGACGAGACCTGGTGATGCTTCGTAATGAGCTCGTCCAACATCTAGCAGCAGGACCGAATGATACGTCTCAAGACGAGTTAACGGACATCGAAGATTTGGGGAAGTACCACCAAAGTTTGCCAGAACCGGTGAATCATCACTCTGCCTGCTCCAAATGTGCATATCTCACTCTGTGTTCATTACATTTGTGGCATACAAATGGAACTACAGTATCAAGTGGCCACCCTTTAAGCAAACTCAAAAGTACAGCCCTGGGACACCTATCCTCTGAACATATACAGTACTTCCTTAAATGGGCGAGCTTACTTCGTGTAGAGGAGAAAATGCAGCTGATGAATTCACCAATACACGCCCTGTGGACTGATAGCACTGATATTCGATCTAAACGCGGAAGTTGTGCTCCGAATTTAACTCTGAGTCGTGTTTCAAGTTCCAACGGCAGATACTTACATGTCTTCATTAGAAACGGAACAAAAACAGAGACGCTCAGTGGTACGCAGTATATTAAAGGACCTCAAGCAGGTGATTTTTCTATAGTGAGCATAGATAATAGACCCTGGGTTGCAGCCGGAGCGGTTACATTAAGCGATTCCAAAGAATTGCAAATATTATTGGACAGAGACCTATCACTTCGTCTGTCAAGTAACACTAAATACCACATCGACATCTACGAAAGTTACGCTACGACTGTACAAAACCTAACTAACCTCGGTCTGCTTATAGAAGACACCCACCAAGCTTCGAAATTAAGAAAATTAATAATAGATAAAGAAAGTCCAACGTTCACACAGAAGCTGCCGCCCCGTGTACACAAGCTGAGTAAGGAGTTACTCGTCACACTGAACGAGGAACAACAGGCAGCAGTACTGAGAGTGTTGGAGTGCGATGATTATGTTCTTTTGCAAGGGTTACCTGGCACTGGGAAGACTCAAACTCTGTGTGCACTGATTCAACTGCTGTGTTCTTTGGGTATGCGTGTGTTGGTCACCGCTCACACACATTCAGCCGTCGATACACTTCTTAGCAGACTACCTTCATCTCTAAAAGTACTGCGTGTTGGTACTTCGTCGCGAGTATCGGTTTCTGCGGCGGTCAAAGAGTGCACCACAGTGGAACAGTTGACCAACCTTTATAACTCAGTGCAAGTGGTAGGAGTCACATGTCTCGGAGCATCTCACGCGTTGCTGTCGAAGAATACATTCGACTTTTGTATTGTGGATGAAGCGACACAAGTACTACAAAGCACAGTCCTCCGTCCGTTGTTTGCTGCGAATAAATTCGTGTTAGTTGGAGACCCCGAACAACTACCGCCAGTCGTCAGGAGTAGAGATGCTAAGTTTCTAGGAATGGAGGTGAGCTTATTCCATAGCCTGATGAAGGATAGAACAACGTGCACTCTAAGCCTCCAATACAGAATGAACCAACCTTTAGCAGACCTCGCCAATAAAATTGCGTACAGCAATAGACTTAAATGTGCCAATGAAACTGTAGCAAAGGCAGCACTTAATATAAATAAAATGAAACTGTCAGAAAGCTCTTCGGATCAATGGATTACGACTGTGTGCAGTCCGGAACCCGAAGATGCGGCCGTTTTCCTTAATACAAAGATGGAATTATCTGAAGACGCTTCTAAGACTTTGAACAATAAAGACGAAGCTGTGGTTGTGCTAGCTGTGATTAAAATTTTAAAACAGGCGGGTATATCAGCGTCAGATATAGGGGTGATAGCTCCGTACCGTGATCAGGTCACTTTGCTGAAACGCGTCCTGGACGGTACACAAGTCGAAGCCAGTACTGTAGATCAGTTCCAAGGCAGAGATAAAAGTGTCATAATATACTCTTGTACAAGAAAAGATGATAATTTAAGAAAAGTCAAGGATAACGAAGTCCTGAACGACAAACGTCGTCTGGCGGTTAGCGTGACGCGTGCGAAACACAAGTTTATTGTGATCGGTAACATTCGCGCATTGAAAAGATACACTACGATAATGAAACTAGAAGAGGCTTGTAAGACTGTTGATTTGGATGAAGAGGTTGTTACAAACCTGAATAATAAATATGGGTTCTGA

Protein sequence:

>DPOGS206898-PA
MQESSSSKKKSAPNKQQTILNFFGNASDLNKTRNQEACSEGKSKSLKRKAHSPSKIHLDSISHKVTGKFSSDNNTTKKLRMDTNTLNDLKGKHIEHDAIKVKSPKKKNILSCKSGLSLNKESNVENIIKHYELEPMNQKENICNRKIEITCSSTDLSNDLNISQNDFNSQPSHDGSSSNEQRISRAEIDDIFIDDFDLEDIKDNLDLTTMQRCKILDIIKHPQSFEIILKNNVNNRGTVFIEGNWLNTYLQTGDIVSILASRDSSGRFRINNTQGLLVLRPDHLISSTSVVSGVFCRRKAVLQERWKGIDSASVTMTIGTLVHEMVQRALTQKISNVPQIKVLCENIIKESIEMLYDAGITEADVRTNMQVYLEPLAEFMQTYVVNDKMIDSKKYQWKGKVEKVLDIEENVCCPQMGLKGKIDATLKVTIHNRKDKTTTVPLELKSGRASVSAEHTGQLVLYGMMMSVLEGKDPARGDQRGLLLYLKDKINITEVNCDYPERRDLVMLRNELVQHLAAGPNDTSQDELTDIEDLGKYHQSLPEPVNHHSACSKCAYLTLCSLHLWHTNGTTVSSGHPLSKLKSTALGHLSSEHIQYFLKWASLLRVEEKMQLMNSPIHALWTDSTDIRSKRGSCAPNLTLSRVSSSNGRYLHVFIRNGTKTETLSGTQYIKGPQAGDFSIVSIDNRPWVAAGAVTLSDSKELQILLDRDLSLRLSSNTKYHIDIYESYATTVQNLTNLGLLIEDTHQASKLRKLIIDKESPTFTQKLPPRVHKLSKELLVTLNEEQQAAVLRVLECDDYVLLQGLPGTGKTQTLCALIQLLCSLGMRVLVTAHTHSAVDTLLSRLPSSLKVLRVGTSSRVSVSAAVKECTTVEQLTNLYNSVQVVGVTCLGASHALLSKNTFDFCIVDEATQVLQSTVLRPLFAANKFVLVGDPEQLPPVVRSRDAKFLGMEVSLFHSLMKDRTTCTLSLQYRMNQPLADLANKIAYSNRLKCANETVAKAALNINKMKLSESSSDQWITTVCSPEPEDAAVFLNTKMELSEDASKTLNNKDEAVVVLAVIKILKQAGISASDIGVIAPYRDQVTLLKRVLDGTQVEASTVDQFQGRDKSVIIYSCTRKDDNLRKVKDNEVLNDKRRLAVSVTRAKHKFIVIGNIRALKRYTTIMKLEEACKTVDLDEEVVTNLNNKYGF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: