MonarchBase - Protein-coding gene

DPOGS201182
Transcript	DPOGS201182-TA	1680 bp
Protein	DPOGS201182-PA	559 aa
Genomic position	DPSCF300262 - 31818-35633
RNAseq coverage	525x (Rank: top 24%)

Annotation
*Heliconius*	HMEL017134	9e-157	82.09%
*Bombyx*	BGIBMGA014271-TA	0.0	84.47%
*Drosophila*	Hlc-PA	5e-170	52.87%
EBI UniRef50	UniRef50_Q6SC69	0.0	76.72%	RNA helicase n=20 Tax=Coelomata RepID=Q6SC69_CHOFU
NCBI RefSeq	XP_966623.1	0.0	64.07%	PREDICTED: similar to ATP-dependent RNA helicase DBP9 [Tribolium castaneum]
NCBI nr blastp	gi\|42539171	0.0	76.72%	RNA helicase [Choristoneura fumiferana]
NCBI nr blastx	gi\|42539171	0.0	77.25%	RNA helicase [Choristoneura fumiferana]

Group
Gene Ontology	GO:0005524	8.6e-40	ATP binding
	GO:0008026	8.6e-40	ATP-dependent helicase activity
	GO:0003676	8.6e-40	nucleic acid binding
	GO:0004386	1.3e-20	helicase activity
KEGG pathway	dpo:Dpse_GA14086	4e-162
	K01509 (E3.6.1.3)	maps->	Purine metabolism
InterPro domain	[26-232] IPR014001	3e-41	DEAD-like helicase
	[32-202] IPR011545	8.6e-40	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[269-381] IPR001650	1.3e-20	Helicase, C-terminal
Orthology group	MCL12302		Single-copy universal gene

Nucleotide sequence:

>DPOGS201182-TA
ATGAGTGAAGACAAAAAGGTTATGTTCCATGAAATGGAACTGGATGATCGATTATTAAAGGCTATATCTCAGTTGGGATGGCCTCACCCGACACTGATACAAGAAACGGCTATCCCATTGTTATTAGAGGGCAAAGATGTACTCATGAGAGCCAGGACGGGATCAGGCAAGACAGCAGCTTTCACAATACCTGTCATACAAAAGATTTTGAATCTTAAAAATACCAGTGCACACCAATGTATAAGAGCCCTTATATTATCTCCAAGTAAGGAGCTGTGCGGACAGATAACTTCTGTGGTTGGTCATTTAACACTGAAATGTGCAAGAGAAGTCCGTTGTATAGACATTTCCTCCAACGGTGACATGCAGATACAGAAGTCTTTACTGGCTGACAAGCCTGATATAGTAGTGTCCACACCATCACGAGTATTGGCCCACTTGAAGGCTAATAATGTAAGGTTGAAGGAGGATATAGCCATGTTGGTTGTGGATGAAGCCGATTTGGTATTCTCATTTGGTTATGAAAACGAAATTAAGGAACTTCTTGAACATTTGCCGAAGATATATCAAGCTGTTCTAGCCTCAGCTACACTTTCCGACGATGTTTTAAGTCTGAAAAAGATAGTCCTCAGAAATCCGGTGACATTAAAGCTCGAAGAACCAGAGCTGGCACCGTCTACACAATTACAGCATTATCATTTGTTTGCCGAAGAAGATGATAAAGCGGCCATACTCTATGCATTGCTGAAATTAAATCTCATCAGAGGAAAGACCATCATATTTGTTAGGACGGTTGACCGATGTTACAAATTGAAGTTATACTTGGAGCAGTTTAAAATCGGCTCATGTGTACTGAATTCTGAGTTGCCGGCGGCTGTGCGGTGTATGTCTGTGGAGCAGTTTAACAGAGGTCGGTACCAGATTATCGTGGCCTCTGACGAGAAGGCTTTGGAGGAACCGGACGGGGGCATGATGCTGGAGGAGACGGGCAAGAAGAAGCAAAAATCAAAACGTAGGAAAGACAAGGAGTCGGGCGTGTCCCGGGGCATCGATTTCCAGCATGTGTCTAACGTTATAAACTTCGACTTCCCCCTGGATGTGACGGCCTACGTGCATCGCGCGGGCCGGACGGCTAGAGGGACTAGTCAGGGCTCCGTGCTGTCGTTTGTGTCCATCAGAGAGAAACCGCTCATGAATGCTGTGAAAGAACATCTAACTAAATGTTTCAATGGGCAGAAAGTTTTACAGAAGTATTCTTTCGCGTTGGACGAGGTGGAGGGTTTCCGGTACCGGTCACGGGACGCGTGGCGCGCCGTCACACGGGTGGCCGTCAGGGAGGCGAGGCTGAGCGAGATCAGGAGGGAGCTGCTCAACTGCAAGAGACTACAGGGCTACTTCGAGGAGAACCCCACAGACCTGGCCGCCTTGAAGCGCGATAAGGCCCTTCACACCGTGCGCCTGCAGCCGCAGCTGGCTCACGTGCCGGAGTACCTCCTGCCGGCCGCGCTCCGGACGGACGGCCCCGAGCCCGAGCCGGCGGCGCCGGACGCGCCCCCCGCCAAGAAAAAGAAGCAGCAGAACTTCGGCAGCGTGAAGAGACATAAGTACCAAGCCCGGCAGCGAGATCCCCTCAAGAGCTTCGCGGTGAAGGCTGCCAGCGCGTCGCCGTCCAAGACCTAG

Protein sequence:

>DPOGS201182-PA
MSEDKKVMFHEMELDDRLLKAISQLGWPHPTLIQETAIPLLLEGKDVLMRARTGSGKTAAFTIPVIQKILNLKNTSAHQCIRALILSPSKELCGQITSVVGHLTLKCAREVRCIDISSNGDMQIQKSLLADKPDIVVSTPSRVLAHLKANNVRLKEDIAMLVVDEADLVFSFGYENEIKELLEHLPKIYQAVLASATLSDDVLSLKKIVLRNPVTLKLEEPELAPSTQLQHYHLFAEEDDKAAILYALLKLNLIRGKTIIFVRTVDRCYKLKLYLEQFKIGSCVLNSELPAAVRCMSVEQFNRGRYQIIVASDEKALEEPDGGMMLEETGKKKQKSKRRKDKESGVSRGIDFQHVSNVINFDFPLDVTAYVHRAGRTARGTSQGSVLSFVSIREKPLMNAVKEHLTKCFNGQKVLQKYSFALDEVEGFRYRSRDAWRAVTRVAVREARLSEIRRELLNCKRLQGYFEENPTDLAALKRDKALHTVRLQPQLAHVPEYLLPAALRTDGPEPEPAAPDAPPAKKKKQQNFGSVKRHKYQARQRDPLKSFAVKAASASPSKT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: