MonarchBase - Protein-coding gene

DPOGS204832
Transcript	DPOGS204832-TA	2412 bp
Protein	DPOGS204832-PA	803 aa
Genomic position	DPSCF300221 + 349730-359007
RNAseq coverage	152x (Rank: top 53%)

Annotation
*Heliconius*	HMEL014396	0.0	86.08%
*Bombyx*	BGIBMGA001572-TA	0.0	83.04%
*Drosophila*	CG32533-PA	4e-136	53.21%
EBI UniRef50	UniRef50_G6DDZ8	0.0	99.03%	ATP-dependent RNA helicase n=7 Tax=Endopterygota RepID=G6DDZ8_DANPL
NCBI RefSeq	XP_321806.4	2e-155	67.61%	AGAP001338-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158302196	4e-154	67.61%	AGAP001338-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|157117593	9e-148	67.18%	ATP-dependent RNA helicase [Aedes aegypti]

Group
Gene Ontology	GO:0005524	1e-15	ATP binding
	GO:0004386	1e-15	helicase activity
	GO:0003676	1e-15	nucleic acid binding
	GO:0008026	3.3e-05	ATP-dependent helicase activity
KEGG pathway	cim:CIMG_00743	4e-70
	K12818 (DHX8, PRP22)	maps->	Spliceosome
InterPro domain	[47-229] IPR014001	1.8e-22	DEAD-like helicase
	[287-384] IPR001650	1e-15	Helicase, C-terminal
	[452-566] IPR011709	1.9e-14	Domain of unknown function DUF1605
Orthology group	MCL11886		Single-copy universal gene

Nucleotide sequence:

>DPOGS204832-TA
ATGGATGTCTGTGATGAGAGAAACAACAAAAAGTTAAATAAAGATACTTTTGATATATTTCTTAATATAGTATCTATATATTTAGACTTTAAAAATAAAGAAAAATTTGATAGATTAAAAAATTACGTAAAGCTCAAAAGTGAATTACCAGTCGCTAAATACAGGAATGAAATAGTATCAGCAGTACAAAATGAAAGAGTGGTGATCGTAGCCGGAGACACAGGTTGCGGTAAATCAACACAAGTGCCACAATACTTACATGAAGCGGGATTTCAAAATATAGCTTGCACTCAACCTAGAAGAATCGCATGTATTTCACTGTCGAAGAGAGTGTCATATGAAATGCTAACCCAGTTTGATACTAAAGTTGGCTATCAGATCAGATTCGAGAAAAGCAAGACATCAGACACCAAAATATGCTTCATCACTGAAGGTTTGCTTCTGAGGCAGATGTCTTCAGATAATCTGCCCGAGTATGATGTTATTATTCTAGATGAGATACATGAACGTCACCTCATGGGTGATTTCCTACTGGGTGTACTTAAATGCCTCATCCACACAAGAACTGATATTAAACTCGTTCTCATGTCAGCGACTATTAATATAAAACTGTTCCAGGATTACTTTTCAGCCGAATCAGCTGTAGTTATACAGGTCCCCGGCAGACTCTTTTCGATAGAATTAAATTACAAACCTATACTCATAGAAGAAAAACCTTCTAGGCACGATAAATTAGATCCTCAGCCATACGTACAGATTATGCAGTTGATAGATAGCAAATATCCAAAGGAGGAAAGGGGTGACCTGTTGATATTTATGTCCGGTGTACAAGAAATAACGACAATATGCGACGCGGCGCAGCAATACGCGGAGAAAACAAAGAGTTGGATCGTACTTCCCTTGCACAGTGCGTTGTCACTTATTGAACAAGATAAGGTGTTCGACTATCCGCCAGATGGCGTTAGGAAATGTATAGTCTCAACGAACATAGCCGAAACATCTGTCACCATAGATGGCATAAGATTTGTCATTGACTCCGGGAAGGTTAAAGAGATGAGTTATGATTCGTCAACAAAAATGCAAAGGTTGAAAGAATTCTGGATTTCAAAGGCTAGCGCTGATCAGAGGAAGGGGAGAGCGGGCAGGACTGTTTCAACATATAAATTCAAATTGATGCTACATGGACAGTACAAACAGAAGGCTGCCGAGGATGCGAAGCGTCGTAAGCGTCTCAAGGTCGACACGTGGGAGATAGGTGATGAGGACGATGACGTCATCGATGTGAGAGACATAGAGTTCAGGATGACCAATGACGCTGCCAGGATACGAGCACTGATCAGCGGAGCAAGTACTAGCGGCGGACAGGATCTTGTTATGTTGAAGATCGTGTTATGCAGAGCTTTGTATCCGCAAATAGCTATCGCTGACGAATTCAATTACTGCAAGACAGAGCAGCTATATCACACCTGGAGCAAACCCTCCGTGTACCTTCACCCGACTTCATACTTCGGGAGATACCCTAAAGCACTACAGCTGACCGAGACGGACATACAGACGGCGCCGGGGTATAAGAGCAAGCTGCCGCTGTCAAATAAACACCAACTGTTGTGTTACTTGTCTCTGCTTGAAACCACGAAGCCCTACATAGTTAACTCTATGCGTATGCCGGCAGCGCAGACGTTGCTGCTTCTAGCACATTCCATAGACACAAACACAGGATTCACAAGGATAGTTTGTGACTCCTGGCTCCTCCTGGAATTCCCTTTCCCTGAATCGGGATGCCAATTGCTATATAGAGCATCCACGATAAGAAAGAAATGGGACGAACTGATTAATAGAAAACTTGCAGATGCAAACCCCAACAGGTCGGTGGAGGAGGAGCTCCAGAAGTCAAATCAAATGGGTTACGAGGAACTACAGCATGAGCTATCGTGTGAGATAAGTAAATATATGAACTGTGATGTGTCTTATACCCTCAAGAGGTTACTGCCGGGGGACTTGAAGGTACTGTACGATGGTGACACCCAGACGACTGTATCTCCTAACCCATTCGATCAAACCTATGTCTGCCGACCCCATGATAAGAAGGGCGGGGTTTATGTCACTGATAATATTGTATACAATTGTATTGTAGATTCAGAGTGGAGCTATGATAGTTATCAGGAAACCTACAGCATACCGTGGGTTTGTCCGCAGTGCGAGGTGACTGTCTGTCTGTCACCTTTAGAAAGATTACAGCATAGGATATTCACTTGCTCATCAAAAACTGAGAAGAAACTAGAGAAGACAGTTACACGCATTAACAGACCCAATACTAAAGAATTTATTTGTGATGTTTGCAATACAACGATGTCCCTAACGCCCGTTGAAATATTGAAACATAAGAAGGCTTGTAAAATAAAGGAGCAATGA

Protein sequence:

>DPOGS204832-PA
MDVCDERNNKKLNKDTFDIFLNIVSIYLDFKNKEKFDRLKNYVKLKSELPVAKYRNEIVSAVQNERVVIVAGDTGCGKSTQVPQYLHEAGFQNIACTQPRRIACISLSKRVSYEMLTQFDTKVGYQIRFEKSKTSDTKICFITEGLLLRQMSSDNLPEYDVIILDEIHERHLMGDFLLGVLKCLIHTRTDIKLVLMSATINIKLFQDYFSAESAVVIQVPGRLFSIELNYKPILIEEKPSRHDKLDPQPYVQIMQLIDSKYPKEERGDLLIFMSGVQEITTICDAAQQYAEKTKSWIVLPLHSALSLIEQDKVFDYPPDGVRKCIVSTNIAETSVTIDGIRFVIDSGKVKEMSYDSSTKMQRLKEFWISKASADQRKGRAGRTVSTYKFKLMLHGQYKQKAAEDAKRRKRLKVDTWEIGDEDDDVIDVRDIEFRMTNDAARIRALISGASTSGGQDLVMLKIVLCRALYPQIAIADEFNYCKTEQLYHTWSKPSVYLHPTSYFGRYPKALQLTETDIQTAPGYKSKLPLSNKHQLLCYLSLLETTKPYIVNSMRMPAAQTLLLLAHSIDTNTGFTRIVCDSWLLLEFPFPESGCQLLYRASTIRKKWDELINRKLADANPNRSVEEELQKSNQMGYEELQHELSCEISKYMNCDVSYTLKRLLPGDLKVLYDGDTQTTVSPNPFDQTYVCRPHDKKGGVYVTDNIVYNCIVDSEWSYDSYQETYSIPWVCPQCEVTVCLSPLERLQHRIFTCSSKTEKKLEKTVTRINRPNTKEFICDVCNTTMSLTPVEILKHKKACKIKEQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: