MonarchBase - Protein-coding gene

DPOGS200424
Transcript	DPOGS200424-TA	3066 bp
Protein	DPOGS200424-PA	1021 aa
Genomic position	DPSCF300236 - 89527-94936
RNAseq coverage	150x (Rank: top 53%)

Annotation
*Heliconius*	HMEL002498	0.0	64.73%
*Bombyx*	BGIBMGA008997-TA	0.0	63.27%
*Drosophila*	CG9323-PA	9e-164	36.64%
EBI UniRef50	UniRef50_E2BMJ4	0.0	39.30%	Probable ATP-dependent RNA helicase DHX36 n=9 Tax=Formicidae RepID=E2BMJ4_HARSA
NCBI RefSeq	XP_394965.3	0.0	38.22%	PREDICTED: similar to DEAH (Asp-Glu-Ala-His) box polypeptide 36 [Apis mellifera]
NCBI nr blastp	gi\|307169079	0.0	40.24%	Probable ATP-dependent RNA helicase DHX36 [Camponotus floridanus]
NCBI nr blastx	gi\|307169079	0.0	39.78%	Probable ATP-dependent RNA helicase DHX36 [Camponotus floridanus]

Group
Gene Ontology	GO:0005524	5e-17	ATP binding
	GO:0004386	5e-17	helicase activity
	GO:0003676	5e-17	nucleic acid binding
	GO:0008026	6.9e-09	ATP-dependent helicase activity
KEGG pathway
InterPro domain	[199-389] IPR014001	1e-24	DEAD-like helicase
	[500-599] IPR001650	5e-17	Helicase, C-terminal
	[661-752] IPR007502	1.9e-15	Helicase-associated domain
	[789-921] IPR011709	4.4e-09	Domain of unknown function DUF1605
	[209-365] IPR011545	6.9e-09	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
Orthology group	MCL15106		Single-copy universal gene

Nucleotide sequence:

>DPOGS200424-TA
ATGTCTCGCGATTTCCAAAACTTTAGCCGACCCCGTGGTAGAGGTAGAAATTGGGATCAATCCCAACGAAATCATCGAACAAGACCTCCAGGACTTCGCGGAGCCGAAATTGGTTTATATTACAAAGAACTCAGCATGAAAAAAAAGAAAAAAGAGCCCGTGATAAATCTCAAAATCCCTTACTCAGTTCTCAAAGCATTAGAAAATGAATTAATAGCCATAAGGAAAATTGCTAGTACACAAAATATCACGTTACCAACAAAATTAACACAGAAATGTGAAAAAGAACAAGGTGAATATAATTTAACTAGTAAACCTGGAGTTTCAAGTAGAGAAAATTTTATGGACACCAATACCAAGGATAAATGTGACTCTAACTCTGGACAAAAACAGCAGTCTACCAGGATGTATGATTATAAATATGGATATGAAGATATCATAACAGGCTCATTTGATGAAAAACTCGACCAATGCATTACAAAAGGTATTACTATAAATACATGTGATGATGAGGTAGAAAGTTTAAATGAAGCATTCTTTATTGAGTATGAGGATATGTTGGAGAGGAATACTTATAAAAATATGTTGAAATTCCGCAAGAAATTACCAGCATACATAAAAGCCAAAGAATTGATTAAATCAATAAACGACAACCAAGTAATTGTTATTAGTGGAGAGACTGGTTGTGGAAAGTCAACTCAAGTACCACAAATCATCTTAGATCATGCTATTTGTAGCAAAAAAGGTGCCCATACTAAGATTTTGGTCACCCAACCGAGAAGAATTGCCGCCTCCTCACTGGCTATCCGAGTGGCTAAAGAAAGGGCAGAAAAGCTGGGCAATTCAGTGGGTTATGCTGTGAGATTAGAAAAGGTTGACGAGAGGTCTCGGGGGAGTATACAGTATTGTACAACTGGTATACTTTTGGCTGAACTGGAAGTAAACCAGGGTCTAACCAACTATAGTCACGTTATATTGGATGAAGTACACGAAAGAGATGTTCATGTTGATTTATCTATGTGCATGTTGCGAAAGGTTTTAAGAAAACGTAAAAATCTTAAACTAATTCTTATGAGTGCTACATTGGATGCTGAGAGCTTATCAGCTTACTTTGACAACTGCCCTCTAATGCACATCGAAGGACTGGCATATCCAGTACAAGATGTATATCTAGAGGATATATTGAATTTAACAAACTTCACACTACCCACCGAAAGACCGAAAGCACCGCAGGCTAAGTGGATGAAGTATAGAAAAAAAAATGTTTCAGATGCCATGGAAACAGACATCCAATACAGAGCTGAAATTGGCAACTGGCTGGAATCAAAGAAGAAAAATCTTAGTCTTCAAACATATAAAACTCTGCAAGACAGTAGAATTGAGGAGCTAAGTTTTGAATTGCTAGTTGATCTTTTGATCTACATCTGCAAGGGTGAACCTGGCGCAATACTAGTGTTTCTACCTGGCATCGGCGATATTACAAAACTGATGCGAATGATGGAATCCACAAATTTATTCCCAGCTAACAAATACGAAATTTATCCTCTGCATTCAAGGTTGCCAACATTAGAACAACATAAAATATTTGAAAGGCCACCAGATAATATTAGGAAAATAATAATAGCGACTAATATAGCTGAAACATCCATAACCATAGATGATGTTGTGTATGTAGTGGATTCAGCCAGGATAAAAATGAAAGGGCTGAATGTTGAGATGAATCTATCAACGTTGCAGACAGAATGGGTGTCTCAAGCAAATTTGCGACAACGGCGTGGGCGCGCTGGTAGATGTCAGCCAGGTATATGCTACCATTTGTTAACTTCATTCAGAGCTGAAAAACTAGAAGAACGTACACTACCGGAGTTACAAAGGAGTGATCTTTTGGAGCCGGTGCTCATGATTAAGAGGCTCCGCTTGGGTTTGGCTGAAGATGCACTGAAGATGGTGCCATCGCCACCAGCAGATTCAACAATACAATCAGCAGTGAAACATTTGCAAAGGTGTGGGGCCCTCAATACAGTGGAAACTCTTACTCCTTTGGGCTGGCACCTGGCACGTCTTCCAGTTCATCCAGCTGCTGGCAAACTGCTTGTTCTGGGAGCTCTTGCCGGATGCCTCGACAGGGCTGCGAGCCTCGCAGCCGTCTGGGGCTTCAAAGAACCCTTTCAGATGGTTATTGGTAAAGAGTACGAAGTGGATATGGCGAAGCGTGAATTCGCGATGGGCGAACCCAGCGACCATATCGCAGCTTCGGAAGCGATAATTCAATGGGAAAACTGTCCAAGAAGAGAGAGGTCATCATTTGCGTATAGGAACTTCCTGTCGAACAATACTTTGGAATTGCTTGTCGGTATGAAAAATCAGTTCGGGGACAACTTGAGACAGATGGGCTTCCTACGTTCCGGTAACGTCAGGTCTAAATGGGAAAATAGAAATGCAGATAACCTGAGCCTGTTCAAGGCTATCGTTGCTGCATCCCTGTATCCGAACATCGCTACAGTCAGATGGACCAATCTAAATAATTTCCGGAAGCAGCAAAGGATTTCAGCGTATACTCCAGAGGATGGGCGACTAGTTATACACCCGAGTAGCGTCATGGCGCCGCCAAAGAAAGGTCAAAACAGGGGCAAAGGCCCGTGTCCCTCGCAGCTGTGTAATAACCCTGGCGCCAACTGGCTCGTGTATTGGCTTAAGCAGAGATCGTCCGATCTCTTCCTACTTGACGTCACCTTAATTTACACGTTGCCTCTACTATTCTTTGGTGAATTCCAAATAACTGATGATGTAGAAAACCCGGAGAAGTGTTTTGTGACGATATCAAACATCAAAGTATGTTGTAAAAGAGAATGCACTGACAAACTCCTCGAGCTAAGATATCTGTTGGATAAGGTTTTGGAGGCGAAGGTCAATGACTCCAATGCTGCATCCAGTAACAGTGAATTTGAAGAATCTGTTTTGAAAACCGTTATTCAACTCATCACAGCAGAAGACGAGCAAGCTGAATATTTAGGACACGAGTTTTCTGATTCCGATGCTTCGACTACCGATGATAGAAATTATTAA

Protein sequence:

>DPOGS200424-PA
MSRDFQNFSRPRGRGRNWDQSQRNHRTRPPGLRGAEIGLYYKELSMKKKKKEPVINLKIPYSVLKALENELIAIRKIASTQNITLPTKLTQKCEKEQGEYNLTSKPGVSSRENFMDTNTKDKCDSNSGQKQQSTRMYDYKYGYEDIITGSFDEKLDQCITKGITINTCDDEVESLNEAFFIEYEDMLERNTYKNMLKFRKKLPAYIKAKELIKSINDNQVIVISGETGCGKSTQVPQIILDHAICSKKGAHTKILVTQPRRIAASSLAIRVAKERAEKLGNSVGYAVRLEKVDERSRGSIQYCTTGILLAELEVNQGLTNYSHVILDEVHERDVHVDLSMCMLRKVLRKRKNLKLILMSATLDAESLSAYFDNCPLMHIEGLAYPVQDVYLEDILNLTNFTLPTERPKAPQAKWMKYRKKNVSDAMETDIQYRAEIGNWLESKKKNLSLQTYKTLQDSRIEELSFELLVDLLIYICKGEPGAILVFLPGIGDITKLMRMMESTNLFPANKYEIYPLHSRLPTLEQHKIFERPPDNIRKIIIATNIAETSITIDDVVYVVDSARIKMKGLNVEMNLSTLQTEWVSQANLRQRRGRAGRCQPGICYHLLTSFRAEKLEERTLPELQRSDLLEPVLMIKRLRLGLAEDALKMVPSPPADSTIQSAVKHLQRCGALNTVETLTPLGWHLARLPVHPAAGKLLVLGALAGCLDRAASLAAVWGFKEPFQMVIGKEYEVDMAKREFAMGEPSDHIAASEAIIQWENCPRRERSSFAYRNFLSNNTLELLVGMKNQFGDNLRQMGFLRSGNVRSKWENRNADNLSLFKAIVAASLYPNIATVRWTNLNNFRKQQRISAYTPEDGRLVIHPSSVMAPPKKGQNRGKGPCPSQLCNNPGANWLVYWLKQRSSDLFLLDVTLIYTLPLLFFGEFQITDDVENPEKCFVTISNIKVCCKRECTDKLLELRYLLDKVLEAKVNDSNAASSNSEFEESVLKTVIQLITAEDEQAEYLGHEFSDSDASTTDDRNY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: