MonarchBase - Protein-coding gene

DPOGS200681
Transcript	DPOGS200681-TA	2979 bp
Protein	DPOGS200681-PA	992 aa
Genomic position	DPSCF300353 - 129801-141601
RNAseq coverage	1082x (Rank: top 12%)

Annotation
*Heliconius*	HMEL017791	91.09%
*Bombyx*	BGIBMGA008914-TA	90.04%
*Drosophila*	CG6227-PA	77.72%
EBI UniRef50	UniRef50_Q7QE45	66.81%	AGAP010656-PA (Fragment) n=1 Tax=Anopheles gambiae RepID=Q7QE45_ANOGA
NCBI RefSeq	XP_001603634.1	70.32%	PREDICTED: similar to ENSANGP00000016791 [Nasonia vitripennis]
NCBI nr blastp	gi\|49072840	92.20%	DEAD box RNA helicase [Choristoneura fumiferana]
NCBI nr blastx	gi\|49072840	80.95%	DEAD box RNA helicase [Choristoneura fumiferana]

Group
Gene Ontology	GO:0005524	2.6e-49	ATP binding
	GO:0008026	2.6e-49	ATP-dependent helicase activity
	GO:0003676	2.6e-49	nucleic acid binding
	GO:0004386	1.4e-28	helicase activity
KEGG pathway	nvi:100119942	0.0
	K12811 (DDX46, PRP5)	maps->	Spliceosome
InterPro domain	[353-558] IPR014001	1.2e-66	DEAD-like helicase
	[358-531] IPR011545	2.6e-49	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[595-676] IPR001650	1.4e-28	Helicase, C-terminal
Orthology group	MCL13845		Single-copy universal gene

Nucleotide sequence:

>DPOGS200681-TA
ATGGTTAGGAGTGGTCGTGACAGGGAGAGGGATCGTAGACGCTCACATAGTCGTTCGGCAAGTCCGGATAGAAAAAGAAGACGTTCTAGGTCTAGAAGTAGAGATAGAAATTCCAAATCCTCTAAGAGGAAGCGTAGCCGCAGCAGAGATAGAGATTCCAAGCGCGATCGCAGTAGAGACAGAGAGAGGGATCGTAAAAGTGATAAACGAGATGATAAGAGAAATGGTGCAAGTAGTAAGTCTAGAAAGAAATCTCCAGATAGGGAAAAGGAAAGAGATCGCTCCAAGTCAAAAGAGAAGGCGGTTAAATCTGAATCCGCTGATTATGCTCCTGGTACAGTAGATAAGGAAGAGGAACAAAGTAGATTGGAAGCGGAAATGCAAAAACGCCGCGAACGTATTGAGCGTTGGAGAGCTGAAAGGAAACGTAAAGAATTGGAATCAGCTAAAAAGGAAGTCCAGAAAGGCAGTATTGTGACCAATATACAGGTTCCGGCTGCTAAAAAGTGGTCTTTAGAAGATGATTCTGGAGACGTTGTTGAGGAAAAAATTGATGAAGAAGATGAAATTGATCCTTTGGATGCCTATATGCAAGAAGTTCAACAGGAAGTGCGCAAAGTGAATCAACTAGACCAAGCCCGTGGCATCAGCGTCCCAACAACAGGCGGCACAGGAGTTGTCATACTGACCGGAACGGCTAAGAAAAAAGTTACCGAACAGAAAAATAAAGGGGAGCTCATAGAGCAAAATCAAGATGGCTTAGAATATTCGTCGGAGGAAGAGACAGAAGATATAAAGGATGCAGCGGCTAATCTGGCATCTAAACAAAGAAAGGAATTAGCTAAAGTCGATCATGCCAGTTTGGATTATATGTCATTTAGAAAAGCATTTTATACTGAGGTTAGTGAGCTTGCCAGAATGACGCCAGAAGAAGTTGAGGCATACAGAACAGAGTTAGAGGGTATTAGGGTGAAGGGTAAGGGTTGTCCAAAGCCTATAAAAAATTGGGCTCACTGTGGCATAAGTAAAAAGGAACTTGATATACTGAAGAAATTGGGCTTTGAAAAACCTACCCCGATTCAGGCTCAGGCTATACCGGCCATAATGTCTGGAAGAGACCTGATTGGTATAGCAAAAACTGGTTCCGGTAAAACATTAGCATTCATATTGCCTATGTTCAGACATGTTCTCGACCAACCGCAGTTAGAAGACACAGATGGACCAATATCACTCATAATGACCCCAACGAGGGAACTTTGTATGCAGATAGGCAAAGATATTAAGAAGTTTGCCAAGTCTTTGGGCTTGAGAGTTGTCTGTGTGTATGGCGGAACTGGGATATCTGAACAGATAGCCGAGCTGAAACGCGGTGCTGAGATGATAGTCTGTACTCCTGGCCGTATGATCGATATGTTAGCAGCTAATTCCGGACGTGTGACTAATCTGAGACGAGTTACATACATTGTTCTTGACGAAGCTGACCGGATGTTTGATATGGGTTTCGAGCCGCAGGTTATGAAGATAATAGACAACGTGCGACCAGACAGACAGACGGTCATGTTCAGTGCGACGTTCCCGAGGCAGATGGAAGCCTTAGCCAGGCGTATATTACAAAAACCTATCGAAGTACAGGTTGGAGGTAGGAGTGTTGTATGTAAGGACGTGGAACAACATGTAGCTATACTAGAAGAGGAAGCAAAGTTCTTCAAATTACTGGAACTGTTGGGCCTGTACAGCCAGCTGGGGAGCATCATAGTGTTCGTCGATAAGCAGGAGAACGCGGACAGCTTGCTGAAAGATCTTATGAAGGCATCTTACTCTTGTATGAGTCTGCATGGAGGTATTGATCAATTCGACAGGGACTCGACTATAGTAGACTTCAAGAACGGCAAGGTGAAGCTGCTGGTGGCGACCAGCGTGGCTGCCAGGGGTCTGGACGTCAAACAGCTGGTGTTGGTGGTCAACTACGACTGTCCTAACCATTACGAGGATTATGTACATCGATGCGGTCGTACCGGTCGCGCGGGTAACAAGGGCTATGCCTGGACATTCCTCACGCCGGAGCAGGGCCGATACGCGGGGGACGTGTTGCGAGCCCTCGAAGCCGCTGGGGCTTCTCCCCCGGCCGAACTCAGGGCTCTGTGGGATAAGTACAAAGAGGCGCAGGAGAGGGACGGAAAAAAAGTTCACACAGGCGGTGGCTTCAGTGGCAAAGGTTTCAAATTCGACGAATCCGAAGCCCAAGCGGCGACTGAGAGGAAAAAGTACCAAAAGGCCGCTCTCGGCCTCCAAGACTCGGACGACGAGGACGTTGAGGGCGACCTCGACCAGCAGATAGAGGTCATGCTTGCCGCTAAGAAAATTGTCAAAGAAATTAAGCCGGGTGTAGCGACGGCTAATCCCCCAGCGGCAGCGGGGGCGAGTGTAGACGGGAAACTTGAACTGGCGAGACGGCTGGCCTCCAGAATAAACCTGGCCAAGGGCTTAGGCGTCGAACAGAAGGGAGCCACGCAACAAGCGGCCGAGGCCATACTTAAAGGGAACCCGTCTGCACACACCCTTATCACGGCCAAGACTGTAGCTGAACAGTTGGCGGCCAAGTTGAACACTCGCCTGAACTACCAGCCTCGCGACGAGAGCACGGCTGAACCGGCCGAGGAGGTGTTCAGGAAGTACGAGACGGAGCTCGAGATAAACGACTTCCCTCAGCAGGCCAGGTGGAGGGTCACCAGCAAGGAGGCGCTAGCGTTGATCAGTGAATATTCGGAGGCTGGTATCACAGTCAGGGGGACGTATGTACCCCCAGGGAAAGCTCCACCGGAAGGAGAGAGGAAACTGTACCTGGCCATCGAAAGTTCCCAAGAGCTGGCTGTAGCTAAAGCGAAGTCAGAAATAACAAGGCTGATTAAAGAAGAGCTCCTCAAGCTACAGACGTCAGCTCATCACATGATTAACAAAGCTAGATATAAGGTCCTCTGA

Protein sequence:

>DPOGS200681-PA
MVRSGRDRERDRRRSHSRSASPDRKRRRSRSRSRDRNSKSSKRKRSRSRDRDSKRDRSRDRERDRKSDKRDDKRNGASSKSRKKSPDREKERDRSKSKEKAVKSESADYAPGTVDKEEEQSRLEAEMQKRRERIERWRAERKRKELESAKKEVQKGSIVTNIQVPAAKKWSLEDDSGDVVEEKIDEEDEIDPLDAYMQEVQQEVRKVNQLDQARGISVPTTGGTGVVILTGTAKKKVTEQKNKGELIEQNQDGLEYSSEEETEDIKDAAANLASKQRKELAKVDHASLDYMSFRKAFYTEVSELARMTPEEVEAYRTELEGIRVKGKGCPKPIKNWAHCGISKKELDILKKLGFEKPTPIQAQAIPAIMSGRDLIGIAKTGSGKTLAFILPMFRHVLDQPQLEDTDGPISLIMTPTRELCMQIGKDIKKFAKSLGLRVVCVYGGTGISEQIAELKRGAEMIVCTPGRMIDMLAANSGRVTNLRRVTYIVLDEADRMFDMGFEPQVMKIIDNVRPDRQTVMFSATFPRQMEALARRILQKPIEVQVGGRSVVCKDVEQHVAILEEEAKFFKLLELLGLYSQLGSIIVFVDKQENADSLLKDLMKASYSCMSLHGGIDQFDRDSTIVDFKNGKVKLLVATSVAARGLDVKQLVLVVNYDCPNHYEDYVHRCGRTGRAGNKGYAWTFLTPEQGRYAGDVLRALEAAGASPPAELRALWDKYKEAQERDGKKVHTGGGFSGKGFKFDESEAQAATERKKYQKAALGLQDSDDEDVEGDLDQQIEVMLAAKKIVKEIKPGVATANPPAAAGASVDGKLELARRLASRINLAKGLGVEQKGATQQAAEAILKGNPSAHTLITAKTVAEQLAAKLNTRLNYQPRDESTAEPAEEVFRKYETELEINDFPQQARWRVTSKEALALISEYSEAGITVRGTYVPPGKAPPEGERKLYLAIESSQELAVAKAKSEITRLIKEELLKLQTSAHHMINKARYKVL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: