MonarchBase - Protein-coding gene

DPOGS211231
Transcript	DPOGS211231-TA	3759 bp
Protein	DPOGS211231-PA	1252 aa
Genomic position	DPSCF300385 - 91027-100524
RNAseq coverage	219x (Rank: top 45%)

Annotation
*Heliconius*	HMEL003445	83.92%
*Bombyx*	BGIBMGA005168-TA	80.78%
*Drosophila*	tst-PA	48.87%
EBI UniRef50	UniRef50_Q7QBG5	49.08%	AGAP003182-PA n=10 Tax=Opisthokonta RepID=Q7QBG5_ANOGA
NCBI RefSeq	XP_002013687.1	49.52%	GL24270 [Drosophila persimilis]
NCBI nr blastp	gi\|270010333	48.42%	hypothetical protein TcasGA2_TC009717, partial [Tribolium castaneum]
NCBI nr blastx	gi\|270010333	48.59%	hypothetical protein TcasGA2_TC009717, partial [Tribolium castaneum]

Group
Gene Ontology	GO:0016817	0	hydrolase activity, acting on acid anhydrides
	GO:0005524	2.2e-51	ATP binding
	GO:0016818	2.2e-51	hydrolase activity, acting on acid anhydrides, in phosphorus-containing anhydrides
	GO:0008026	6e-21	ATP-dependent helicase activity
	GO:0003676	6e-21	nucleic acid binding
	GO:0004386	1.7e-18	helicase activity
KEGG pathway	dpe:Dper_GL24270	0.0
	K12599 (SKI2, SKIV2L)	maps->	RNA degradation
InterPro domain	[1-1244] IPR016438	0	RNA helicase, ATP-dependent, SK12/DOB1
	[1068-1244] IPR012961	2.2e-51	DSH, C-terminal
	[303-482] IPR014001	1.2e-28	DEAD-like helicase
	[310-456] IPR011545	6e-21	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[618-704] IPR001650	1.7e-18	Helicase, C-terminal
Orthology group	MCL10551		Single-copy universal gene

Nucleotide sequence:

>DPOGS211231-TA
ATGTCTTTAAAATATGATGAGAAATTATTTTCAGACATAAAGCCACCACCGATTTTTGAAGATTTAAGTGAAAGCATAAAAGATTATCTCTTGAAACCGGAGAAACTATCAATTCATAAATGGGAGAGATCACAAACACATTGGCACAGAAAATCGGATATAGATTCTTTGTTCAAAAGCGATGATGAAGAACTAGGTATTGATACCACACTCGAAGTTGTTCGAGATCCTAGAACAGGGGAAATTATAGGTCTGGAAGAGATAAATATACCAGTTCAAGATGACGAAGATAATCTATCCATGTCTCGGGCTCCATTGCCTCCTAACTTGGCTACTAGAGGCACAACTACTCAAAATCCTTTTTTACCAGCTGGTTTTGAGGAGGAACTGCAAAAGATGTTGGATGAGGCGGCACAGAGTTCCGAAATTGAAATTAATTTTGAAGATGATGAGCCTGGAAAATTTCTAGGAGAAGACATTTTATCAACAGCGCCAGGTTCAAAGGAGGCTGTTTTGTTTGCTGAAGACGGAATGACTTTACTTGATCATCAGAAAGATGTACAAGAGGATAAAACTCAAGAACTGGATCTCAAGATAGATATTGATTTGGAAGAAGTGGTTGATAATAATGCACACTTAGTTGGTCTCTGGAAAGATGACGAAAATGAGAAAAATGAGGTCTCGAAACCGATTAAGAAGATACAAATCGAAAAAGACAAGGAAGAAGATAATTTCTTAGAGAGCACCATCATCAGACCACCCGTAGAACTTCCCGAGATACCAATATTAAACATAACAAACTCTGCCGTGAAGCTCGGAGTCACATCTACCGAGTGGGCCGAAATGATTGATGTATCCCTACCGGTGCCAGATTTTAAAGAAAAAATAAAAGACATGGCACATTCATATCCATTTGAATTGGACAGCTTCCAGAAACAGGCTATACTTAAATTAGAAGAAGGCCATCATGTATTTGTAGCTGCCCATACATCTGCCGGGAAGACAGTTGTAGCCGAGTATGCTATAGCCATGTCAAGAAGAAATTGTACCAGAGCAATCTACACATCACCAATCAAAGCCCTATCAAACCAGAAGTACAATGATTTTAATAAAATGTTTGGTGAAGTTGGTCTCCTGACTGGAGACCTTCAGATCAACGCTACAGCCTCCTGCCTCGTGATGACCACTGAGATACTAAGGTCCATGTTGTACTGCGGCTCTGACGTCACCAGGGACCTAGAATTCGTTATATTCGATGAGGTCCACTACATTAATAATACTGAGCGTGGCTATGTTTGGGAGGAGGTTCTAATTCTTCTTCCTGCCCACGTCAGTATAGTGATGTTGAGCGCGACTGTACCCAACACTCTACAGTTCGCTGACTGGGTGGGTCGTACTAAGAAGAGGAAAGTCTATGTCGTGTCTACGCCTAAGAGACCTGTACCTTTGTGCCATTATTTATATACAGGGTCGGGAGGTAAATCGAAAAATGAAAGATTTCTGGTCGTCGATCAAGAGGGTGCCTTTCAGTTGCGCGGTTACAATGAAGCTGCTGCCGCTAAGAAGGCGAGAGAGAACGAATATAAGAAGAGTTTTGGCCCGAAAGGTGGAAAACAATTCGGGAATCCTAAAGCCGAACAAACCATGTGGGTAGCGTTCATAGATCACCTGAGGAGCTGCGATAAGTTGCCCGTCGTGGCTTTTACCTTGTCGAGAAATCGGTGTGATCAGAATGCTGAAAATTTGATGTCAGTAGATTTAACAACGGCCAAAGAGAAAAGTCACATCAAATCATTCTTCATGAGATGTCTTCAGAGGTTGAAGGAGCCTGATAGAAAGCTTCCACAGGTGATACGTCTCCAAAGAGTATTGGAGAACGGTATCGGGGTACATCACAGCGGTATATTGCCTTTGCTTAAAGAAATCGTCGAAATGCTCTTCCAGTCCGGTCACGTGAAAATTCTTTTTGCGACGGAGACGTTCGCTATGGGCGTCAACATGCCAGCGCGTACTGTAGTCTTCGATGATATCACCAAGTTCGACGGCATACAGTCCAGGAGCCTCGCGCCAGCTGAGTACATACAGATGGCGGGCAGGGCAGGGAGGCGAGGTTTGGACGATACAGGCACAGTGATAATCCTCTGCAAAGAAGGCGTTCCAGATCAAGTGACGCTTAAAGGAATGATGTTGGGAACTCCACAGAAGCTGTCATCGCAGTTCAGGCTGACATACGCCATGATACTCAGTTTATTGCGTGTAGCAACAGTATCAGTGGAGGGTATGATGCAGAGATCCTTTAGAGAATTCCATCAGATCTGCCAAGCCGACAACAACAGGAAACAACTGCAATTAGCTGAAAAGGAATATTCAGAGAAATGTAGCACACCCCTGCCATCGCATTTGGCGCCGTTAGCCACTTTCTATGACATAGCCATACAATATATAGACGTTTTAAATGATATCATGCCAATATTACTGAACCAATCTAAAGTTGTTAAGGAATTCGTGCCAGGCAAGGTTCTCATAATATCCGCCGGACCGTTCATAAATCAATTGGGTGTCTACTTGAACAACAGCGGTCCCAGGCAAACCCCATACAAGGTACTAGTTTTAAACACAGCTGAACAAGATACAGCTAGATACAACTTTGATGTGGACGAAAATTGGTACAGGATGTTGGGCTTCTCTAAACTCTATGAAAACATAGGTACTGAAGAAAGTACAATGGATCATACAATACTGTGTATAGCGCCTAAGAATATTGTGGCTGTTACAAAAACTAATCTTAAAATTGATGCTAATCTCATCATAAGAGACTGGGAGCAAAGACAGATGCCTCGTTTCAAGGATGCTCCAGTAGGTGCCACCTGTGGGCGATCAGTGCAGGAGCTGTGCCAGTTATCTCACGCTTCACGCACTTCAACCGCCGGCCTGGAGACGCTCAGTCTCACACAGGCACTCGCCATCACCACTGGAGAGATACTACAGACACTAGACAAGATGAACAAATACAAATCCGAGCTCGAGGCACAGAAGAAATACACAGATATAGCGAACTTCAAGAGCGAATTCGCTGTTGTGTACGAACGGAAACAAGCTGAGAGGAAACGTGATAAGTACAAACGTCTTCTGTCCTTCGAAAATCTAGCTCTATATCCAGACTACCAGAGACGGTTGATGGTTCTACGAGAACTGAACTATATAGATGATCATGACAGCGTTATCTTAAAGGGTCGTGTTGCGTGCTGTATGGGCACTAACGAGCTTATCATATCAGAACTGGTGTTCCGGAATGTATTCACCGATAAAAATCCAGCGGAAATCGCGGCACTCCTCAGCTGTTTCGTGTTCCAAGCTAAGACTAGAGTGGAACCGGCTTTGACTGAGAAGTTACAGGCTGGTGTTAAGGCTATAGAACAGATTGATGATGAACTTACTAGGATCGAGGCTAAATATATGGTCGGACAATTCGAAGGTCAAGCAGAGAGATTAAACTTTGGTCTAGTGAGAGTTGTCTATGAATGGGCCCTAGAAAAACCGTTTGCAGAAATCATAGACTTGACAGATGTTCAAGAAGGTATTATTGTGAGATGCATCCAGCAACTTCATGAGCTCTTAGTTGATGTGAAAGACGCAGCAGTTGCAATTGGTGATCCAAAACTTCAAGCAAAAATGATGGAGGCTTCCACAGCTATAAAGAGGGACATAGTTTTTGCAGCAAGTTTATATACTACTCAGCGAGAGACAGTGATATTATGA

Protein sequence:

>DPOGS211231-PA
MSLKYDEKLFSDIKPPPIFEDLSESIKDYLLKPEKLSIHKWERSQTHWHRKSDIDSLFKSDDEELGIDTTLEVVRDPRTGEIIGLEEINIPVQDDEDNLSMSRAPLPPNLATRGTTTQNPFLPAGFEEELQKMLDEAAQSSEIEINFEDDEPGKFLGEDILSTAPGSKEAVLFAEDGMTLLDHQKDVQEDKTQELDLKIDIDLEEVVDNNAHLVGLWKDDENEKNEVSKPIKKIQIEKDKEEDNFLESTIIRPPVELPEIPILNITNSAVKLGVTSTEWAEMIDVSLPVPDFKEKIKDMAHSYPFELDSFQKQAILKLEEGHHVFVAAHTSAGKTVVAEYAIAMSRRNCTRAIYTSPIKALSNQKYNDFNKMFGEVGLLTGDLQINATASCLVMTTEILRSMLYCGSDVTRDLEFVIFDEVHYINNTERGYVWEEVLILLPAHVSIVMLSATVPNTLQFADWVGRTKKRKVYVVSTPKRPVPLCHYLYTGSGGKSKNERFLVVDQEGAFQLRGYNEAAAAKKARENEYKKSFGPKGGKQFGNPKAEQTMWVAFIDHLRSCDKLPVVAFTLSRNRCDQNAENLMSVDLTTAKEKSHIKSFFMRCLQRLKEPDRKLPQVIRLQRVLENGIGVHHSGILPLLKEIVEMLFQSGHVKILFATETFAMGVNMPARTVVFDDITKFDGIQSRSLAPAEYIQMAGRAGRRGLDDTGTVIILCKEGVPDQVTLKGMMLGTPQKLSSQFRLTYAMILSLLRVATVSVEGMMQRSFREFHQICQADNNRKQLQLAEKEYSEKCSTPLPSHLAPLATFYDIAIQYIDVLNDIMPILLNQSKVVKEFVPGKVLIISAGPFINQLGVYLNNSGPRQTPYKVLVLNTAEQDTARYNFDVDENWYRMLGFSKLYENIGTEESTMDHTILCIAPKNIVAVTKTNLKIDANLIIRDWEQRQMPRFKDAPVGATCGRSVQELCQLSHASRTSTAGLETLSLTQALAITTGEILQTLDKMNKYKSELEAQKKYTDIANFKSEFAVVYERKQAERKRDKYKRLLSFENLALYPDYQRRLMVLRELNYIDDHDSVILKGRVACCMGTNELIISELVFRNVFTDKNPAEIAALLSCFVFQAKTRVEPALTEKLQAGVKAIEQIDDELTRIEAKYMVGQFEGQAERLNFGLVRVVYEWALEKPFAEIIDLTDVQEGIIVRCIQQLHELLVDVKDAAVAIGDPKLQAKMMEASTAIKRDIVFAASLYTTQRETVIL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: