MonarchBase - Protein-coding gene

DPOGS215771
Transcript	DPOGS215771-TA	3111 bp
Protein	DPOGS215771-PA	1036 aa
Genomic position	DPSCF300041 + 1631640-1638463
RNAseq coverage	1040x (Rank: top 12%)

Annotation
*Heliconius*	HMEL014101	71.80%
*Bombyx*	BGIBMGA003539-TA	86.17%
*Drosophila*	l(2)35Df-PA	68.24%
EBI UniRef50	UniRef50_Q9Y134	68.24%	L.2.35Df n=33 Tax=Eukaryota RepID=Q9Y134_DROME
NCBI RefSeq	XP_624031.1	71.23%	PREDICTED: similar to lethal (2) 35Df CG4152-PA [Apis mellifera]
NCBI nr blastp	gi\|328792378	71.23%	PREDICTED: superkiller viralicidic activity 2-like 2-like isoform 1 [Apis mellifera]
NCBI nr blastx	gi\|156553729	71.50%	PREDICTED: superkiller viralicidic activity 2-like 2-like isoform 1 [Nasonia vitripennis]

Group
Gene Ontology	GO:0016817	0	hydrolase activity, acting on acid anhydrides
	GO:0005524	2e-62	ATP binding
	GO:0016818	2e-62	hydrolase activity, acting on acid anhydrides, in phosphorus-containing anhydrides
	GO:0008026	9.6e-21	ATP-dependent helicase activity
	GO:0003676	9.6e-21	nucleic acid binding
	GO:0004386	5.4e-15	helicase activity
KEGG pathway	ame:551637	0.0
	K12598 (MTR4, SKIV2L2)	maps->	RNA degradation
InterPro domain	[1-1036] IPR016438	0	RNA helicase, ATP-dependent, SK12/DOB1
	[861-1036] IPR012961	2e-62	DSH, C-terminal
	[128-311] IPR014001	1.3e-34	DEAD-like helicase
	[134-280] IPR011545	9.6e-21	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[432-521] IPR001650	5.4e-15	Helicase, C-terminal
Orthology group	MCL13416		Single-copy universal gene

Nucleotide sequence:

>DPOGS215771-TA
ATGTCAGATATAAATAGTTTATTTGATTGCTTCGAAGAACCAGCTTTAAACGAAGCTGCCACCCAATTGCCAAATGTTAAAAGTGAAGAAGAAGCGCCTGTAACCAAGACGGAAGATGTTAAAAAAGAAGAAACTATAGAAGCTTCGCCCAGTAATAAGCGTCCACATGAAGAAGTTAAGTATGCAGATACTTCTAAGAAGCCCAGACAAGAAGAGGAAGACGACGCCGATATTATAAGCGACATTAACCTCAACAATCTTGGTGCAAGGATACTTATACACACTCTTGATACACACGAAGGCTGTACACATGAAGTGGCGATACCTCCCAATCAGGAATATGCTCAACTAATGCCAATTACTTCAGAACCAGCTAAGCAATACAGTTTTATCCTGGATCCGTTCCAAAAGGAAGCTATCATGTGCATTGACAACTTACAATCAGTACTTGTATCAGCACACACATCTGCCGGAAAGACTGTTGTTGCAGAATATGCTATAGCTCTGTCACTAAAAAACAAACAAAGGGTTATTTACACAACACCCATCAAGGCTCTCTCTAATCAGAAATACAGGGAATTCTCTGAGGAGTTTCATGATGTGGGTCTGATTACTGGAGATGTTACTATCAATCCATCCGCTTCCTGTTTGATAATGACAACTGAGATTCTAAGAAATATGTTATATAGAGGTTCAGAGATAATGAGGGAAGTTGGTTGGGTTGTGTTCGACGAGATTCATTACATGAGGGACAAGGAAAGAGGTGTTGTTTGGGAAGAAACACTTATCTTGCTACCCGACAATGTTCACTATGTATTTTTATCGGCTACTATACCCAATGCTCGTCAGTTTGCTGAGTGGGTGTGTCGACTTCACTCTCAGCCGTGTCATGTTATATACACTGAATACAGACCCACACCCCTCCAGCATTATATATTCCCTGCTAGCGGAGACGGGATTCATCTTGTTGTGGATGAAAAGGGTCAATTCAAAGAGGACAACTTCAATACAGCTATGACGGTGTTGAGTAACGCGGGCGGGGCGTCGGCGGGGGGTGAGCGCGGCCGGAGGGGGGGACTCAAGGGGGGGAGCAGTAGTATCTTTAATATAGTCAAAATGATCATGGAGAGAAACTTCGCACCGGTGATTATATTCAGTTTCAGTAAGAAAGACTGCGAGCTGTATGCTATGCAGATGGCTAAATTGGATTTTAATACAATTGAAGAGAAAAAACTTGTAGACGAGGTTTTCAACAACGCGATGGACGTTCTATCTGAAGACGATCGTAAGTTACCGCAGGTTGAAAACGTGATACCCTTGTTGAGGAGAGGCATCGGTATACATCACGGAGGACTGCTGCCCATACTGAAAGAAACCATAGAAATATTGTTCGGCCTGGGGCTTATCAAGGCGCTGTTCGCCACCGAGACCTTCGCCATGGGGCTCAACATGCCCGCTAGGACTGTTGTGTTCACAAATTGCCAGAAGTTTGACGGCAAGGACTTCAGATTTATAACTTCCGGTGAATACATCCAGATGTCAGGTAGAGCTGGTCGTCGAGGGTTGGACGATAAAGGTATCGTCATACTGATGATCGATCAGAAGGTTACTCCCAGTGTCGTTAAGTCCATGGTACAGGGCAAAGCTGATCCTATAAATTCCGCCTTCCATCTTACATACAACATGGTCCTGAATTTATTAAGAGTTGAAGAGATAAACCCGGAGTACATGTTGGAGAGGAGTTTTTATCAGTTCCAAAACCAAGCTGTTATCCCAGACCTCATCGACAAGGTGAAAGCTAAGCAAAAGGAATATAGCGCGTTGTCAATAGAGGAGGAGCACTCTATAGCTTCATACTGTAATATAAGGTCACAGTTGGAGCTGCTGGGGTCACAGTTCAGGTCGTTCATCACGAAGCCGGAGTATATCAAGCCGTTCCTCCAGCCCGGTAGACTTGTTAAGGTGAAAACGGAAAAATACGAGTACGATTGGGGCATTATAGTGAACTTTAAACACAAAACCGGCAAAAGTAAGAAAGACGAGAACCCCCTGACCGCGGACACCGTCATAGTGGTGGACGTGTTGCTGCATGTTAAGAAATCAAAAGCCGACGAGGCCGACACGAACGTGCCTTGTCCTCCTGGAGAGACCGGCGACGTAGAGGTGGTGCCGATCCTACACACGTTAATATATCAGATAAGTTCGCTGCGGGTGTACTATCCCAAAGACCTGCGACCGCCCGACAACAGGAAGTCGGTGCTGAAAACTATAGGGGAGGTCAAGAAGCGGTTCCCGGAAGGACCGCCGCTACTGAATCCCATCAAGGACATGAAAATTGAGGACTCTGTGTTCAAGGAATGCGTCGAGAGAATCAAGTTGTTAGAGGAAAGATTATACTCTCACCCCCTCCACAACGACAAGAACCGTGGCGCCCTGACGGCGGCTTACGACGCCAAACAAGAAATATACGAAGAGCTGACGTTAGCCAAGTCCGAGTTGAGGAGGGCGAAGAGCATCTTACAGATGGACGAACTGAAGAAGAGGAAGCGAGTGCTGAGGCGACTCGGGTACTGCACGCTGTCAGACGTCATAGAGCTCAAGGGCAGGATAGCCTGCGAACTCAGCAGTGCGGACGAACTGCTTCTGACCGAGTTGATCTTCAACGGTGTGTTTAACAATCTGTCCGCGGAGCAGAGCGCGGCGCTAGTGAGCTGCTTCGTGTGTGACGAGAACAGCACTCAGACGTCCGCCACGGGCGAGGAGCTGAGAGGCGTCCTGAGACAACTACAGGAATACGCGCGTAGAATAGCGAAAGTATCAATCGACGCGAAGATGGATCTCGACGAGGACGAGTACGTTGGAAAATTCAAATGTACCCTCATGGACGTAGTACTCGCGTGGGCGAAGGGCGCCTCCTTCCTACAGATATGCAAGATGACTGACGTCTTTGAAGGTTCAATAATTCGTTGTATGCGTCGCCTGGAGGAGGTACTCCGGCAGTTGTGTCAGGCCGCCAAGAACATCGGGAACACGGACTTGGAGAATAAGTTCAGCGACGCCATCAAAATGCTGAAGAGAGACATAGTGTTCGCGGCCAGCCTTTACATGTAG

Protein sequence:

>DPOGS215771-PA
MSDINSLFDCFEEPALNEAATQLPNVKSEEEAPVTKTEDVKKEETIEASPSNKRPHEEVKYADTSKKPRQEEEDDADIISDINLNNLGARILIHTLDTHEGCTHEVAIPPNQEYAQLMPITSEPAKQYSFILDPFQKEAIMCIDNLQSVLVSAHTSAGKTVVAEYAIALSLKNKQRVIYTTPIKALSNQKYREFSEEFHDVGLITGDVTINPSASCLIMTTEILRNMLYRGSEIMREVGWVVFDEIHYMRDKERGVVWEETLILLPDNVHYVFLSATIPNARQFAEWVCRLHSQPCHVIYTEYRPTPLQHYIFPASGDGIHLVVDEKGQFKEDNFNTAMTVLSNAGGASAGGERGRRGGLKGGSSSIFNIVKMIMERNFAPVIIFSFSKKDCELYAMQMAKLDFNTIEEKKLVDEVFNNAMDVLSEDDRKLPQVENVIPLLRRGIGIHHGGLLPILKETIEILFGLGLIKALFATETFAMGLNMPARTVVFTNCQKFDGKDFRFITSGEYIQMSGRAGRRGLDDKGIVILMIDQKVTPSVVKSMVQGKADPINSAFHLTYNMVLNLLRVEEINPEYMLERSFYQFQNQAVIPDLIDKVKAKQKEYSALSIEEEHSIASYCNIRSQLELLGSQFRSFITKPEYIKPFLQPGRLVKVKTEKYEYDWGIIVNFKHKTGKSKKDENPLTADTVIVVDVLLHVKKSKADEADTNVPCPPGETGDVEVVPILHTLIYQISSLRVYYPKDLRPPDNRKSVLKTIGEVKKRFPEGPPLLNPIKDMKIEDSVFKECVERIKLLEERLYSHPLHNDKNRGALTAAYDAKQEIYEELTLAKSELRRAKSILQMDELKKRKRVLRRLGYCTLSDVIELKGRIACELSSADELLLTELIFNGVFNNLSAEQSAALVSCFVCDENSTQTSATGEELRGVLRQLQEYARRIAKVSIDAKMDLDEDEYVGKFKCTLMDVVLAWAKGASFLQICKMTDVFEGSIIRCMRRLEEVLRQLCQAAKNIGNTDLENKFSDAIKMLKRDIVFAASLYM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: