MonarchBase - Protein-coding gene

DPOGS212017
Transcript	DPOGS212017-TA	5349 bp
Protein	DPOGS212017-PA	1782 aa
Genomic position	DPSCF300054 - 863649-887673
RNAseq coverage	96x (Rank: top 62%)

Annotation
*Heliconius*	HMEL013594	93.39%
*Bombyx*	BGIBMGA010171-TA	86.93%
*Drosophila*	CG5205-PA	65.48%
EBI UniRef50	UniRef50_Q9VF56	65.48%	CG5205 n=24 Tax=Coelomata RepID=Q9VF56_DROME
NCBI RefSeq	XP_321922.4	66.30%	AGAP001234-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|347965554	66.30%	AGAP001234-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347965554	66.93%	AGAP001234-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005524	1.2e-24	ATP binding
	GO:0008026	1.2e-24	ATP-dependent helicase activity
	GO:0003676	1.2e-24	nucleic acid binding
	GO:0004386	1.1e-16	helicase activity
KEGG pathway
InterPro domain	[973-1282] IPR004179	9.5e-91	Sec63 domain
	[5-216] IPR014001	1.3e-28	DEAD-like helicase
	[11-187] IPR011545	1.2e-24	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[306-394] IPR001650	1.1e-16	Helicase, C-terminal
Orthology group	MCL10167		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS212017-TA
ATGGCTTTCGAGAATATCAAGGAATTAAACCGCATCCAATCTGTTGTGTTCCAAACGGCGTATAACACTAACGAAAATTTGCTCATTTGCGCCCCCACCGGCGCTGGTAAGACAAACATAGCCCTGCTAACTGTAGTTCACCAGCTCAAACAGCATATAGAGAATGACGTCATCATGAAGAATAAATTTAAGATTATCTACATAGCTCCTATGAAGGCACTGGCTTCGGAGATGACAGCCAGTTTTGGCAAACGTCTTCAAAGTCTTGGCATCACGGTCCGAGAACTCACAGGAGACATGAAACTAACTAAAGCAGAAGTTCAACAGACGCAGATGATTGTTACGACGCCCGAGAAATGGGATGTTGTTACCAGGAAAGGGGCTACGGATACTGAATTGGCGTCAATAGTGAAATTACTCATCATAGATGAAGTACATTTACTACACGGAGACAGAGGACCCATAGTGGAGGCTATCGTGGCCAGGACATTGAGACAGGTTGAATCAACTCAGAACATGATAAGAATCGTGGGCCTGTCAGCAACGTTACCCAACTACGTCGATGTTGCCAGATTCCTCCGTGTGAACCCCAACATTGGTCTATTCTACTTCGACTCCCGTTTCCGTCCGGTGCCGCTCGAACAGCAGTTTATAGGAGTGAAGGAAATAGGTTCCGGCGGGGGAACACACCTGAGACAGATCCAGACAATGAACGAAATATGCTACGACAAAGCCTCTGAGATGGTGCAGAAAGGTCACCAAGTAATGGTTTTCGTTCACGCTCGTAACGCAACCCATCAGACGGCTTTGATTCTGAAAGAGATCGCCCAAAAGAAAGGACACCTCAAGTATTTTGAGCCCGAGGACTCTGGAGGTTTCTTAAAGGCCAAGAAGTCTATCGGCAGCAGTCCTAACAAACAATTGGCAGAGCTCTTTTCCGCTGGTTTTGCCTGTCATCACGCTGGGATGTTGAGAAGCGATAGGAACATGGTAGAAAAATACTTCGCAGAGGGATACATCAAAGTACTCGTGTGTACCTCAACACTGGCTTGGGGAGTCAATCTACCAGCACATGCGGTTGTCATAAGGGGTACAGAAATCTACGACCAAAGTCACGGAACGTTCGTCGACCTCAGCATACTGGACGTGCTCCAAATCTTCGGTCGTGCTGGGAGGCCGCAGTTCGACACATCCGGCACAGGCATCATCATAACGACCCACGACAAACTGACTCACTACTTGAAGAGTATGACCAATCAGTTCCCGATAGAGAGCAACTTCATCAATCTCTTAGCAGACAATTTGAACGCCGAGGTGGCGCTCGGCACAGTCACTAATATCGACGAAGCGGTTGAGTGGTTGAGCTACACTTACCTATTTGTCAGAATGAGGATCAATCCGCAGGTCTACGGTCTGACATATACCGATGTCCAAGAGGACCCCACTTTGGAAACTAGGAGACGCGAACTAATTACAAGCGCGGCCATGCAACTAGACCGCACGCATATGCTGAGATACAACGAACGTACCGGAGACCTGCATATTACCGACCTCGGCCGGACGGCCAGCCACTATTACATAACATGTGAAACCATGGAGGTGTTCAACACCATGGTACGAAAATCTATGACTCAGGGTTATGTGCTGGAGATGCTGACCAGGTGTTCGGATTTCCAGCAGTTGAAAGTCAGAAAAGAAGAATTGACAGAACTGTGGAATCTGAAAGACATGTATTGTGAGTTACGAATCGAAGACGCTCCAGAGGACATACACTGGAAGATCAACATCTTATTACAGACATATCTGTCACGCGGTCGGGTCAGCGGGTCCTCGCTGCAATCAGACTTGAATTACATCAGCCAGACAGCTCGCCATTTGAAGAAATGCGCCGAGGAATTCCCATTGCTGGACATGGAGGCTAGCTTACATCCTATAACGAGGACTGTATTGAGAATAAGACTCACCATCACACCCAACTTTAAGTGGAATGACAAGTACCACGGTAAGGCACCAGAGGCCTTTTGGATCTGGGTCGAAGATCCCGACACCGACATAATGTACTACCATGAATATTTCCTCATTACCAAAAAACAAGTCATAACAAACGAGCCTCAAGAATTAGTTATAACGATTCCTATATCTGAGCCTTTGCCTCCTCAGTACTATATCAGAGCTACTTCAGAAAGATGGCTAGGCTCAGAGAGTGTACTGCCTTTGACATTCCAACATCTAATTCTACCAGAAACTCATCCACCTCATACAGGTGACGTTTCACCGGATATCCGGGCCATAAGACAGTCGCAAGTCATAGTGACGACTCCTGAGAAGTGGGACGGCATCAGCAGGTCCTGGCAGACGAGGAATTACGTGAGGGACGTGGCTCTCATAGTCATAGATGAGATACACCTGTTGGGAGAAGATAGGGGACCGGTTTTAGAAGTCATTGTGTCCAGAACCAATTTCATAGAATCCCATACGTCTCGTCGTCTCCGCATCATAGGTCTCTCCACGGCCCTCGCCAACGCTAAGGATCTAGCCAACTGGCTGAACATTGGAGAAATTGGATTATACAACTTCAGGCCGTCCGTCAGACCTGTCCCGTTGGAGGTCCATATATCAGGCCACGCGGGTCGTCACTACTGTCCGCGGATGATGTCTATGAACAAACCCACATTCAGCGCTATCAGAACACACTCCCCTGCCTCACCAGCTCTGGTCTTCGTGTCCAGTAGACGGCAGACCAGATTAACGGCGCNATACAAAAATTGTAACTTAAAGGTCTACGGTCTGACATATACCGATGTCCAAGAGGACCCCACTTTGGAAACTAGGAGACGCGAACTAATTACAAGCGCGGCCATGCAACTAGACCGCACGCATATGCTGAGATACAACGAACGTACCGGAGACCTGCATATTACCGACCTCGGCCGGACGGCCAGCCACTATTACATAACATGTGAAACCATGGAGGTGTTCAACACCATGGTACGAAAATCTATGACTCAGGGTTATGTGCTGGAGATGCTGACCAGGTGTTCGGATTTCCAGCAGTTGAAAGTCAGAAAAGAAGAATTGACAGAACTGTGGAATCTGAAAGACATGTATTGTGAGTTACGAATCGAAGACGCTCCAGAGGACATACACTGGAAGATCAACATCTTATTACAGACATATCTGTCACGCGGTCGGGTCAGCGGGTCCTCGCTGCAATCAGACTTGAATTACATCAGCCAGAACGCGGTTCGTATAGTTCGCGCGCTTTTTGAAATAACGTTAAGGAAAAATAACGCATACATGGCGGGATTGTATCTCAAGATGGCGAAAATGATGGAACTTCAGCTATGGGATTTCTATAGTGATATGAGACAGTTCAACTGCTTCCCCAACGAGATATTGAAGCATATAGAGTACCCGTTACTGAAACCGGATCAACTGAGAGATATGGATTGGAAGGAAATAGGCGACCTAATACGTAACCCTAAGACAGCTCGCCATTTGAAGAAATGCGCCGAGGAATTCCCATTGCTGGACATGGAGGCTAGCTTACATCCTATAACGAGGACTGTATTGAGAATAAGACTCACCATCACACCCAACTTTAAGTGGAATGACAAGTACCACGGTAAGGCACCAGAGGCCTTTTGGATCTGGGTCGAAGATCCCGACACTGATATAATGTACTACCATGAATATTTCCTCATTACCAAAAAACAAGTCATAACAAACGAGCCTCAAGAATTAGTTATAACGATTCCTATATCTGAGCCTTTGCCTCCTCAGTACTATATCAGAGCTACTTCAGAAAGATGGCTAGGCTCAGAGAGTGTACTGCCTTTGACATTCCAACATCTAATTCTACCAGAAACTCATCCACCTCATACAGATCTGCTAGAGTTACAACCTCTGCCAGTGACAGCCCTGAACAATCCCTCCTACGAAATGCTATACAACTTCAGTCACTTCAATCCGATACAGACACAAATATTCCATGCGCTGTATCACACCGACCATAACATACTACTCGGAGCGCCGACCGGCTCGGGGAAGACGATAGTCGCTGAAGTGGCCATGTTCAGGGTCTTCAACCAATATCCGGGTTGTAAGGTCGTCTACATCGCGCCACTTAAAGCTCTTGTCAAAGAAAGAATAAAGGATTGGAAAGTGAGGCTGGAAGAGAAACTTGGAAAAAACGTCGTGGAATTAACGGGTGACGTTTCACCGGATATCCGGGCCATAAGACAGTCGCAAGTCATAGTGACGACTCCTGAGAAGTGGGACGGCATCAGCAGGTCCTGGCAGACGAGGAATTACGTGAGGGACGTGGCTCTCATAGTCATAGATGAGATACACCTGTTGGGAGAAGATAGGGGACCGACAAAACAAGACATCCTAGACTATCTGACTTGGACCTACTTCTTCCGGAGGTTGCTGAAGAACCCTTCGTATTACAATTTAGAGAGCATCGAGCCGCAAGACATTAACTGTTACCTTTCAAATTTAGTGCAAACCTCTTTGGACGCCTTGGCTAACGCGAATTGCATCGAGATAGAAGAGGTCCTAATTTGCACGGCGACGCTAGCTTGGGGTGTAAATTTCCCCGCGCACCTGGTCGTTATCAAGGGTACGGAGTACTTCGATGGAAAACAGAAGAGATACGTGGACATGCCCATCACTGATGTACTGCAGATGATGGGACGAGCGGGACGCCCACAAGCTATAATAGACACAACAGCGGAGAACGGTTGGTTATCAGTTTGTTTGATATCACAAATGTTGATGCAATGTATCGTTCAAGCACGATGGTATACGGAATCGGCTCTAACGACTCTACCGCATATAGAGTCACAGCATTTGTACATGTTCTTACACATGACCAGAGACACTAATAAGCCATGTTTCACATTGAATGGCTTAAAGGTAGTTTGTGCGAAAAATTATGAGCTACTAGCCAAATATATGAGACGGGAATTTGAAGAAAATCAAATTGAACATGTGTACAGGGAATACACGATCGTAATAGACATGCAAAGACGTGGTGGTAACCCAAATAACGTCTTATGTCCGCGTTTCCCCCGGGGTAAGAATGAGGGCTGGTTCATCACCCTGGGGTCTATAGAAAATGGAGAGCTACAAGCTTTAAAACGCGTTCCGCCTAAGGGTACATCAAATGTTACTTTCTACACACCATCGCAAAATGGACGCATAATATACACAATGTATGTAATGAGTGACAGTTACATGGGTCTAGATCAACAGTATGACTTACAATTTGACATCATTGGCCCTTTACCCACAGAGACGGTTGACAGAGTATACGATACCATAGACAAAGTTATCATTGAATGA

Protein sequence:

>DPOGS212017-PA
MAFENIKELNRIQSVVFQTAYNTNENLLICAPTGAGKTNIALLTVVHQLKQHIENDVIMKNKFKIIYIAPMKALASEMTASFGKRLQSLGITVRELTGDMKLTKAEVQQTQMIVTTPEKWDVVTRKGATDTELASIVKLLIIDEVHLLHGDRGPIVEAIVARTLRQVESTQNMIRIVGLSATLPNYVDVARFLRVNPNIGLFYFDSRFRPVPLEQQFIGVKEIGSGGGTHLRQIQTMNEICYDKASEMVQKGHQVMVFVHARNATHQTALILKEIAQKKGHLKYFEPEDSGGFLKAKKSIGSSPNKQLAELFSAGFACHHAGMLRSDRNMVEKYFAEGYIKVLVCTSTLAWGVNLPAHAVVIRGTEIYDQSHGTFVDLSILDVLQIFGRAGRPQFDTSGTGIIITTHDKLTHYLKSMTNQFPIESNFINLLADNLNAEVALGTVTNIDEAVEWLSYTYLFVRMRINPQVYGLTYTDVQEDPTLETRRRELITSAAMQLDRTHMLRYNERTGDLHITDLGRTASHYYITCETMEVFNTMVRKSMTQGYVLEMLTRCSDFQQLKVRKEELTELWNLKDMYCELRIEDAPEDIHWKINILLQTYLSRGRVSGSSLQSDLNYISQTARHLKKCAEEFPLLDMEASLHPITRTVLRIRLTITPNFKWNDKYHGKAPEAFWIWVEDPDTDIMYYHEYFLITKKQVITNEPQELVITIPISEPLPPQYYIRATSERWLGSESVLPLTFQHLILPETHPPHTGDVSPDIRAIRQSQVIVTTPEKWDGISRSWQTRNYVRDVALIVIDEIHLLGEDRGPVLEVIVSRTNFIESHTSRRLRIIGLSTALANAKDLANWLNIGEIGLYNFRPSVRPVPLEVHISGHAGRHYCPRMMSMNKPTFSAIRTHSPASPALVFVSSRRQTRLTAXYKNCNLKVYGLTYTDVQEDPTLETRRRELITSAAMQLDRTHMLRYNERTGDLHITDLGRTASHYYITCETMEVFNTMVRKSMTQGYVLEMLTRCSDFQQLKVRKEELTELWNLKDMYCELRIEDAPEDIHWKINILLQTYLSRGRVSGSSLQSDLNYISQNAVRIVRALFEITLRKNNAYMAGLYLKMAKMMELQLWDFYSDMRQFNCFPNEILKHIEYPLLKPDQLRDMDWKEIGDLIRNPKTARHLKKCAEEFPLLDMEASLHPITRTVLRIRLTITPNFKWNDKYHGKAPEAFWIWVEDPDTDIMYYHEYFLITKKQVITNEPQELVITIPISEPLPPQYYIRATSERWLGSESVLPLTFQHLILPETHPPHTDLLELQPLPVTALNNPSYEMLYNFSHFNPIQTQIFHALYHTDHNILLGAPTGSGKTIVAEVAMFRVFNQYPGCKVVYIAPLKALVKERIKDWKVRLEEKLGKNVVELTGDVSPDIRAIRQSQVIVTTPEKWDGISRSWQTRNYVRDVALIVIDEIHLLGEDRGPTKQDILDYLTWTYFFRRLLKNPSYYNLESIEPQDINCYLSNLVQTSLDALANANCIEIEEVLICTATLAWGVNFPAHLVVIKGTEYFDGKQKRYVDMPITDVLQMMGRAGRPQAIIDTTAENGWLSVCLISQMLMQCIVQARWYTESALTTLPHIESQHLYMFLHMTRDTNKPCFTLNGLKVVCAKNYELLAKYMRREFEENQIEHVYREYTIVIDMQRRGGNPNNVLCPRFPRGKNEGWFITLGSIENGELQALKRVPPKGTSNVTFYTPSQNGRIIYTMYVMSDSYMGLDQQYDLQFDIIGPLPTETVDRVYDTIDKVIIE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: