MonarchBase - Protein-coding gene

DPOGS204771
Transcript	DPOGS204771-TA	5367 bp
Protein	DPOGS204771-PA	1788 aa
Genomic position	DPSCF300231 + 192041-201017
RNAseq coverage	1059x (Rank: top 12%)

Annotation
*Heliconius*	HMEL015036	0.0	81.28%
*Bombyx*	BGIBMGA010194-TA	1e-83	38.72%
*Drosophila*	dom-PA	0.0	55.68%
EBI UniRef50	UniRef50_UPI00022467AF	0.0	54.95%	UPI00022467AF related cluster n=1 Tax=unknown RepID=UPI00022467AF
NCBI RefSeq	XP_002427447.1	0.0	50.00%	Helicase, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|345483873	0.0	54.95%	PREDICTED: hypothetical protein LOC100115939 [Nasonia vitripennis]
NCBI nr blastx	gi\|345483873	0.0	55.38%	PREDICTED: hypothetical protein LOC100115939 [Nasonia vitripennis]

Group
Gene Ontology	GO:0003677	8.3e-87	DNA binding
	GO:0005524	8.3e-87	ATP binding
	GO:0004386	1.8e-20	helicase activity
	GO:0003676	1.8e-20	nucleic acid binding
KEGG pathway
InterPro domain	[575-858] IPR000330	8.3e-87	SNF2-related
	[568-761] IPR014001	5e-36	DEAD-like helicase
	[221-292] IPR013999	2.4e-28	HAS subgroup
	[221-292] IPR006562	1e-23	HSA
	[1132-1215] IPR001650	1.8e-20	Helicase, C-terminal
Orthology group	MCL15355		Single-copy universal gene

Nucleotide sequence:

>DPOGS204771-TA
ATGAGTGGACGAAATGATCCCGCCTCAACTTTTGGATCAGCTTCTTCACCGTTACCTCTCATGGGTGTGGAACGTGGAACCGGTTGTGGAGGCGGGGGAGGGGGAGGGGGCGGCGAGGAACCTCTCAACGGGGTCGCCGTGGAGCGACGTGATGACGAGCCGCCTAGAAAGAAGAGCAAGCTGCATGGGGTCGAGGACGTGTCGGCGCTCAGGAAACGCGTGTTGGAGTACAAGTTGCTCCGGTTGAAGAATCTGCGAGAAAGGTTCACGGAGCAACTGAGCGAGTTGTATTTTCTTCAGGCGGGTGGAAACATGATGGACTACTCGGCTTGGCGAAAAAAACCTCCAGGTCCACAGCTGACCGCCTTTTTAGAGTCCCGCCGGCCGCCCCTCGTGGTGCCACCCCCGCCGGAGCCGCCCCCCCAGCGGGCCAGGGTTTCCTCTCCGGCGGTGGCGGTGGCGTCCGAGCCGGCCCCGGCCTGTGCTCCTAGCGTCGAGCCTACTGTGGTGACGTCCTCCGCCGCGCCCCCTCCCGTCACCCCGGCAGCCGCCGCCGCCGCCGCCGCGGACGAAATGGTCGAAAAGGCCAAACAGGAGGCGTACGTGGCGGCGCGAGTAGCGGAGCTCGCCCGTGCTGGCCTGTGGACCGAACGGAGGCTGCCACGCGTGCTCGAACCGCCGAGACCTAAGACGCATTGGGATTACTTGCTCGAGGAGATGGCCTGGCTTGCGCAAGATTTTGCCCATGAACGGAAGTGGAAAAAGCAAGCCGCCAAAAAGTGTGCTCGTGCGGTTCAAAAATATTTTCAAGACAAAGCTGTCGCGGCTCAGAAAGCTGAAAAAGCTCAAGAGTTACAGTTGAAGAAGATTGCTGCCTTCGCAGCCAAAGAAATCAGAAATTTTTGGTCCAATGTCGAAAAGCTGGTCGAGTGGAAACGCGTCCGCCGAGTAGAACGAGCCCGCAAGGAGGCTCTCGATGAGCAACTGAGTTATATCGTAGACCGCACGGAGCGCTACTCGCGTCAACTGGCAGCCAACCTGGGCGCGCCCGCAGCCCCTGCTGCGACCCCGGCCGTCCCGGACACGCCGCCCTCCGACGACGAGTTTCAGCCGCGAGACGACTCCGATGACGACGAGGAGACCATAGCGGCTGCCGAGCGAGAGGCCGCACACGACGCCACGGATCATCGCGACGAGCTTGAGGCGCTACGCCGGGAGTCCGACCTCGACCTCGGCGACCTGTTGCCCCCGGGATACGTGCCAGCCCACTCGCCGCCGCCCTCGGACTACGGGCCCGACGTCGACTCCGCCGACGACGAGGACACCATCGCGGAACAGGAACAGAACGAACGGCCCGAGGACGCCGCCGCAGAGCTCGCCGCGCTCAGGAACGACGCGGACCTCGACATACACGAGCTGCTCGGGAGATACAATGCCGAGGACGGGGACGGCTCCACGGCCACGGAGCGCGACACGGACGACGAAGACGAGCCTTCGGAAATAAGTAGCGACGAGTCCGCGGACTCCGAGCAGCTAGGAGCTCTCATGGAAACTGACGAAATCAAAGAAGAGGCGAGAAGGGACGATGCCAATGCGGAAGGAGAGCAGCGCGTCGAGGCTGCCGCCTCGCTCGCCGCCTCTCTTCAACCCACTGGCACCACGCTTTCGGAGACGGCCGTGGCCACGCCCGTGCCGGGGTTGCTGCGACACTCGCTCCGGGAGTACCAGCACGTGGGCCTTCACTGGCTGGCCACCATGCACGCGCGGGGACTCAACGGCATACTGGCCGACGAGATGGGGCTCGGCAAGACCATACAGACCATAGCTCTGCTGGCGCACCTGGCGCTGGACCGCCGAGACTGGGGACCGCACCTCGTGGTCGCGCCCACCTCCGTCGTCCTCAACTGGGAGATGGAGTTCAAGAAGTGGTGTCCGTCCTTTAAGATCCTCACCTACTACGGCACCATCAAGGAGAGGAAACTGAAACGTGTCGGTTGGACCAAAACGAACTCGTTCCACGTGTGTATAACCTCGTACAAACTGGTAGTGCAGGACCATCAGAGTTTTCGTAGGAAGAAGTGGAAGTATCTCATATTAGACGAAGCTCAGAATATCAAAAATTTTAAATCTCAGAGATGGCAGATGTTACTGAATTTCCAGACAGAAAGACGGTTACTCCTGACGGGCACGCCGCTACAGAACAGTCTGCTGGAGCTGTGGTCGCTCATGCACTTCCTCATGCCGGACGTGTTCGCCTCGCACTCGGAGTTCCGCGAGTGGTTCGCGCCCGTCGCCGGCATCGCGGAGGGCTCGCACCGGTACAGCGACGAGCTCGTGAGGAGACTGCACGAGGTACTGCGACCTTTCCTGTTGCGGCGCCTGAAGGCGGACGTGGAGCGACAGATGCCGCGCAAGTACGAGCACGTGCTCATGTGTCGACTCTCCAAGAGGCAGCGGTTTCTCTACGACGACTTCATGTCCCGAGCGAAAACGAAAGAGAGTCTCGCCTCGGGCAACCTGCTGAGCGTAATCAACGTGCTGATGCAACTCCGCAAGGTGTGCAACCACCCCGACCTGTTCGAGCCGCGGCCGGTGTCCTCTCCGCTCCAGCTGCCACCGTTGCCTTACCGCGTGCCTTCACTGGCGCTCGTTGCCGATGTGGTGCGACGAGTGGAGCTGGCGGCGCGCCTCGGCGGGGACCTCGCGACGCTCGAAGTGTCCGGCGCTGGCGCCTTCGCCGCTCACCGCGCTCGCCACCTGGCTCCGCCGCGGCGCCTCATAGAGGAGCTGCCGGACCCCCCGCCGCCGCCTACTCCGCGTCCCCCGCCCTCCGNNNNNNGTCCGCTCACCGCCGCGCCAGCCTGCGGCGCATGGCCGCGGTCAACGAGCGCCGCTGCTGGCGCCTGCCCCTGTTCGGCGCGGACTTGCGCGCGGCGGTGGACGTGGGTCCGCCTCCCTTGCCGCCGCGGGATATCTCGGACGTGCTCCGCGACCTGCACGACGTCATCGACAGGTTCACTATGTTCATTCCCGTTTTGTCAAGCGAGGGTTCCCATTAAGGAAGGCAATATACCTTCTCCCCCCCCCAAACCCCTCGTTCATGATCTGCTGGTCGTCGTGCCGGGCGCGCGGGCTCCAGATGTGGGCGGGCGCGGGGGAGGGGGCGCGGGCCTGGCGGCGGGCGGCGCGCCCCCCCCGAGGGCGGGGCTGCGAGCCGCGCGCGCCGCCCTCACCTTGCTTCACGTTCCGGCCGCGCGCGCAGCCGTCGCCTTCCCGCACCCGAGACTGCTGCAATACGACTGCGGTAAGCTGCAGACGCTGGACGGTCTGCTCCGGCGGCTGAAGGCGGGCGGCCACCGCGTGCTGATCTTCACTCAGATGACGAGGGTGCTGGACGTGCTGGAGGCGTTTCTCTGTATGCACGGCCACGCCTACCTCCGCCTGGACGGCGCCACCCGTGTGGATCAGCGCCAGCCGCTCGTGGACCGATTCAACGCGGATCCTCGAATTTTCGCTTTCATCCTGTCCACGCGCAGCGGCGGCGTCGGCCTCAACCTCACCGGAGCGGACTCCGTGGTGTTCTACGACTCGGACTGGAACCCCACCATGGACGCGCAGGCTCAGGACCGCTGCCACCGGATCGGTCAGACGCGCGACGTGCACGTGTTCCGCCTCGTCACCACGGCCACCGTCGAAGAGAACATTCTGCGCAAGGCCGAACAGAAACGGACCCTCGGCCACCTCGCCATCGAAGACGGACACTTCACCACGTCCTATCTGAGAGCGGCCAACATCAAGGAGTTGTTCGGAGCGGAGACGGAGCCGACGGCCGGCCAGAGAGACTGCGAATCGGCAGAGGGTGGGGAGTTGGAGTCCGCCCTCGCGGCCGCGGAGGACGAGGCGGACGCCGCCGCCGCCCAGGCGGCCAGGGCGGAGGCTCAGGGTGACCTCGCCGAGTTCGACGAGACCGTACCGCTAGATGAAGACACGCGCGCAGCTTCCCCCGGACATGCGGGAGACGAAGACCGGGGAGAGTTCGCCGCCCTCATGAAACAGTTAACGCCGGTGGAGAAATACGCAATGAGACTGGTGGAGAGCAGCGAGGCGGCCACTGAGGCGGAGCGGGCGGCGCTCGGGGAGATGAGGAGGCAGCTGAGGGAGTGGGAACAGGCGAGGCGCGCGCTCCGGGACGAGGCTAGCGACCAGCACGAGCAAGAGACGGAACCGGAGCACGACCAGGACCTGGAGCTCACTTACTGTCGGGAGGACGCCCGCACGGAGATATGGATCGACGGCAACGGAGCGGCGGAGCGCATGCCGATGTGGTGTCCGCCCACCCCGCCCTCCAGCGACGGAGACGTGTACTGCGACAGCTGGGCGCGAGCCCTGTACCGGCGTGGGGCGGCCGCCGACGCTCTCCTACCGCCCGTCCGCTGGAGAGACTCTCGTGCTCCGCGGTCACCGCGCCGCACTAGGCCGGCTCCCCGCTCCGCCCACGCTCCTCCTTCGCTGTTCGACCGCGGCGGCCCGCGTCCACGGCCCCGCGTCCGCGCGCCCCCCGCCCCGCCCAGGGACCACGTCACTCCTCCGCCCGACTGGGCTCCTTGCGAGGACGCCGCTCTACGGCGAGCGCTCCGTCTGCAGCGTTTACCGCCGGAACCTCCGGCCGCTCACGCTCCCAACTGGGATTGGCTCGCCGACCTGGTCGGGGAGGTCGCCCGCGCCTATCGCTCTCCCCGCTCCTGTCGCGATCGTCACGACGCGCTCGCCGACCCGGAGCGCGCCCGCCGCAAACATCGGAAGCCTCCGCCGGCCCGACGTCGGCCGGACGATGACGCCCCGCGTCCGCCGCTACAACGACTCGACGCGATGCGGGAAGCCGCCGAGCGACGTCGCGCGGCGCCCAAGCGTCGCCTGGACGACGCCTCGCACCACAATCCCAAGCACGCCGCGCTGCTCGCCGACCATGGAGTGGACTACGACGCTCCTCCTTCACCGATGGAGGTGGCCACACGACGAGCGGAGCGTATCGCGAAGGAGAAGATGAAGGTCGGCGCGAGCGCTTCCAACGCCGGGAACGTCGCGCCGCCGCCGGCCGCCGCCAGCGGCGCGCCTCCGCCCGTCACCGCACAGCGTATAGTAGTGGCGGCGCACGGGGCTCCGGCAGCGGCCGCGGCGGCGCCCGGGCCCGGCAAGCCGGAGGTCCGCCGTCCGCGGCCGGGGGAGGCTCCGCGAGCTCAGGCGCCGGCCGCCGCACAGCTGCTGTACCGCCAGCAGACGCTCGCCGGCAGGCACCATCTGAAGATATTGCACCACTCGACACCGACCCAGCCGCAGGTAGGGCCGCGCCGGGGACTGCGGCGCTAG

Protein sequence:

>DPOGS204771-PA
MSGRNDPASTFGSASSPLPLMGVERGTGCGGGGGGGGGEEPLNGVAVERRDDEPPRKKSKLHGVEDVSALRKRVLEYKLLRLKNLRERFTEQLSELYFLQAGGNMMDYSAWRKKPPGPQLTAFLESRRPPLVVPPPPEPPPQRARVSSPAVAVASEPAPACAPSVEPTVVTSSAAPPPVTPAAAAAAAADEMVEKAKQEAYVAARVAELARAGLWTERRLPRVLEPPRPKTHWDYLLEEMAWLAQDFAHERKWKKQAAKKCARAVQKYFQDKAVAAQKAEKAQELQLKKIAAFAAKEIRNFWSNVEKLVEWKRVRRVERARKEALDEQLSYIVDRTERYSRQLAANLGAPAAPAATPAVPDTPPSDDEFQPRDDSDDDEETIAAAEREAAHDATDHRDELEALRRESDLDLGDLLPPGYVPAHSPPPSDYGPDVDSADDEDTIAEQEQNERPEDAAAELAALRNDADLDIHELLGRYNAEDGDGSTATERDTDDEDEPSEISSDESADSEQLGALMETDEIKEEARRDDANAEGEQRVEAAASLAASLQPTGTTLSETAVATPVPGLLRHSLREYQHVGLHWLATMHARGLNGILADEMGLGKTIQTIALLAHLALDRRDWGPHLVVAPTSVVLNWEMEFKKWCPSFKILTYYGTIKERKLKRVGWTKTNSFHVCITSYKLVVQDHQSFRRKKWKYLILDEAQNIKNFKSQRWQMLLNFQTERRLLLTGTPLQNSLLELWSLMHFLMPDVFASHSEFREWFAPVAGIAEGSHRYSDELVRRLHEVLRPFLLRRLKADVERQMPRKYEHVLMCRLSKRQRFLYDDFMSRAKTKESLASGNLLSVINVLMQLRKVCNHPDLFEPRPVSSPLQLPPLPYRVPSLALVADVVRRVELAARLGGDLATLEVSGAGAFAAHRARHLAPPRRLIEELPDPPPPPTPRPPPSXXXPLTAAPACGAWPRSTSAAAGACPCSARTCARRWTWVRLPCRRGISRTCSATCTTSSTGSLCSFPFCQARVPIKEGNIPSPPPKPLVHDLLVVVPGARAPDVGGRGGGGAGLAAGGAPPPRAGLRAARAALTLLHVPAARAAVAFPHPRLLQYDCGKLQTLDGLLRRLKAGGHRVLIFTQMTRVLDVLEAFLCMHGHAYLRLDGATRVDQRQPLVDRFNADPRIFAFILSTRSGGVGLNLTGADSVVFYDSDWNPTMDAQAQDRCHRIGQTRDVHVFRLVTTATVEENILRKAEQKRTLGHLAIEDGHFTTSYLRAANIKELFGAETEPTAGQRDCESAEGGELESALAAAEDEADAAAAQAARAEAQGDLAEFDETVPLDEDTRAASPGHAGDEDRGEFAALMKQLTPVEKYAMRLVESSEAATEAERAALGEMRRQLREWEQARRALRDEASDQHEQETEPEHDQDLELTYCREDARTEIWIDGNGAAERMPMWCPPTPPSSDGDVYCDSWARALYRRGAAADALLPPVRWRDSRAPRSPRRTRPAPRSAHAPPSLFDRGGPRPRPRVRAPPAPPRDHVTPPPDWAPCEDAALRRALRLQRLPPEPPAAHAPNWDWLADLVGEVARAYRSPRSCRDRHDALADPERARRKHRKPPPARRRPDDDAPRPPLQRLDAMREAAERRRAAPKRRLDDASHHNPKHAALLADHGVDYDAPPSPMEVATRRAERIAKEKMKVGASASNAGNVAPPPAAASGAPPPVTAQRIVVAAHGAPAAAAAAPGPGKPEVRRPRPGEAPRAQAPAAAQLLYRQQTLAGRHHLKILHHSTPTQPQVGPRRGLRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: