MonarchBase - Protein-coding gene

DPOGS214059
Transcript	DPOGS214059-TA	2922 bp
Protein	DPOGS214059-PA	973 aa
Genomic position	DPSCF300171 - 60758-70426
RNAseq coverage	110x (Rank: top 59%)

Annotation
*Heliconius*	HMEL011086	1e-112	36.31%
*Bombyx*	BGIBMGA012404-TA	1e-152	48.06%
*Drosophila*	mus309-PA	5e-173	42.51%
EBI UniRef50	UniRef50_B0WJH9	0.0	43.75%	ATP-dependent DNA helicase hus2 n=3 Tax=cellular organisms RepID=B0WJH9_CULQU
NCBI RefSeq	XP_001848863.1	0.0	43.75%	ATP-dependent DNA helicase hus2 [Culex quinquefasciatus]
NCBI nr blastp	gi\|170042287	2e-180	43.75%	ATP-dependent DNA helicase hus2 [Culex quinquefasciatus]
NCBI nr blastx	gi\|380011350	1e-178	37.68%	PREDICTED: Bloom syndrome protein homolog [Apis florea]

Group
Gene Ontology	GO:0008026	3e-254	ATP-dependent helicase activity
	GO:0006310	3e-254	DNA recombination
	GO:0005524	1.9e-22	ATP binding
	GO:0004386	1.9e-22	helicase activity
	GO:0003676	1.9e-22	nucleic acid binding
	GO:0003824	3.6e-11	catalytic activity
	GO:0000166	3.6e-11	nucleotide binding
	GO:0044237	3.6e-11	cellular metabolic process
	GO:0005622	7e-10	intracellular
KEGG pathway	cqu:CpipJ_CPIJ007633	0.0
	K10901 (BLM, RECQL3, SGS1)	maps->	Homologous recombination
InterPro domain	[107-953] IPR004589	3e-254	DNA helicase, ATP-dependent, RecQ type
	[314-517] IPR014001	1.2e-27	DEAD-like helicase
	[552-633] IPR001650	1.9e-22	Helicase, C-terminal
	[320-487] IPR011545	9e-21	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[816-892] IPR010997	3.6e-11	HRDC-like
	[820-884] IPR002121	7e-10	Helicase/RNase D C-terminal, HRDC domain
Orthology group	MCL11057		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214059-TA
ATGGATAACAACCCATTAACAGACTTATCAGATTTTAACAAAAAAATACTTTCACATCCTCTCTATTTAAAGATTAGAGAAGGCAGGGTGTACACTTTTAATGAAGCAAATGAATTCAAAAAACTGTATATAGAAGTATTAGAGAAATTGAGCGATGTGTTATATGTTTTAATCAACAAATTACCTGATTATGAAAGAAAAAGCTACACTTCAATTTTTACTGTGAAAGAGAAACTCCGAAATATTTCAGCACAAGAAAATGTTGATTTTAATGACAAGTTATCACCTGAGAGTCGGAACATTTTGGACTGTATAGATGATATGACACTCGCACCTAGAAATATAACAGAAAATAAGGAGAATGTGCAGAACAATAGTGATGTGAAAATTCAGACGACTATATTACCTGATTCACTAAACCATGAGCAGAAAATCACAAAAAACTGTACTGAATCATATAATTCGGATGATATCGATCGAACCAACACTATAGACTACCAGACTGAGACAACCAGACACATTGAGACTGAAGCTTTAAATGAATCAAAAGATTTAAACACCACCACCATTAACCAAGCCAACCCAGAGTCCAGAGTAAATAATCCTAACAATATATGTAACAATTCAGATATAGATTTCGATCACTTTGAAGAATTTGAGGACATTAATTTCCAAGACGATTGGTCTGATCATTTCAAAGAACCTTTGGAAATAGGAGATAGTAGTTTGTCGAACAATGAAGAGTCAAATACAACAATTAATGTAAACTATGAAGATTCTATTGTAACATCCAAGCAACCTTTGCCTGTACCAAGAAATATTCATAACAACAGTATAGGGGACTTCGGTAATACTAGAAATGATGGAGTCACAGGTGAATTTGACGGTGATGATTATCCGCACTCGATCCCTATGATGGAGACTTTGAAAGAGAAATTTGGTCTCACATCTTTCAGACCAAATCAGAAGCAAGTCATTAACGCAACGCTTTTAGGCCACGACTGTTTTGTTCTCATGCCGACCGGCGGGGGAAAATCACTATGCTACCAGCTACCAGCGATACTGACCCCTGGCGTCACCATAGTCATATCACCACTGAGATCATTGATGTTGGATCAAGTCAACAAGTTATTAGCGCTGGATATTCCGGCCGCACATTTAGGCAGTGACGTCACTGAGGCGAAGAGCAATTACGTGTATGACGATCTCAACCAACAGGAGCCCACTATCAAGCTCCTCTACGTCACACCCGAAAAAATACAATCGTCTCCAAAATTTCAAGAAACTTTAACGAGACTCTACGAGAAGCAAAAGATTTCCAGGTTCGTGATCGACGAAGCTCACTGTGTGTCGCAATGGGGTCACGACTTCCGTCCGGATTATCAAAAATTGAATTTACTAAGGAAAAAGTTCCCTAATGTGACGCTAATGGCATTAACTGCGACGGCCACGAAGCGAGTGCGCACCGACATATTGTATCAGCTGAAGGTGCGTGAATGCAAATGGTTCCTGAGCAGTTTCAACCGTCCAAATCTCACGTACACGATTTTAACGAAGAAACAGAATCTGATAAATAAAGATATAGCTGAATTGATCAAGACGAAATATTATCAACAGTGCGGTATCGTGTATTGCCTGTCGTGCAAGGACTGCGACAGCATGGCTAACGCTTTAAAAGAGATGAAAGTATCGTCTAAGGCGTACCACGGAAAACTCGTAGACGCCGAGAGAGTCAACGTACAGACGCAGTGGCTCGCAGGAACCATTAAAGTGATCTGTGCAACGCTTGCTTTCGGAATGGGCGTGGACAAAGGCGACGTCAGATTCGTCATCCACCACAGTGTACCGAAGTCTATAGAAGCATACTACCAAGAGACGGGTCGGGCTGGGCGGGACGGCAAACCGGCTGATTGTATCTTATTCTACTGTTACAGAGACATTGTGCGCCAACGCAACCTCTATTATCGTGATAGAAGTTTGACGGAGAACTCGAAGAACGTCCACGATGATAACCTTACACGTATCAATGAGCTGTGTGAGGACGTGCTTGAATGTCGACGGACCTTCGTACTGAGATACTTGGGGGAGACATTCCAAAGCGACAACTGCGGTCCCATGCTCTGCGACAACTGTCAACGAAGACCGACAAACGAGTTTATAGACGTGACGGACGTGTGTCGGGAGATCTATTTTCTCAGATGCAATCAGTGGGGGAAGGGTGACGCGGTCCGGCTGTTACAACTCTTGCTAATGAAGAAAATCCTCGCTGAGAAAACCCGTATGAACAAGGACATTGCCAATAATTACCTAATTCGTGGAGCTGATGTATATAAGCTGTCGTCGAAGTCTGAGCCGATTATATTCTACAAGCGCCCGCACACTACTAAGAAGCCGGCGACAGCTGTAGCAGCGCCGCTCGTACAAGACGTTGACCAACAAATTAAACAAGTCGAGGATAAGGCTTACGAAGAGCTCGTTGAGGAAATAAAGAACATAGCAAAGGAGTCAGACGTGGCGCTTTGGACGCTGTACCCACAGATGGCGCTACGTTATATGGCGGAGAAGCTACCGGAAACGGCGGAGGAAATGCTCAAGATACCTCACGTTACCAACGCCAACTATAATAAGTATGGCTTCCGGTTGCTACCCATCACCCTCAAGTACTCCATGGAGAGGCTTAAACTCGAAATGACTTTGCAAGACCAGGAAATTAGCGAAGCCTTCGACGACGAGGAGCCCTCCGCGGGACCCTCCACGGTCAGCCCTCGAGTGTCCTTCAGAAATAATAGGAGCTACCGATCAAGAAAATCGAAATCGGCCAGAGCTGGTGTGAAAAAACCATATAAAAAAGACAATAAAGCGTTCAAGAAGTTCAAAAAAGGTGCAACAGGAACAATGCCCCGGCCGGGGACATTTTTATAA

Protein sequence:

>DPOGS214059-PA
MDNNPLTDLSDFNKKILSHPLYLKIREGRVYTFNEANEFKKLYIEVLEKLSDVLYVLINKLPDYERKSYTSIFTVKEKLRNISAQENVDFNDKLSPESRNILDCIDDMTLAPRNITENKENVQNNSDVKIQTTILPDSLNHEQKITKNCTESYNSDDIDRTNTIDYQTETTRHIETEALNESKDLNTTTINQANPESRVNNPNNICNNSDIDFDHFEEFEDINFQDDWSDHFKEPLEIGDSSLSNNEESNTTINVNYEDSIVTSKQPLPVPRNIHNNSIGDFGNTRNDGVTGEFDGDDYPHSIPMMETLKEKFGLTSFRPNQKQVINATLLGHDCFVLMPTGGGKSLCYQLPAILTPGVTIVISPLRSLMLDQVNKLLALDIPAAHLGSDVTEAKSNYVYDDLNQQEPTIKLLYVTPEKIQSSPKFQETLTRLYEKQKISRFVIDEAHCVSQWGHDFRPDYQKLNLLRKKFPNVTLMALTATATKRVRTDILYQLKVRECKWFLSSFNRPNLTYTILTKKQNLINKDIAELIKTKYYQQCGIVYCLSCKDCDSMANALKEMKVSSKAYHGKLVDAERVNVQTQWLAGTIKVICATLAFGMGVDKGDVRFVIHHSVPKSIEAYYQETGRAGRDGKPADCILFYCYRDIVRQRNLYYRDRSLTENSKNVHDDNLTRINELCEDVLECRRTFVLRYLGETFQSDNCGPMLCDNCQRRPTNEFIDVTDVCREIYFLRCNQWGKGDAVRLLQLLLMKKILAEKTRMNKDIANNYLIRGADVYKLSSKSEPIIFYKRPHTTKKPATAVAAPLVQDVDQQIKQVEDKAYEELVEEIKNIAKESDVALWTLYPQMALRYMAEKLPETAEEMLKIPHVTNANYNKYGFRLLPITLKYSMERLKLEMTLQDQEISEAFDDEEPSAGPSTVSPRVSFRNNRSYRSRKSKSARAGVKKPYKKDNKAFKKFKKGATGTMPRPGTFL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: