MonarchBase - Protein-coding gene

DPOGS203261
Transcript	DPOGS203261-TA	2241 bp
Protein	DPOGS203261-PA	746 aa
Genomic position	DPSCF300229 - 54306-60878
RNAseq coverage	596x (Rank: top 21%)

Annotation
*Heliconius*	HMEL015360	95.83%
*Bombyx*	BGIBMGA000447-TA	93.81%
*Drosophila*	comt-PA	73.95%
EBI UniRef50	UniRef50_P46461	73.95%	Vesicle-fusing ATPase 1 n=17 Tax=Opisthokonta RepID=NSF1_DROME
NCBI RefSeq	XP_001120201.1	77.39%	PREDICTED: similar to Vesicular-fusion protein Nsf1 (N-ethylmaleimide-sensitive fusion protein 1) (NEM-sensitive fusion protein 1) (dNsf-1) (Protein comatose) isoform 2 [Apis mellifera]
NCBI nr blastp	gi\|6580808	95.44%	N-ethylmaleimide sensitive fusion protein [Manduca sexta]
NCBI nr blastx	gi\|6580808	95.44%	N-ethylmaleimide sensitive fusion protein [Manduca sexta]

Group
Gene Ontology	GO:0005524	3.6e-39	ATP binding
	GO:0005488	4.4e-32	binding
	GO:0000166	1.6e-17	nucleotide binding
	GO:0017111	1.6e-17	nucleoside-triphosphatase activity
KEGG pathway	ame:725680	0.0
	K06027 (NSF)	maps->	Vasopressin-regulated water reabsorption
InterPro domain	[256-396] IPR003959	3.6e-39	ATPase, AAA-type, core
	[4-84] IPR009010	4.4e-32	Aspartate decarboxylase-like fold
	[252-399] IPR003593	1.6e-17	ATPase, AAA+ type, core
	[5-85] IPR003338	9.7e-16	ATPase, AAA-type, VAT, N-terminal
	[111-157] IPR004201	9.3e-11	Cell division protein 48, Cdc48, domain 2
Orthology group	MCL11186		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203261-TA
ATGTCTTCAATGCGCATGAAGGCAGCCAAATGTCCATCAGACGAACTGGCTATCACCAACTGTGCTCTAGTCAACCCGGACGATTTCCACAGTGATGTTAAGCATATTGAGATATCAACAGCTCCATCTCAACACTTTGTATTCAGTATAAGATTTTACAGTGGAGTTGATAGAGGCACCGTGGGATTTTCTGCTCCACAAAGAAAATGGGCTACTCTGTCTATTGGACAGACTATCGAAGTCAAACCATTCAAGCCACAGAGTGCGGAATGTTTGTGCAGTGTCACTCTGGAGGCTGATTTTATGCTAAAGAAAACAACCTCCATGGATCCCTATGATTCAGAGCAGATGGCCAGAGACTTCCTCATCCAGTTCTCAAACCAAGTGTTCACCGTTGGACAGCAACTTGCTTTCTCATTCCAAGAGAAAAAAGTACTCTCTTTGATTGTCAAGAACTTGGAAGCGGTGGACGTGCAAGCGCTGGCCGCTGGTTCGAACGCTGTACCTCGTCGGGTCCGTATGGGTCGTCTGCTACCAGACGCCTGTATACAGTTCGACAAGGCCGAGAACTCCTCGCTCAACCTCGTGGGAAAAGCTAAGGGGAAGCAGCCTCGTCAGTCGATCATAAATCCTGATTGGGACTTCGGTAAGATGGGCATCGGCGGTCTGGACAAGGAGTTCAACGCTATCTTCAGGCGAGCGTTCGCGTCACGAGTGTTCCCACCGGAAGTGGTCGAACAATTAGGCTGCAAACACGTGAAAGGCATCCTGCTATACGGCCCGCCCGGTACCGGTAAAACTTTGATGGCCCGACAGATCGGTAAGATGTTGAACGCGAGGGAGCCTAAGATCGTTAATGGTCCCCAAATATTGGACAAATACGTCGGCGAGAGTGAGGCCAACATTCGCAGGCTGTTTGCTGACGCCGAGGAAGAAGAGAAGAGGTGTGGTCCGAACAGCGGCCTGCACATTATCATCTTCGACGAAATCGACGCTATTTGTAAGGCGAGAGGCTCAGTGGGCGGCAACACGGGCGTCCATGACACCGTCGTCAACCAGCTGCTCTCCAAAATAGATGGTGTGGACCAATTGAACAATATTTTGGTCATTGGTATGACTAACAGGAGGGACATGATAGATGAAGCGCTCATGAGACCCGGGCGACTTGAAGTACAGATGGAGATAGGTTTGCCAGACGAGAAAGGAAGGGTGCAGATATTGAACATCCACACCAAGCGGATGAAAGAGTACAAGAAGATCTCCGAGGACGTCGATAATAAGGAGTTGGCAGCCCTGACGAAGAACTTCTCCGGAGCTGAACTTGAAGGTTTGGTTAGGGCTGCGCAGTCCACGGCCATGAACAGACTCATAAAGGCATCCAGTAAAGTGGAAGTAGATCCTGAAGCCATGGAAAAACTCATGGTGGAGAGAGGAGATTTCCTACATGCCTTGGAAAATGATATTAAGCCGGCATTTGGTACAGCTGCCGAAGCCCTGGAACACTTCCTGGCTCGAGGCGTCATCAACTGGGGTCTCCCTGTGTCTTCGTTGTTGGAGGACGGACAACTTTATATACAGCAGTCTAGAGCCACTGAAGCCAGCGGCCTAGTATCCGTGCTGTTAGAAGGTCCTCCAAACAGCGGTAAGACGGCCCTAGCAGCTCAGTTGGCCAAGATGTCTGACTTCCCGTTCGTGAAGGTTTGCTCTCCGGAAGACATGGTCGGCTTCACTGAGACAGCCAAGTGCTTGCAGATAAGAAAGTACTTCGACGACGCATACCGCTCCAGCCTGTCCTGTATATTGGTGGACAATATCGAGAGGCTGTTGGACTACGGTCCTATAGGGCCGCGGTATTCCAACCTCACGCTGCAAGCCCTGTTGGTGCTTCTCAAGAAACAACCTCCCAAAGGACGTAAACTGCTCATACTGTGTACCAGCAGTCGCAGACAAGTCCTCGAAGACATGGAAGTTCTATCAGCGTTCACGGGTGTACTCCACGTTCCTAACCTGTCTCAACCTGAGCACGTGATGACAGTGCTTGAAGAAAGCGACGCCTTCACTAAACGCGATCTGGCCAAAATACAGCACGACCTGAGAGGGGCCAAAATTTTCATCGGGATCAAAAAGCTGTTGGCGTTGATTGACATGGTGAAGCAAACGGACGAAGAGTCCAGGGTGTTCAAGTTCCTGACGAAGATGCAGGAGGAGGGCAGCCTTGACCTGGGCACTACCATACAATAA

Protein sequence:

>DPOGS203261-PA
MSSMRMKAAKCPSDELAITNCALVNPDDFHSDVKHIEISTAPSQHFVFSIRFYSGVDRGTVGFSAPQRKWATLSIGQTIEVKPFKPQSAECLCSVTLEADFMLKKTTSMDPYDSEQMARDFLIQFSNQVFTVGQQLAFSFQEKKVLSLIVKNLEAVDVQALAAGSNAVPRRVRMGRLLPDACIQFDKAENSSLNLVGKAKGKQPRQSIINPDWDFGKMGIGGLDKEFNAIFRRAFASRVFPPEVVEQLGCKHVKGILLYGPPGTGKTLMARQIGKMLNAREPKIVNGPQILDKYVGESEANIRRLFADAEEEEKRCGPNSGLHIIIFDEIDAICKARGSVGGNTGVHDTVVNQLLSKIDGVDQLNNILVIGMTNRRDMIDEALMRPGRLEVQMEIGLPDEKGRVQILNIHTKRMKEYKKISEDVDNKELAALTKNFSGAELEGLVRAAQSTAMNRLIKASSKVEVDPEAMEKLMVERGDFLHALENDIKPAFGTAAEALEHFLARGVINWGLPVSSLLEDGQLYIQQSRATEASGLVSVLLEGPPNSGKTALAAQLAKMSDFPFVKVCSPEDMVGFTETAKCLQIRKYFDDAYRSSLSCILVDNIERLLDYGPIGPRYSNLTLQALLVLLKKQPPKGRKLLILCTSSRRQVLEDMEVLSAFTGVLHVPNLSQPEHVMTVLEESDAFTKRDLAKIQHDLRGAKIFIGIKKLLALIDMVKQTDEESRVFKFLTKMQEEGSLDLGTTIQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: