MonarchBase - Protein-coding gene

DPOGS214371
Transcript	DPOGS214371-TA	2418 bp
Protein	DPOGS214371-PA	805 aa
Genomic position	DPSCF300020 + 800278-808506
RNAseq coverage	4586x (Rank: top 3%)

Annotation
*Heliconius*	HMEL005013	99.13%
*Bombyx*	BGIBMGA003985-TA	98.03%
*Drosophila*	TER94-PC	88.36%
EBI UniRef50	UniRef50_G6CWA0	100.00%	Transitional endoplasmic reticulum ATPase TER94 n=8 Tax=Endopterygota RepID=G6CWA0_DANPL
NCBI RefSeq	NP_001037003.1	98.01%	transitional endoplasmic reticulum ATPase TER94 [Bombyx mori]
NCBI nr blastp	gi\|112983322	98.01%	transitional endoplasmic reticulum ATPase TER94 [Bombyx mori]
NCBI nr blastx	gi\|112983322	98.01%	transitional endoplasmic reticulum ATPase TER94 [Bombyx mori]

Group
Gene Ontology	GO:0016787	2.4e-248	hydrolase activity
	GO:0005524	2.6e-46	ATP binding
	GO:0005488	2.3e-41	binding
	GO:0000166	1.5e-24	nucleotide binding
	GO:0017111	1.5e-24	nucleoside-triphosphatase activity
KEGG pathway	aga:AgaP_AGAP005630	0.0
	K13525 (VCP, CDC48)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[25-763] IPR005938	2.4e-248	ATPase, AAA-type, CDC48
	[239-368] IPR003959	2.6e-46	ATPase, AAA-type, core
	[20-104] IPR009010	2.3e-41	Aspartate decarboxylase-like fold
	[508-647] IPR003593	1.5e-24	ATPase, AAA+ type, core
	[23-104] IPR003338	1.5e-22	ATPase, AAA-type, VAT, N-terminal
	[125-187] IPR004201	2.7e-09	Cell division protein 48, Cdc48, domain 2
Orthology group	MCL11924		Single-copy universal gene

Nucleotide sequence:

>DPOGS214371-TA
ATGGCAGATAATAAGAGCCCTGATGATCTTTCTACCGCGATCCTGCGCCGTAAAGACAGGCCCAATCGTCTGATCGTCGAGGAGGCCGTCAGTGATGATAACTCGGTCGTCGCCCTATCACAGGGGAAAATGGAGCAGCTACAGTTATTCCGCGGTGACACTGTACTGCTTAAGGGCAAGCGTCGCAAGGAAACTGTATGCATCGTGCTCTCAGATGACAACTGCCCCGATGAGAAGATACGTATGAACCGTGTAGTTAGGAACAATCTGCGCGTTCGTTTGTCAGATGTGGTGTCTATAGCACCCTGTCCGTCAGTCAAATACGGCAAGCGTGTCCACATACTTCCAATTGATGATTCTGTTGAAGGCCTCACCGGTAATCTATTTGAGGTGTACTTGAAGCCTTACTTCATGGAGGCCTACCGTCCGATTCACCGTGACGACACGTTCATGGTGCGCGGTGGCATGAGAGCTGTGGAGTTCAAGGTGGTGGAGACAGACCCCGCTCCTTACTGTATCGTGGCCCCCGACACCGTCATTCATTGCGAAGGGGAACCTATTAAACGAGAAGAAGAGGAAGAAGCTCTCAACGCTGTCGGCTACGATGATATCGGCGGTTGTCGCAAGCAGTTGGCACAGATCAAGGAGATGGTGGAGCTGCCCCTGCGGCATCCCTCGCTGTTCAAAGCTATCGGCGTGAAACCTCCGCGCGGCATCCTCATGTACGGCCCCCCGGGGACAGGGAAGACGCTCATCGCTAGAGCCGTCGCCAATGAGACCGGTGCGTTCTTCTTCCTGATCAACGGCCCTGAGATCATGTCCAAGCTGGCGGGCGAATCTGAATCCAACCTGCGTAAGGCTTTCGAGGAGGCTGACAAGAATTCTCCAGCTATCATCTTCATAGATGAGTTGGATGCCATCGCTCCCAAACGAGAGAAGACACACGGGGAAGTCGAAAGAAGAATCGTGTCACAGCTGCTTACTCTTATGGATGGTATGAAGAAGTCGTCTCATGTGATAGTAATGGCCGCCACCAACCGTCCCAACTCGATCGACCCGGCGCTGCGGCGCTTCGGACGGTTTGATCGGGAGATAGACATCGGCATCCCTGACGCCACCGGGCGGCTCGAGATACTGCGCATTCACACCAAGAATATGAAGCTTGGAGACGACGTGGACCTAGAACAGATTGCAGCTGAATCTCATGGTCATGTGGGTGCCGATCTGGCTTCCCTGTGCTCGGAAGCAGCTCTGCAACAGATCAGAGAGAAGATGGACCTCATTGACCTGGAAGATGACCAGATTGATGCTGAAGTACTCAATTCCTTGGCTGTCTCCATGGATAACTTCCGTTATGCGATGACCAAATCCTCTCCATCGGCACTCCGTGAAACTGTGGTGGAAGTGCCCAACGTAACGTGGACTGACATCGGTGGTCTCCAGAACGTTAAGCGAGAGCTTCAAGAGCTGGTGCAGTATCCCGTGGAACATCCTGACAAGTTCCTTAAGTTCGGTATGCAGCCTTCCAGGGGTGTGCTGTTCTATGGGCCGCCGGGATGTGGTAAGACGTTGCTGGCTAAGGCGATTGCTAATGAGTGTCAAGCCAACTTCATCTCTGTCAAGGGACCAGAGTTACTCACTATGTGGTTTGGTGAATCCGAGGCCAATGTTAGAGACATCTTCGATAAGGCTCGTTCCGCGTCTCCGTGTGTGTTGTTCTTCGACGAGTTGGATTCCATCGCCAAGTCCCGCGGCGGGTCCGTGTCGGACGCCGGCGGCGCCGCCGACCGCGTCATCAACCAGATACTCACAGAGATGGACGGCATGGGCGCTAAGAAGAACGTGTTCATTATCGGTGCCACAAATCGTCCCGACATCATCGACCCGGCCATCCTCCGTCCCGGTCGTCTGGACCAGCTGATCTACATCCCTCTACCGGACGAGAAGTCCCGCGAGGCCATACTGAGGGCCAATCTCCGCAAGTCGCCCATAGCTAAGGACGTTGACCTATCCTACATCGCTAAGGTGACACAGGGCTTCAGTGGCGCTGATCTGACCGAGATCTGCCAGCGCGCCTGCAAGCTCGCCATCAGACAGGCCATCGAGGCGGAGATACACCGCGAGAGGGCGCGCCAGCAGTCACAACCCGCGGCCGTCATGGATATGGACGAAGAGGACCCGGTACCGGAGATCAGCCGCGCTCACTTCGAGGAGGCGATGAAGTTCGCGAGACGTTCTGTGTCCGACAACGACATCCGCAAGTACGAGATGTTCGCGCAGACGCTGCAACAGAGCAGGGGCTTCGGCACTAACTTCAGATTCCCTACAAGTGGTGCGTCAGCGGGCGGGACGGGAACGTCTGGGGGTGACCAGCCCACTTTCCAGGAGGAGGGGGGTGACGATGACCTCTATAGCTAA

Protein sequence:

>DPOGS214371-PA
MADNKSPDDLSTAILRRKDRPNRLIVEEAVSDDNSVVALSQGKMEQLQLFRGDTVLLKGKRRKETVCIVLSDDNCPDEKIRMNRVVRNNLRVRLSDVVSIAPCPSVKYGKRVHILPIDDSVEGLTGNLFEVYLKPYFMEAYRPIHRDDTFMVRGGMRAVEFKVVETDPAPYCIVAPDTVIHCEGEPIKREEEEEALNAVGYDDIGGCRKQLAQIKEMVELPLRHPSLFKAIGVKPPRGILMYGPPGTGKTLIARAVANETGAFFFLINGPEIMSKLAGESESNLRKAFEEADKNSPAIIFIDELDAIAPKREKTHGEVERRIVSQLLTLMDGMKKSSHVIVMAATNRPNSIDPALRRFGRFDREIDIGIPDATGRLEILRIHTKNMKLGDDVDLEQIAAESHGHVGADLASLCSEAALQQIREKMDLIDLEDDQIDAEVLNSLAVSMDNFRYAMTKSSPSALRETVVEVPNVTWTDIGGLQNVKRELQELVQYPVEHPDKFLKFGMQPSRGVLFYGPPGCGKTLLAKAIANECQANFISVKGPELLTMWFGESEANVRDIFDKARSASPCVLFFDELDSIAKSRGGSVSDAGGAADRVINQILTEMDGMGAKKNVFIIGATNRPDIIDPAILRPGRLDQLIYIPLPDEKSREAILRANLRKSPIAKDVDLSYIAKVTQGFSGADLTEICQRACKLAIRQAIEAEIHRERARQQSQPAAVMDMDEEDPVPEISRAHFEEAMKFARRSVSDNDIRKYEMFAQTLQQSRGFGTNFRFPTSGASAGGTGTSGGDQPTFQEEGGDDDLYS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: