MonarchBase - Protein-coding gene

DPOGS214624
Transcript	DPOGS214624-TA	1749 bp
Protein	DPOGS214624-PA	582 aa
Genomic position	DPSCF300050 + 275116-285341
RNAseq coverage	364x (Rank: top 33%)

Annotation
*Heliconius*	HMEL006972	0.0	84.26%
*Bombyx*	BGIBMGA005075-TA	0.0	89.43%
*Drosophila*	spas-PA	2e-180	60.25%
EBI UniRef50	UniRef50_UPI00020643C5	0.0	62.33%	UPI00020643C5 related cluster n=3 Tax=unknown RepID=UPI00020643C5
NCBI RefSeq	XP_393080.3	0.0	61.38%	PREDICTED: similar to spastin CG5977-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|328788555	0.0	62.33%	PREDICTED: spastin [Apis mellifera]
NCBI nr blastx	gi\|328788555	0.0	62.37%	PREDICTED: spastin [Apis mellifera]

Group
Gene Ontology	GO:0005524	3.7e-36	ATP binding
	GO:0000166	2.1e-17	nucleotide binding
	GO:0017111	2.1e-17	nucleoside-triphosphatase activity
KEGG pathway
InterPro domain	[342-471] IPR003959	3.7e-36	ATPase, AAA-type, core
	[17-95] IPR007330	6.1e-22	MIT
	[338-474] IPR003593	2.1e-17	ATPase, AAA+ type, core
Orthology group	MCL13515		Single-copy universal gene

Nucleotide sequence:

>DPOGS214624-TA
ATGTCGTATATAAACAATGTAGGCCCCGGGGATCCTCTTCTTGCCAAACAAAAACATCATCATCGAAAAGCTTTTGAGTACATATCAAAAGCGTTGAAGATTGACGAAGAAAATGAGGGACAAAAAGAATTAGCAATAGAACTGTACAAGAAAGGTATCTATGAATTGGAGCGAGGGATTGCAGTAGACTGCTGGGGGGGTCGGGGCGACGCCTGGCAGAGGGCCCAAAGGCTCCATGATAAGATGAAAACCAATCTAGGCATGGCCAAGGATCGTTTACATTTCCTCGCCAACCTAGTCGCCCTCAGTAAGTTGGGGGTAGAGAGTGAGCCTGAGAGAAGTGAAAAAAGACCTACGGAGTCTCCTCTTAAAGTGAGAAGGCCATTAGAGAAGTCCAAGACAACGCTACTAGCACACACAGAAAGTAACAGTGGTCAAACGAAGCCACCAAATGAAGGGTCCGTGGGACGCGATGAGTCGGACACATTAGTTTCCGATCGAGTTGTCACCACAATGGGTTCAGGTTACGACAGACGAGCTCCGTCCGCCGATAACACGTTATTCGCAGGTCGTAAGCTGACGACCGCGGGTCGGAGGGTACCCGGCGGGGGTCCTCTGATGAAATCTCAGACCCTGCCGCGATCCATGGGCAGGTCTTCGTCACAGCCCAACAGCTCCAATGGCTACACCAGATACCCTGTGAAACCAGCATCAACACCGCCTGCTGTAAAACGACAGCTGTCGGTACCAGTGAACGGGTCTCCTGTTCGGCGTGCTGCAGGAGGGGGCTCGCAGCGCGGGACGCCCACCAGAAGTAGAACCCCGCAACCCACACTCGCAGTTCGGGGCGTGGACCCGAAACTCGTCCAATTGATATTGGACGAGATCGTTGAGGGAGGCCCTAAGGTTCATTGGGAAGATATCGCTGGGCAGGAGGCAGCAAAACAAGCGCTACAGGAAATGGTAGTGCTGCCGTCGCTCCGACCGGAACTGTTCACTGGTCTGAGATCACCGGCACGAGGTCTGCTGTTATTCGGTCCCCCCGGTAATGGTAAGACGTTGCTGGCTCGATGCGTGGCGGCGGAGTGTTCCGCCACGTTTTTCTCGATATCGGCCGCGTCACTCACCAGCAAGTATGTGGGTGACGGGGAGAAGATGGTGAGGGCGCTGTTCCAGGTGGCCAGGGAACTACAGCCATCGATAATCTTCGTGGACGAAGTGGACTCGTTGCTTTGCGAGCGATCGACGGGCGAGCATGAGGCGTCCAGGAGATTGAAGACTGAGTTCTTGGTGGAATTCGACGGCCTGCCAGCCGCCGGCGCTGACAGGGTCATTGTGATGGCGGCCACCAACCGCCCACAAGAGCTGGACGAAGCTGCTCTCAGACGGTTCCCCAAGCGTGTGTACGTATCATTACCTGATAGCCGCACACGCGGGGCCCTGCTCCGGAGGGTGTTGACGAGGGGTGCTGCGGCGGCCGCGATCAGTGACGACGAGCTGGCGCGCCTCGCCGCCCTCACCGATGGCTACTCCGGCAGCGACCTCACCGCCCTCTGCCGGGACGCCGCTCTGGGACCCATACGGGAGTTAGACCCGGAGGAAGTGAAATGCTTGGACCTGTCGCTGGTTCGTAGCATCACGTTCCAGGACTTCATGGACGCTCTCAAGCGGATCCGACCTTCGGTGTCACCTCTCAGCCTCGTGGGCTACGAGAAGTGGTCCGTGCAGTACGGGGAACTGGGAGTGTGA

Protein sequence:

>DPOGS214624-PA
MSYINNVGPGDPLLAKQKHHHRKAFEYISKALKIDEENEGQKELAIELYKKGIYELERGIAVDCWGGRGDAWQRAQRLHDKMKTNLGMAKDRLHFLANLVALSKLGVESEPERSEKRPTESPLKVRRPLEKSKTTLLAHTESNSGQTKPPNEGSVGRDESDTLVSDRVVTTMGSGYDRRAPSADNTLFAGRKLTTAGRRVPGGGPLMKSQTLPRSMGRSSSQPNSSNGYTRYPVKPASTPPAVKRQLSVPVNGSPVRRAAGGGSQRGTPTRSRTPQPTLAVRGVDPKLVQLILDEIVEGGPKVHWEDIAGQEAAKQALQEMVVLPSLRPELFTGLRSPARGLLLFGPPGNGKTLLARCVAAECSATFFSISAASLTSKYVGDGEKMVRALFQVARELQPSIIFVDEVDSLLCERSTGEHEASRRLKTEFLVEFDGLPAAGADRVIVMAATNRPQELDEAALRRFPKRVYVSLPDSRTRGALLRRVLTRGAAAAAISDDELARLAALTDGYSGSDLTALCRDAALGPIRELDPEEVKCLDLSLVRSITFQDFMDALKRIRPSVSPLSLVGYEKWSVQYGELGV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: