MonarchBase - Protein-coding gene

DPOGS201010
Transcript	DPOGS201010-TA	1077 bp
Protein	DPOGS201010-PA	358 aa
Genomic position	DPSCF300147 + 166916-170952
RNAseq coverage	469x (Rank: top 26%)

Annotation
*Heliconius*	HMEL013788	7e-65	85.07%
*Bombyx*	BGIBMGA009099-TA	1e-160	75.93%
*Drosophila*	nmd-PA	4e-115	55.88%
EBI UniRef50	UniRef50_UPI00022C8E32	6e-128	60.92%	UPI00022C8E32 related cluster n=5 Tax=unknown RepID=UPI00022C8E32
NCBI RefSeq	XP_975024.1	1e-131	63.27%	PREDICTED: similar to no mitochondrial derivative CG5395-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91089723	2e-130	63.27%	PREDICTED: similar to no mitochondrial derivative CG5395-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91089723	4e-128	63.27%	PREDICTED: similar to no mitochondrial derivative CG5395-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005524	3.6e-33	ATP binding
	GO:0000166	3.9e-15	nucleotide binding
	GO:0017111	3.9e-15	nucleoside-triphosphatase activity
KEGG pathway	pic:PICST_33873	1e-69
	K01509 (E3.6.1.3)	maps->	Purine metabolism
InterPro domain	[112-241] IPR003959	3.6e-33	ATPase, AAA-type, core
	[108-246] IPR003593	3.9e-15	ATPase, AAA+ type, core
Orthology group	MCL12514		Single-copy universal gene

Nucleotide sequence:

>DPOGS201010-TA
ATGGTGGAAGGTTCAGCATTTACGCGGAACGATGTGTTCCAAATGGCTATTCGTGTTGCTTTTGTATCCGCGGTTACTTATTTCTCTATAAAATGGCTCGTCAATCAAATAGATCCGACTTCTAAGAGTCGAAAGAAAGCTGAAGAAAGAGCGCGGGAACAGTTACGCAAAATTGTAGGATTGAAATGTTTTTTTTTGTTTGTAAACAATGTTAATTGGAAGGATATAGCGGGTCTAGATCATCTCATCAATGAACTCCGTGAGACTGTTATTCTGCCGATACAGAAACGGGAGCTGTTTGCCGACAGTCGACTCACACAGCCACCTAAAGGTGTACTGTTGCATGGGCCACCCGGTTGCGGTAAAACTCTGATAGCCAAAGCTACGGCCAAGGAAGCCAACATGAGCTTCATAAACCTGGACGTGTCGCTGTTGACTGACAAATGGTACGGAGAAACACAGAAGCTGGCCGCCGCCGTGTTCAGCTTGGCCGTTAAATTACAACCTTGTATAGTTTTCATCGATGAGATTGAATCCTTTCTCCGGACCCGCACGGCTCATGACCATGAGGCCACAGCCATGATGAAGACACAGTTCATGTCGCTGTGGGACGGCCTGATCACCGACAACACGTGTAACGTTATTATCATGGGCGCTACGAACCGTCCCCAGGACTTGGACAAGGCGATCCAGCGTCGTATGCCGGCCACCTTCCATGTGCCGATGCCGAATCTCCAGCAGAGAGAGCACATCCTCCAGCTGATACTCAAATCAGAGCCCACAGCTGATGATATCGACTACGCCCGTCTAGCCTCGAGCACAGATGGATTCTCAGGCTCCGATCTTCACGAGCTCTGTCGCCAGGCGGCCGTCTACAGAGTTAGAGATCTGGCCAGGGAGGAGTTACAGAGGGAACAGTCAAAAACCAACAACACAAACTCAGATTCTGACGAGGAGTACTGTGATGCTGTCAGACCCATCACGATGGAGGATTTAAGGATGTCGCTTAGCAAGCTCAAGGAATCCAAGATACAGTGCGGATCACTGGCTCCCGGGATGAGAATTGAACTCGACTAG

Protein sequence:

>DPOGS201010-PA
MVEGSAFTRNDVFQMAIRVAFVSAVTYFSIKWLVNQIDPTSKSRKKAEERAREQLRKIVGLKCFFLFVNNVNWKDIAGLDHLINELRETVILPIQKRELFADSRLTQPPKGVLLHGPPGCGKTLIAKATAKEANMSFINLDVSLLTDKWYGETQKLAAAVFSLAVKLQPCIVFIDEIESFLRTRTAHDHEATAMMKTQFMSLWDGLITDNTCNVIIMGATNRPQDLDKAIQRRMPATFHVPMPNLQQREHILQLILKSEPTADDIDYARLASSTDGFSGSDLHELCRQAAVYRVRDLAREELQREQSKTNNTNSDSDEEYCDAVRPITMEDLRMSLSKLKESKIQCGSLAPGMRIELD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: