MonarchBase - Protein-coding gene

DPOGS213901
Transcript	DPOGS213901-TA	1554 bp
Protein	DPOGS213901-PA	517 aa
Genomic position	DPSCF300218 - 295631-297523
RNAseq coverage	18x (Rank: top 80%)

Annotation
*Heliconius*	HMEL006064	96.06%
*Bombyx*	BGIBMGA004614-TA	90.95%
*Drosophila*	Hsp68-PA	88.67%
EBI UniRef50	UniRef50_Q9U639	81.73%	Heat shock 70 kDa protein cognate 4 n=125 Tax=cellular organisms RepID=HSP7D_MANSE
NCBI RefSeq	NP_001037396.1	95.81%	heat shock protein 70 [Bombyx mori]
NCBI nr blastp	gi\|224999283	96.55%	HSP70 [Spodoptera exigua]
NCBI nr blastx	gi\|224999283	96.55%	HSP70 [Spodoptera exigua]

Group
Gene Ontology	GO:0005524	1.7e-77	ATP binding
KEGG pathway	dmo:Dmoj_GI24163	0.0
	K03283 (HSPA1_8)	maps->	Endocytosis
			MAPK signaling pathway
			Spliceosome
			Antigen processing and presentation
			Protein processing in endoplasmic reticulum
InterPro domain	[1-515] IPR001023	0	Heat shock protein Hsp70
	[3-407] IPR013126	7.4e-198	Heat shock protein 70
Orthology group	MCL10014		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213901-TA
ATGCCCGCTATTGGTATTGATCTCGGTACAACTTACTCCTGCGTTGGTGTTTGGCAACATGGAAATGTCGAAATCATCGCAAACGACCAAGGCAACAGGACGACTCCGTCTTACGTCGCATTCACAGATACGGAGAGATTGATCGGCGACGCTGCTAAGAACCAGGTGGCCCTGAACCCCAACAACACAGTCTTCGACGCGAAACGGTTAATCGGCCGCAAATTCGATGATCCTAAGATACAAGCCGACATGAAGCACTGGCCCTTCAAAGTGGTCAACGACTGTAGCAAACCGAAAATCCAAGTGGAGTTCAAGGGCGAGACGAAGAGATTCGCCCCCGAGGAAATCAGCAGCATGGTGTTGGTCAAGATGAAGGAGACCGCGGAGGCGTATCTCGGTACAACGGTCCGCGACGCCGTAGTCACAGTTCCGGCTTACTTCAACGACTCCCAGCGTCAAGCGACGAAGGATGCCGGAGCGATCGCAGGTCTGAACGTTCTGCGCATCATCAACGAGCCCACAGCCGCCGCACTCGCCTACGGCCTGGACAAGAACCTCAAAGGCGAAAGGAACGTGTTAATCTTCGATCTCGGCGGCGGCACCTTCGACGTGTCCATTCTGACCATCGACGAGGGCTCGCTGTTCGAGGTGAAGGCTACCGCTGGAGACACGCATCTCGGAGGCGAGGACTTTGACAACAGGCTGGTGAATCATTTCGCTGAAGAATTCGTCAGAAAGTACAAGAAAGACCTTCGAGCCAACCCTCGCGCGTTGCGACGCCTCCGCACCGCCGCCGAGCGCGCCAAGAGGACGCTGTCGTCCAGCAGCGAAGCGACGATCGAAATAGACGCTCTGTACGAGGGAATCGACTTCTACACCCGGGTCTCCCGCGCCAGGTTCGAGGAACTCAACTCCGACCTGTTCCGCGGTACCCTGGAGCCGGTCGAGAAGGCTCTGAAAGATGCGAAGATGGACAAGAGTCAGATACACGACGTGGTGCTCGTCGGTGGGTCGACTCGCATCCCGAAGGTGCAGAGCCTACTGCAGAACTTCTTCTGCGGCAAAAAGCTTAACCTGTCCATCAATCCGGACGAAGCGGTGGCCTACGGCGCGGCGGTCCAGGCGGCCATCCTGAGCGGAGAGAGCGACTCGAAGATCCAGGACGTGTTGCTCGTGGACGTGGCTCCGCTGTCTTTGGGCATCGAGACCGCCGGAGGGGCGGAACGCTACAAGGAAGAGGACGAGCGGCAGAGGCAGAGGGTGGCGGCGAGGAACCAGCTGGAGTCGTACGTGTTCAGTGTGAAGCAGGCCTTGGAGGACGCCGGAGAGAAGCTGAGCGACGGAGACAAGAGCGCGGCGAGGAACGAGTGTGACGAGGCGCTGAGGTGGCTGGACAACAACACGCTGGCCGAGAAGGAGGAGTACGAGCACCGGCTGAAGGACCTGCAGAGAGTATGTTCGCCCATCATGAGCAAGCTACACGGCGCGGGGGCGACGACCGGGCCGGCCGGAGCGGCGCGGGGCAGCGGACCCACGGTGGAGGAAGTGGACTAG

Protein sequence:

>DPOGS213901-PA
MPAIGIDLGTTYSCVGVWQHGNVEIIANDQGNRTTPSYVAFTDTERLIGDAAKNQVALNPNNTVFDAKRLIGRKFDDPKIQADMKHWPFKVVNDCSKPKIQVEFKGETKRFAPEEISSMVLVKMKETAEAYLGTTVRDAVVTVPAYFNDSQRQATKDAGAIAGLNVLRIINEPTAAALAYGLDKNLKGERNVLIFDLGGGTFDVSILTIDEGSLFEVKATAGDTHLGGEDFDNRLVNHFAEEFVRKYKKDLRANPRALRRLRTAAERAKRTLSSSSEATIEIDALYEGIDFYTRVSRARFEELNSDLFRGTLEPVEKALKDAKMDKSQIHDVVLVGGSTRIPKVQSLLQNFFCGKKLNLSINPDEAVAYGAAVQAAILSGESDSKIQDVLLVDVAPLSLGIETAGGAERYKEEDERQRQRVAARNQLESYVFSVKQALEDAGEKLSDGDKSAARNECDEALRWLDNNTLAEKEEYEHRLKDLQRVCSPIMSKLHGAGATTGPAGAARGSGPTVEEVD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: