MonarchBase - Protein-coding gene

DPOGS205238
Transcript	DPOGS205238-TA	2055 bp
Protein	DPOGS205238-PA	684 aa
Genomic position	DPSCF300265 + 271108-282410
RNAseq coverage	5661x (Rank: top 2%)

Annotation
*Heliconius*	HMEL002731	0.0	92.44%
*Bombyx*	BGIBMGA007950-TA	4e-168	51.88%
*Drosophila*	Hsc70-5-PA	0.0	83.44%
EBI UniRef50	UniRef50_P29845	0.0	83.44%	Heat shock 70 kDa protein cognate 5 n=843 Tax=root RepID=HSP7E_DROME
NCBI RefSeq	NP_001153520.1	0.0	82.24%	heat shock protein cognate 5 [Apis mellifera]
NCBI nr blastp	gi\|223036830	0.0	91.82%	heat shock protein 70 [Spodoptera exigua]
NCBI nr blastx	gi\|223036830	0.0	91.82%	heat shock protein 70 [Spodoptera exigua]

Group
Gene Ontology	GO:0005524	0	ATP binding
	GO:0006457	6.3e-278	protein folding
	GO:0051082	6.3e-278	unfolded protein binding
KEGG pathway	ame:408605	0.0
	K04043 (dnaK)	maps->	RNA degradation
InterPro domain	[42-682] IPR001023	0	Heat shock protein Hsp70
	[58-656] IPR012725	6.3e-278	Chaperone DnaK
	[58-656] IPR013126	4.1e-267	Heat shock protein 70
Orthology group	MCL16081		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205238-TA
ATGTTGACCGCGACGCGTGTGGTGAGCCGAAAGGCGTTAGAGTGCTCCGGGACCGAATTCTACACACACAGAAATTTCTCCACATTCCTCAGAAGTACCGCAGCCCCCACAGTTCCAATCTACCAACGTCATGTGCAACACAGGCACAAATCTGAGGGTGTCAGGGGCGCGGTCATCGGCATTGACTTGGGCACAACCAACTCATGTGTGGCCGTCATGGAAGGAAAGACCCCGAAGGTGGTAGAAAACACAGAGGGATCAAGAACAACACCATCACATGTGGCGTTCAGTAAGGAGGGTGAGAGGCTGGTGGGTATGCCGGCTAAGAGGCAGGCTGTCACTAACAGCGGCAACACCTTCTATGCAACCAAGAGACTGATTGGAAGAAGATTTGACGATCCAGAAGTACAGAAAGATATGAAGAATCTTTCATATAAAGTTGTCAAAGCATCCAACGGCGACGCCTGGGTCCAAGGCAGCGATGGCAAAGTGTACTCTCCTAGTCAGATTGGTGCCTTCGTACTGATGAAGATGAGAGAGACGGCAGAGGCCTATCTCAATACTAATGTAAAGAACGCCGTAGTCACAGTACCCGCCTACTTCAACGATTCCCAAAGACAAGCCACCAAAGACGCCGGTCAAATCGCCGGTCTCAATGTACTCCGTGTGATCAACGAGCCGACTGCAGCAGCCCTCGCCTACGGGATGGACAAGACCGACGACAAAATTATCGCTGTATACGATCTGGGCGGTGGCACCTTCGATATATCTGTGCTGGAGATACAGAAAGGGGTGTTTGAGGTCAAGTCCACCAACGGCGACACACTCCTCGGTGGTGAGGACTTTGACAATGTCATTGTCAATTTCCTTGTGGACGAATTCAAACGTGATCAAGGTCTGGACATCCGCAAAGACGCGATGGCCATGCAGAGACTGAAGGAGGCTGCTGAGAAAGCAAAGATTGAACTCTCGGGCTCATTGCAGACGGACATCAACCTGCCGTACCTCACTATGGATTCATCGGGACCGAAACACATGAATCTCAAGATGACACGTTCCAAGCTGGAGTCATTAGTGGAGGGTCTCATCAAGAGGACGGTGAGCCCTTGCCAGAAGGCCCTTCAGGATGCGGAGGTCGCACGAGCTGATGTTGGGGAGGTGCTGCTTGTGGGGGGGATGACTAGGATGCCCAAGGTTCAGCAGACGGTGCAGGAGATCTTCGGTAGGGCTCCGTCGCGAGCTGTCAACCCTGACGAGGCTGTGGCCGTGGGCGCTGCGGTCCAGGGCGGAGTGCTGGCCGGTGACGTCACTGACATCCTACTCCTCGACGTGACACCCCTGTCCCTCGGCATAGAGACGCTCGGAGGAGTGTTCACAAAGCTCATCACAAGGAACACAACCATCCCGACCAAGAAGAGTCAGGTGTTCTCCACAGCCGCCGACGGGCAGACCCAGGTGGAGATCAAAGTGCATCAGGGTGAACGTGAGATGGCCTCGGACAACAAGCTGTTGGGGCAGTTCTCGTTGGTTGGTATACCACCAGCGCCGAGGGGTGTTCCGCAGATTGAGGTGACGTTCGACATTGACGCCAACGGTATCGTGCATGTATCAGCCAGGGACAAGGGTACCGGCAAGGAGCAGCAGATCGTCATCCAATCGTCCGGTGGTCTGTCGAAGGATGAGATCGAGAACATGGTGAAGGCGGCTGAGCAGTTCGCAGCGGCGGATAAGACCAGGCGAGAACGGGTGGAGGCTTGCAACCAGGCGGAGGGAGTGCTCCACGACACAGAGACCAAGATGGACGAATACAAGGCACAGCTACCGCAGGACGAGTGCGACAAGCTTCGCGAGGAAATGGCTAAGCTGAGAGATCTGCTCGCTCAGAAGGACTCCGTTGAACCTGAACCAGTTAGACAAGCGACGGCGTCGTTACAGCAAGCCAGTCTCAAGCTGTTCGAGCAAGCCTACAAGAAGATGGCGGCCGAGCGCGAAGGACAGTCCCAGACCCAGTCCCAGGCGGAGACGGACGAAAAGAAAGAGGAAAAGAAGAATTGA

Protein sequence:

>DPOGS205238-PA
MLTATRVVSRKALECSGTEFYTHRNFSTFLRSTAAPTVPIYQRHVQHRHKSEGVRGAVIGIDLGTTNSCVAVMEGKTPKVVENTEGSRTTPSHVAFSKEGERLVGMPAKRQAVTNSGNTFYATKRLIGRRFDDPEVQKDMKNLSYKVVKASNGDAWVQGSDGKVYSPSQIGAFVLMKMRETAEAYLNTNVKNAVVTVPAYFNDSQRQATKDAGQIAGLNVLRVINEPTAAALAYGMDKTDDKIIAVYDLGGGTFDISVLEIQKGVFEVKSTNGDTLLGGEDFDNVIVNFLVDEFKRDQGLDIRKDAMAMQRLKEAAEKAKIELSGSLQTDINLPYLTMDSSGPKHMNLKMTRSKLESLVEGLIKRTVSPCQKALQDAEVARADVGEVLLVGGMTRMPKVQQTVQEIFGRAPSRAVNPDEAVAVGAAVQGGVLAGDVTDILLLDVTPLSLGIETLGGVFTKLITRNTTIPTKKSQVFSTAADGQTQVEIKVHQGEREMASDNKLLGQFSLVGIPPAPRGVPQIEVTFDIDANGIVHVSARDKGTGKEQQIVIQSSGGLSKDEIENMVKAAEQFAAADKTRRERVEACNQAEGVLHDTETKMDEYKAQLPQDECDKLREEMAKLRDLLAQKDSVEPEPVRQATASLQQASLKLFEQAYKKMAAEREGQSQTQSQAETDEKKEEKKN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: