MonarchBase - Protein-coding gene

DPOGS210250
Transcript	DPOGS210250-TA	3267 bp
Protein	DPOGS210250-PA	1088 aa
Genomic position	DPSCF300196 + 687615-695212
RNAseq coverage	73368x (Rank: top 0%)

Annotation
*Heliconius*	HMEL014657	84.51%
*Bombyx*	BGIBMGA002381-TA	97.71%
*Drosophila*	Hsc70-4-PF	90.34%
EBI UniRef50	UniRef50_Q9U639	98.16%	Heat shock 70 kDa protein cognate 4 n=125 Tax=cellular organisms RepID=HSP7D_MANSE
NCBI RefSeq	NP_001036892.1	97.71%	heat shock cognate protein [Bombyx mori]
NCBI nr blastp	gi\|270015934	77.79%	hypothetical protein TcasGA2_TC002089 [Tribolium castaneum]
NCBI nr blastx	gi\|270015934	77.61%	hypothetical protein TcasGA2_TC002089 [Tribolium castaneum]

Group
Gene Ontology	GO:0005524	2.2e-87	ATP binding
KEGG pathway	api:100159065	0.0
	K03283 (HSPA1_8)	maps->	Endocytosis
			MAPK signaling pathway
			Spliceosome
			Antigen processing and presentation
			Protein processing in endoplasmic reticulum
InterPro domain	[435-1086] IPR001023	0	Heat shock protein Hsp70
	[442-1048] IPR013126	2.3e-278	Heat shock protein 70
	[1-421] IPR019395	7.3e-154	Transmembrane protein 161A/B
Orthology group	MCL10014		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210250-TA
ATGGTATCAGTGATACAGAAATTGGGAAATTATTCATTCGCAAGATGGTTACTGTGTTCCCAAGGATTATATCGATATCTTTATCCTGATAATAATGCACTGAAAACATTAGCTGGTGTTCCTAAGGATAAACCAAAAGGAAAGAAAACAAAAAGTGATTCGAATGGTAAGCCAGAAACGTTTCATGTGCCCCGAAGCCTAGAAATACAACTGGAAACTGCTCCTGTGACTCCACTAGACGTGGTTCATTTGAGATTTTATACAGAGTATATATGGATAGTAGATTTTTCTCTGTATACAGCCTTTGTTTATATTATGTCTGAGGTATACACTGCCTATTTCCCATTAAAAGATGAATTCAATCTCAGCATGGTATGGTGTCTACTGGTAGTGCTGTTTTCATTGTATCCTTTTTTAAATATGAACACAAAGATGCAGGATGGTTGTAGTAAAATCTTACTTTCACTGACCAAACAATATTTCACTAGTGATGAATCCATTGGTGAGCGTTCTACTTGCATAGTGTCATTCTGTGTGTTCCTACTTATAGCAATGATCATGTTAATAGTAGATGAGAGTATCTTAGAGGTTGGCGTGGATCCCGCTTATGATAGCTTTAATGAGAACGCTTCAAAGTTCCTGGAAAATCAAGGGTTGACTTCTGTAGGTCCAGCGTCTAAGTTGATACTGAAGTTCTCATTTGCTGTGTGGGCGGCTATCATTGGGACATTATTTACATTTCCCGGTCTTAGAGTGGCTAGGATGCATTGGGATTCATTAAGGTACTACTCTGAAAACAAAGTGAAGTCTCTTGTGCTAAACATAAACTTTGCAATGCCATTTGTTTTAGCACTATTATGGGTGCGGCCAGTCGCCAGATATTACTTGGCTGTCAGAGTGTTTAGTGGAATGAGTGGACCTATCATGAGCCCTCAGATGTTTGACACACTGCGCATAGTATTGGTCATTCTGACTGTGGTGTTAAGAGTGCTATTGATGCCACGTCAATTGCAGGCCTACCTTGACATGGCACAAAGGAGGTTGGATATACAAAGGAAAGAGGCCGGCAGAATTACTAATGTGGAACTGCAGACTAAGATAGCGTCAGTATTTTTCTACCTCTGTGTTGTAGCACTGCAGTATATATGTCCTATCATCATGTGTCTGTACCTGGCTCTGATGTATAAGACCCTCGGAGGGTATAGTTGGTCTTCTTTGATATATGAGACCGCGGAGAGTGAACCTGTTGTTGTTAATGTAGAAGGAATGGAGCAGTTTCAAATGGCTTGGGAAAACTTGAAAATGATGGCTGCCAAAGCACCCGCAGTAGGTATTGATCTGGGTACCACATACTCGTGCGTGGGAGTATTCCAGCACGGTAAGGTGGAAATCATCGCCAACGACCAGGGCAACAGGACTACGCCCTCTTATGTAGCGTTCACAGACACCGAGCGTCTCATCGGCGATGCCGCTAAGAACCAAGTGGCGATGAACCCTAACAACACTATTTTCGATGCCAAACGACTCATTGGCCGCAAGTTCGAGGACCTTACAGTGCAAGCTGACATGAAACACTGGCCATTCGAAGTGATCAGTGATGGAGGCAAACCAATGATCAAGGTACAATACAAAGGAGAAGACAAGACTTTCTTCCCTGAGGAAGTGAGCTCGATGGTGCTCACAAAGATGAAGGAAACAGCCGAGGCTTACCTCGGCAAAACGGTGCAAAATGCAGTTATAACGGTTCCAGCGTACTTCAACGACTCACAGCGACAGGCCACGAAAGATGCGGGTACCATCTCTGGCCTGAACGTTCTCCGTATCATCAACGAACCGACCGCTGCTGCGATTGCCTACGGTCTTGACAAGAAGGGAGGTGGAGAACGAAACGTCCTTATCTTCGATCTCGGCGGAGGCACCTTCGACGTGTCCATCCTCACCATCGAGGACGGTATCTTCGAAGTGAAGTCCACCGCCGGCGACACGCACTTGGGAGGTGAAGACTTCGACAACCGTATGGTCAACCACTTCGTACAGGAGTTCAAGAGGAAGTACAAGAAAGACCTCACCACCAACAAGAGGGCGCTCCGCAGACTGAGGACGGCCTGCGAGAGAGCGAAGAGGACTCTGTCCTCCTCGACCCAGGCCAGCATCGAAATCGATTCCCTGTTTGAGGGCATCGACTTCTACACTTCCATCACCAGGGCTCGTTTCGAAGAACTGAACGCTGATCTGTTCAGGTCTACCATGGAGCCCGTAGAGAAGTCTCTCCGCGACGCCAAAATGGACAAGTCCCAAATCCACGACATCGTGTTGGTGGGCGGGTCTACTCGCATTCCCAAGGTGCAGAAGCTCCTGCAAGACTTTTTCAACGGCAAGGAGCTGAACAAGTCCATCAACCCCGACGAGGCCGTAGCCTACGGAGCGGCGGTCCAGGCCGCCATCCTGCACGGTGATAAGTCGGAGGAGGTCCAGGATCTGCTGCTGCTGGACGTGACGCCGCTGTCGCTCGGTATCGAGACGGCCGGCGGAGTGATGACCACGCTCATCAAGAGGAACACCACCATCCCCACCAAGCAGACGCAGACCTTCACCACCTACTCCGACAACCAGCCCGGCGTGCTCATCCAAGTGTTCGAGGGCGAGCGTGCCATGACCAAGGACAACAACCTCCTCGGCAAGTTCGAGCTGACCGGCATCCCACCCGCGCCCCGCGGCGTGCCGCAGATCGAGGTCACCTTCGACATTGACGCCAACGGCATCCTGAACGTGTCCGCCGTGGAGAAGTCCACTAACAAGGAGAACAAGATCACCATCACCAACGACAAGGGCCGCCTGTCCAAGGAGGAGATCGAGCGGATGGTGAACGACGCCGAGAAGTACAGGAACGAGGACGAGAAGCAGAAGGAGACCATCCAGGCCAAGAACTCGCTGGAGTCGTACTGCTTCAACATGAAGTCCACCATGGAGGACGAGAAGCTCAAGGAGAAGATCTCTGACGCCGACAAGCAGACCATCCTCGACAAGTGCAACGACACCATCAAGTGGCTGGACTCCAACCAGCTGGCCGACAAGGAGGAGTACGAGCACAAGCAGAAGGAGCTGGAGGGCATCTGCAACCCCATCATCACCAAGATGTACCAGGGAGCCGGCGGTGTGCCCGGCGGTATGCCCGGCGGCATGCCCGGCTTCCCCGGAGGAGCGCCCGGAGCCGGAGGCGCAGCCCCCGGCGGCGGCGCCGGACCCACCATCGAAGAGGTCGACTAA

Protein sequence:

>DPOGS210250-PA
MVSVIQKLGNYSFARWLLCSQGLYRYLYPDNNALKTLAGVPKDKPKGKKTKSDSNGKPETFHVPRSLEIQLETAPVTPLDVVHLRFYTEYIWIVDFSLYTAFVYIMSEVYTAYFPLKDEFNLSMVWCLLVVLFSLYPFLNMNTKMQDGCSKILLSLTKQYFTSDESIGERSTCIVSFCVFLLIAMIMLIVDESILEVGVDPAYDSFNENASKFLENQGLTSVGPASKLILKFSFAVWAAIIGTLFTFPGLRVARMHWDSLRYYSENKVKSLVLNINFAMPFVLALLWVRPVARYYLAVRVFSGMSGPIMSPQMFDTLRIVLVILTVVLRVLLMPRQLQAYLDMAQRRLDIQRKEAGRITNVELQTKIASVFFYLCVVALQYICPIIMCLYLALMYKTLGGYSWSSLIYETAESEPVVVNVEGMEQFQMAWENLKMMAAKAPAVGIDLGTTYSCVGVFQHGKVEIIANDQGNRTTPSYVAFTDTERLIGDAAKNQVAMNPNNTIFDAKRLIGRKFEDLTVQADMKHWPFEVISDGGKPMIKVQYKGEDKTFFPEEVSSMVLTKMKETAEAYLGKTVQNAVITVPAYFNDSQRQATKDAGTISGLNVLRIINEPTAAAIAYGLDKKGGGERNVLIFDLGGGTFDVSILTIEDGIFEVKSTAGDTHLGGEDFDNRMVNHFVQEFKRKYKKDLTTNKRALRRLRTACERAKRTLSSSTQASIEIDSLFEGIDFYTSITRARFEELNADLFRSTMEPVEKSLRDAKMDKSQIHDIVLVGGSTRIPKVQKLLQDFFNGKELNKSINPDEAVAYGAAVQAAILHGDKSEEVQDLLLLDVTPLSLGIETAGGVMTTLIKRNTTIPTKQTQTFTTYSDNQPGVLIQVFEGERAMTKDNNLLGKFELTGIPPAPRGVPQIEVTFDIDANGILNVSAVEKSTNKENKITITNDKGRLSKEEIERMVNDAEKYRNEDEKQKETIQAKNSLESYCFNMKSTMEDEKLKEKISDADKQTILDKCNDTIKWLDSNQLADKEEYEHKQKELEGICNPIITKMYQGAGGVPGGMPGGMPGFPGGAPGAGGAAPGGGAGPTIEEVD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: