MonarchBase - Protein-coding gene

DPOGS208881
Transcript	DPOGS208881-TA	1212 bp
Protein	DPOGS208881-PA	403 aa
Genomic position	DPSCF300009 - 1265045-1267380
RNAseq coverage	3385x (Rank: top 4%)

Annotation
*Heliconius*	HMEL003891	0.0	86.08%
*Bombyx*	BGIBMGA012541-TA	0.0	87.10%
*Drosophila*	Droj2-PA	2e-136	61.38%
EBI UniRef50	UniRef50_Q8WW22	4e-141	63.95%	DnaJ homolog subfamily A member 4 n=217 Tax=Opisthokonta RepID=DNJA4_HUMAN
NCBI RefSeq	NP_001040292.1	0.0	87.34%	DnaJ (Hsp40) homolog 2 [Bombyx mori]
NCBI nr blastp	gi\|114053203	0.0	87.34%	DnaJ (Hsp40) homolog 2 [Bombyx mori]
NCBI nr blastx	gi\|114053203	0.0	87.56%	DnaJ (Hsp40) homolog 2 [Bombyx mori]

Group
Gene Ontology	GO:0031072	7.9e-32	heat shock protein binding
	GO:0006457	3.9e-22	protein folding
	GO:0051082	3.9e-22	unfolded protein binding
KEGG pathway	tca:660093	6e-173
	K09502 (DNAJA1)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[2-94] IPR001623	7.9e-32	Heat shock protein DnaJ, N-terminal
	[110-254] IPR008971	3.9e-22	HSP40/DnaJ peptide-binding
	[135-209] IPR001305	2.2e-19	Heat shock protein DnaJ, cysteine-rich domain
	[8-26] IPR003095	4.6e-19	Heat shock protein DnaJ
	[262-337] IPR002939	6.1e-19	Chaperone DnaJ, C-terminal
Orthology group	MCL11103		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208881-TA
ATGGTGAAAGAAACAACCTACTATGACATATTGGGTGTCAAACCCACCTGTACGACGGATGAGTTGAAGAAGGCATATAGAAAACTTGCACTTAAGTATCATCCTGATAAGAATCCTAATGAAGGAGAGCGCTTTAAACAAATCTCACAGGCTTATGAAGTACTTTCTAATCCAGACAAAAGAAGAATATATGATCAAGGTGGTGAACAGGCTTTGAAAGAAGGTGGTGGTGGAGGCAGTGGCTTCTCATCACCGATGGACTTGTTTGATATGTTCTTTGGCAGTGGATACAGTGGAGGAAGACGACGCGGTCGCGAAAGGAAAGGCAAAGATGTCATTCATCAACTATCTGTCACACTGGAAGAGCTTTACAAAGGGGCTGTTCGTAAGCTAGCCTTACAGAAGAATGTCATCTGTGAGAAATGTGAAGGTCGTGGAGGGAAGAAGGGTGCAGTGTTAGTATGCCCGACATGCCGAGGTACAGGAATGCAGGTTCAGATCCAACAACTGGGACCGGGAATGATCCAACAAATCCAAACAGTCTGCTCTGAATGCAGAGGTCAACGTGAAATCATAGATCCTAAAGATCGTTGCAAAGTTTGCCAGGGTCGTAAGACAGTACGAGATCGTAAAATCATTGAAGTGCATATAGACAAGGGTATGACAGACGGACAGAAGATTATGTTTAGCGGTGAGGGTGACCAGGAACCAGAGTTGGAGCCGGGTGATCTTATTATAGTATTAGATGAGAAGGAACATGAGGTTTTCAAACGTACTGGTAATGACCTCATTATAAGAATTAATATAGAATTGGTAGAGGCTCTGTGTGGGTTCCAGAAGGTAATAAGAACTTTAGATGATAGAGATATTGTGATAACTGTGTTACCGGGAGAAGTGACAAAGCATGGTGAAGTGAAGTGTGTTTTGAATGAAGGTATGCCCATGTACAAAAATCCATTTGAAAAAGGCCAGCTGATTATGCAGTTCTTGGTTAATTTCCCCAATCGCATTCCTCCTGAAGTCATTCCAGCATTGGAGAACTGCCTACCACCTAGACCTATGGTGGAGATTCCAGAGTTAGCGGAAGAATGTCAGCTCATGGATCTAGATCCGGAACAGGAGTCTCGCCGTCGACGAGCCCACCAGGGTAATGCATATGAAGAGGACGATGACCATTCGGGCGTCAATAGAGTTCAATGTGCTACTGGCTGA

Protein sequence:

>DPOGS208881-PA
MVKETTYYDILGVKPTCTTDELKKAYRKLALKYHPDKNPNEGERFKQISQAYEVLSNPDKRRIYDQGGEQALKEGGGGGSGFSSPMDLFDMFFGSGYSGGRRRGRERKGKDVIHQLSVTLEELYKGAVRKLALQKNVICEKCEGRGGKKGAVLVCPTCRGTGMQVQIQQLGPGMIQQIQTVCSECRGQREIIDPKDRCKVCQGRKTVRDRKIIEVHIDKGMTDGQKIMFSGEGDQEPELEPGDLIIVLDEKEHEVFKRTGNDLIIRINIELVEALCGFQKVIRTLDDRDIVITVLPGEVTKHGEVKCVLNEGMPMYKNPFEKGQLIMQFLVNFPNRIPPEVIPALENCLPPRPMVEIPELAEECQLMDLDPEQESRRRRAHQGNAYEEDDDHSGVNRVQCATG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: