MonarchBase - Protein-coding gene

DPOGS214147
Transcript	DPOGS214147-TA	1482 bp
Protein	DPOGS214147-PA	493 aa
Genomic position	DPSCF300014 - 835683-838734
RNAseq coverage	1433x (Rank: top 9%)

Annotation
*Heliconius*	HMEL015639	0.0	86.84%
*Bombyx*	BGIBMGA006193-TA	0.0	80.57%
*Drosophila*	Tpr2-PA	3e-135	49.28%
EBI UniRef50	UniRef50_Q2F608	0.0	80.36%	DNAJ9 n=13 Tax=Bilateria RepID=Q2F608_BOMMO
NCBI RefSeq	NP_001040185.1	0.0	80.36%	DnaJ (Hsp40) homolog 9 [Bombyx mori]
NCBI nr blastp	gi\|378465918	0.0	80.57%	DnaJ-9 [Bombyx mori]
NCBI nr blastx	gi\|378465918	0.0	80.97%	DnaJ-9 [Bombyx mori]

Group
Gene Ontology	GO:0031072	4.3e-30	heat shock protein binding
	GO:0005488	3.3e-27	binding
	GO:0006457	7.3e-20	protein folding
	GO:0051082	7.3e-20	unfolded protein binding
	GO:0005515	7.9e-07	protein binding
KEGG pathway
InterPro domain	[369-490] IPR001623	4.3e-30	Heat shock protein DnaJ, N-terminal
	[253-373] IPR011990	3.3e-27	Tetratricopeptide-like helical
	[379-397] IPR003095	7.3e-20	Heat shock protein DnaJ
	[290-323] IPR001440	7.9e-07	Tetratricopeptide TPR-1
	[59-91] IPR013105	1.1e-06	Tetratricopeptide TPR2
	[59-92] IPR019734	6.5e-06	Tetratricopeptide repeat
Orthology group	MCL11963		Single-copy universal gene

Nucleotide sequence:

>DPOGS214147-TA
ATGGCTGAGCCAGAAGTAGTGGATTTGGATCTAACAATCGATGATTTAGTTCCCAAAAGTCCAGAAAGACTGGCTGAGGAAAAAAAGGAGAGCGGAAACCATCTCTATAAATTCAAAAATTATAAGGGGGCATTGGCCATGTATGAAGATGCAATCAAACTCTGTCCTGAAAATGCAGCCTATTATGGCAACAGATCTGCCTGCTACATGATGCTGGGGATGTATAAAAAAGCTTTAGAGGATGCTCAAAAAGCTGTAGCTCTGGACCCAACATTCACTAAAGGATATATTCGTATGGCTAAATGTCATATTGCTGTAGGTGATATATCTGGTGCAGAACAGGCGGTTCGTAGTGCAAGCGAACTCGGTGGGCCAGATTGTGCATCGAACGAACGTCGTGCATTAGAATCACTGCGACGGTTACATGAAGACGCACAGCGTGCCATGGAGGCAGGAGACTACCGTCGTGTGGTCTTCTGCATGGACCGCTGTTTAGAATACAGTCCTTCAAGTATAAAGGCAAAACTTATCAAAGCCGAGTGCCTTGCAATGATTGGACGCTGTCAGGAAGCTCAGGAAATAGCAAATGATTCACTAAGATTTGATAGTTTAGACACAGAGGCAATATATGTACGTGGGTTGTGCCTTTATTTTGAGGACAAAGACGAGCAAGCCTTCAAACACTTCCAGCAGGTTTTGAGACTTGCACCAGATCACAAGAAATCCCTTGAGACTTATAAAAAGGCCAAGCTACTAAAACAAAAGAAAGAGGAAGGCAATGAGGCGTTTAAAATGGGTAGATGGCAACAAGCTTTAAATCTGTATAACGAAGCACTGACTATTGATAAAAATAACAGAAAAGTCAACGCCAAACTATATTTTAATAAAGCCACTGTGTGCTCAAAGTTGAATCAAATAGAAGAAGCAGCAGAGGCTTGCACAGCCGCATTGGAGTTAGATGAGAACTATGTTAAAGCTTTGTTGCGTCGTGCCAAATGTTACGCCGAACTGGGGAATCACGAAGACGCTGTCAAGGACTACGAGAAGCTTTATAAGATCGACAAAAATAAGGAACACAAACAGTTACTCCACGAGGCAAAATTGGCTTTAAAGAAATCCAAACGCAAAGACTACTATAAGATTTTGGGCATTGAAAAAACAGCATCAGAAGACGATATCAAGAAAGCTTATAGAAAGCGCGCTCTAGTTCACCATCCGGACAGACACGCGGGGGCTCCGGACAACGAGCGCAGGGAACAGGAGCGTCGCTTCAAGGAAGTGGGGGAGGCGTATGAAGTGCTCAGTGACCCCAAGAAACGAGCCCGTTACGATCACGGACAGGACCTTGATGATGGTTCCGGTGGTATTAATATTGATCCAAATATGATGTTCCAAACCTATTTTAACGGCGGTGGACAAGGTTTTGACTTTTCTTCAGGTGGAGGCTTCCCGGGATCAGCTTTTAGCTTTCAATTTGGATAG

Protein sequence:

>DPOGS214147-PA
MAEPEVVDLDLTIDDLVPKSPERLAEEKKESGNHLYKFKNYKGALAMYEDAIKLCPENAAYYGNRSACYMMLGMYKKALEDAQKAVALDPTFTKGYIRMAKCHIAVGDISGAEQAVRSASELGGPDCASNERRALESLRRLHEDAQRAMEAGDYRRVVFCMDRCLEYSPSSIKAKLIKAECLAMIGRCQEAQEIANDSLRFDSLDTEAIYVRGLCLYFEDKDEQAFKHFQQVLRLAPDHKKSLETYKKAKLLKQKKEEGNEAFKMGRWQQALNLYNEALTIDKNNRKVNAKLYFNKATVCSKLNQIEEAAEACTAALELDENYVKALLRRAKCYAELGNHEDAVKDYEKLYKIDKNKEHKQLLHEAKLALKKSKRKDYYKILGIEKTASEDDIKKAYRKRALVHHPDRHAGAPDNERREQERRFKEVGEAYEVLSDPKKRARYDHGQDLDDGSGGINIDPNMMFQTYFNGGGQGFDFSSGGGFPGSAFSFQFG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: