MonarchBase - Protein-coding gene

DPOGS205447
Transcript	DPOGS205447-TA	1293 bp
Protein	DPOGS205447-PA	430 aa
Genomic position	DPSCF300332 + 115904-120323
RNAseq coverage	720x (Rank: top 18%)

Annotation
*Heliconius*	HMEL014717	2e-128	58.54%
*Bombyx*	BGIBMGA009209-TA	1e-96	58.13%
*Drosophila*	l(2)tid-PB	1e-109	66.43%
EBI UniRef50	UniRef50_G6DRS5	0.0	99.72%	Putative uncharacterized protein n=2 Tax=Coelomata RepID=G6DRS5_DANPL
NCBI RefSeq	XP_001605490.1	6e-124	72.44%	PREDICTED: similar to chaperone protein dnaj [Nasonia vitripennis]
NCBI nr blastp	gi\|378466067	9e-157	81.33%	DnaJ-14 [Bombyx mori]
NCBI nr blastx	gi\|378466067	8e-175	81.33%	DnaJ-14 [Bombyx mori]

Group
Gene Ontology	GO:0006457	1.2e-18	protein folding
	GO:0051082	1.2e-18	unfolded protein binding
	GO:0031072	1.3e-16	heat shock protein binding
KEGG pathway
InterPro domain	[209-287] IPR002939	1.2e-18	Chaperone DnaJ, C-terminal
	[202-289] IPR008971	2.7e-18	HSP40/DnaJ peptide-binding
	[87-165] IPR001305	1.3e-16	Heat shock protein DnaJ, cysteine-rich domain
Orthology group	MCL13868		Single-copy universal gene

Nucleotide sequence:

>DPOGS205447-TA
ATGAGAACAAGCGTAAGCAATATGACACTTATGGCACAACTTCTGAACAAATGGGTATGGGAGGAGCTGGTGGAAGCGATGGTTTTACCCATCAATGGCAGTACAAAATCTACTATAGACCCTGAGGAATTATTCCGGAAAATTTTTGGAGATGCAGGCTTTAAAAGTGAGGCTTTCAGTGACTTTGCAGAGAGTCAATTCGGTTTTGGTGCATCCCAAGAGATAATTGTAAATCTAAAGTTCACTGAGGCAGCCCGTGGTGTTAACAAAGATATTAATCTAAATGTTGTTGACACATGTCCTAAATGTCAGGGTTCGAGATGTGAACTCGGCACTAAAGCCGTCAAGTGCACATATTGTAATGGCACTGGCATGGAGACATTTTCTAGAGGTCCATTTGTTATGAGGTCGACATGTAGACATTGCCATGGTACTCGTATGTTGATTAAATTTCCATGTCTTGAATGTGAAGGAAAAGGCCAGTCGGTTCAACGTAAAAAAGTTACAGTTCCAGTGCCAGCTGGCGTAGAGGACGGTCAGACTGTACGTATGTCTGTTGGAAGTAACGAAGTATTCATTACATTCAAAGTGGAAAGCTCCAAGTACTTCAGACGTGACGGACCCGATGTTCATACTGACTGCGCGATATCTGTGTCCCAAGCGCTGCTCGGTGGTACAGTGAGGATACAAGGACTTTATGAAGATCACACTTTGCAGATCGTGCCTTGCACTTCATCTCACAGCACGATACGTCTTTCTCGCAAAGGCATGAAGCGTGTCAGTCAACATGGTTACGGAGATCATTATGTGCACATTAAAATACAAGTACCAAAATCTTTAAGCGATAAACAGAAGGCACTGATCAGTGCGTATGCTGAACTAGAAGAAGACACACCGGGACAAATACACGGAGTTGCTTTTGACAGAGATGACGGTACAAATAATAGCGGTAGTGATAAGAAAATTCACGAAGCTAATCGTGAGAGCGATTTCAAAGAGGAGACGAAATGGACGTTCTTTGATAGTTTAAGCGAAGCGTTCGCAAAGAATAAGACTAATTTCCTCATAGGTTTTCTATCCTCGGTCATTATAGGATTTTTGGTATTGACGAACGATCCCGCAGATAGGTCGGGCATACAGAGATATATGGAAAGCGAGACGGGTAATAAAAATTCAATAGCGGAGCCGCAGAACTTAGTGGACGCTATAAAAGAAGCACTCAAGGACAAGAAAAGTATAGAAGCGGGCGTCACAGAGGACGACTTGAAAGAGCCAAAGCGCAGCAAAGGATAA

Protein sequence:

>DPOGS205447-PA
MRTSVSNMTLMAQLLNKWVWEELVEAMVLPINGSTKSTIDPEELFRKIFGDAGFKSEAFSDFAESQFGFGASQEIIVNLKFTEAARGVNKDINLNVVDTCPKCQGSRCELGTKAVKCTYCNGTGMETFSRGPFVMRSTCRHCHGTRMLIKFPCLECEGKGQSVQRKKVTVPVPAGVEDGQTVRMSVGSNEVFITFKVESSKYFRRDGPDVHTDCAISVSQALLGGTVRIQGLYEDHTLQIVPCTSSHSTIRLSRKGMKRVSQHGYGDHYVHIKIQVPKSLSDKQKALISAYAELEEDTPGQIHGVAFDRDDGTNNSGSDKKIHEANRESDFKEETKWTFFDSLSEAFAKNKTNFLIGFLSSVIIGFLVLTNDPADRSGIQRYMESETGNKNSIAEPQNLVDAIKEALKDKKSIEAGVTEDDLKEPKRSKG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: