MonarchBase - Protein-coding gene

DPOGS211439
Transcript	DPOGS211439-TA	1422 bp
Protein	DPOGS211439-PA	473 aa
Genomic position	DPSCF300223 - 146204-149507
RNAseq coverage	884x (Rank: top 14%)

Annotation
*Heliconius*	HMEL013821	3e-150	63.49%
*Bombyx*	BGIBMGA002188-TA	0.0	75.81%
*Drosophila*	P58IPK-PA	6e-151	56.37%
EBI UniRef50	UniRef50_Q9VHA8	8e-149	56.37%	LD25575p n=20 Tax=Neoptera RepID=Q9VHA8_DROME
NCBI RefSeq	XP_002074116.1	1e-154	55.21%	GK14476 [Drosophila willistoni]
NCBI nr blastp	gi\|378466278	0.0	75.10%	DnaJ-20 [Bombyx mori]
NCBI nr blastx	gi\|378466278	0.0	75.10%	DnaJ-20 [Bombyx mori]

Group
Gene Ontology	GO:0031072	1.5e-28	heat shock protein binding
	GO:0005488	1.5e-17	binding
	GO:0006457	2.2e-16	protein folding
	GO:0051082	2.2e-16	unfolded protein binding
	GO:0005515	2.1e-05	protein binding
KEGG pathway	dwi:Dwil_GK14476	3e-154
	K09523 (DNAJC3)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[368-460] IPR001623	1.5e-28	Heat shock protein DnaJ, N-terminal
	[138-259] IPR011990	1.5e-17	Tetratricopeptide-like helical
	[374-392] IPR003095	2.2e-16	Heat shock protein DnaJ
Orthology group	MCL14255		Single-copy universal gene

Nucleotide sequence:

>DPOGS211439-TA
ATGGACTTGTTTTTAAATAAAAATTGGAACAAAGTCACGCCATGCCTAGTGTTATTAGCGTTAGAAGTTTTGCTAGAATTTTCAGAATGTGCGACCCAGGCGGAAGTTAACAAGCACCTAGAGCTGGGCCGCGACTTCCTGGCCCGAGGTCAGCTGTCCGACGCACTCACACACTATCACGCCGCTGTTGAGGGTGATCCACATAACTACCTCACATACTTTAAGAGAGGCACTGTGTTAGAAATGAAGGCCGACTTCACAGCCGCCCGACTCCACAGGGCTAATGTGTACCTCAAGCTAGCTCAGTACAGGGAGGCCAAGGAAGACTATCTACAAGTTACTTATAGTGAACCTTACAATGAGGAGGCGATATCCTTGTATCACCGGATGGATGGTCTGTCAGAGGAGCTACAGCTAGCGGAGGCCTACTACCGCGGGCGGGACTTCGCCGCCGCCGCTGAACTCACCTCCCGACTGCTAGAGGCTTCCCCCTGGGCCGCTAACCTCAGACAACTTAGGGCGGAATGCTATATTGCACTAAATGATCTGTTCTCAGCGGTGTCGGATATCAGGTCTGTGAATCGTTTACAGCAGGACTCCACTGACGGCTACCACCGTCTTGCCACACTCCTGTACCAACTGGGACATGTCAGTGACGCTCTCAAGGAAATAAGAGAATGTCTCAAACTAGACCCGGAGCACAAGCTGTGTTTCCCGTTGTACAAGAAATTAAAGAAAGTGGACAAACTGTTATTAGACTGTGAGGAGGCCAGTCAGAACAGAGAGTTTGTGAAGTGTGTGGACAAGGCTGAGGCGGTGCTGAAGGTGGAACAGGAGGTAACGCTGGTGGTGTTTGAGGCCAGGAAGTGGCTGTGCTCTTGTCATGCTAAGGAGGAGCAGTATTCAGAAGCTATCCTGGAGTGTGGCCGAGCTCTGGAACTACAACGAGATGCGGGCGTGTTATGTTCCAGAGGAGACGCCTGGCTCGGACTGGGGGAGTTTGATGACGCTATCAGATCCTACAAGGAGGCGCTGGATATAGACGAGGGGCTGCAGAGAGCCAAGGATGGGATCAGCAGGGCACAGAAACTACAGAAACAGTCGGAGCAGAGAGACTACTACAAGATATTAGGAGTTAAGAGAACGGCGAACAAACAGGAGATCACGAAGGCGTACCGCAAGGCGGCGCAGAAGTGGCACCCGGACAACTTCCAGGGAGACGAGAAGAAACTGGCGGAGAAGAAGTTCATAGACATCGCCGCCGCCAAAGAGGTGCTGACGGACCCCGAGAAGCGCGCCGTGTTCGACGCGGGCGGTGACCCGCTGGACCCCGAGGCGGGTCGCCAGCAGCACGGGTTCAACGCCCCCTTCGGCCACTTCCACCACGGCAGCCCCTTCCAGTTCAAGTTCCACTTCAACTGA

Protein sequence:

>DPOGS211439-PA
MDLFLNKNWNKVTPCLVLLALEVLLEFSECATQAEVNKHLELGRDFLARGQLSDALTHYHAAVEGDPHNYLTYFKRGTVLEMKADFTAARLHRANVYLKLAQYREAKEDYLQVTYSEPYNEEAISLYHRMDGLSEELQLAEAYYRGRDFAAAAELTSRLLEASPWAANLRQLRAECYIALNDLFSAVSDIRSVNRLQQDSTDGYHRLATLLYQLGHVSDALKEIRECLKLDPEHKLCFPLYKKLKKVDKLLLDCEEASQNREFVKCVDKAEAVLKVEQEVTLVVFEARKWLCSCHAKEEQYSEAILECGRALELQRDAGVLCSRGDAWLGLGEFDDAIRSYKEALDIDEGLQRAKDGISRAQKLQKQSEQRDYYKILGVKRTANKQEITKAYRKAAQKWHPDNFQGDEKKLAEKKFIDIAAAKEVLTDPEKRAVFDAGGDPLDPEAGRQQHGFNAPFGHFHHGSPFQFKFHFN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: