MonarchBase - Protein-coding gene

DPOGS215464
Transcript	DPOGS215464-TA	1296 bp
Protein	DPOGS215464-PA	431 aa
Genomic position	DPSCF300098 - 444777-448987
RNAseq coverage	1188x (Rank: top 11%)

Annotation
*Heliconius*	HMEL008346	8e-173	73.61%
*Bombyx*	BGIBMGA012127-TA	2e-24	28.57%
*Drosophila*	Caf1-PA	0.0	94.08%
EBI UniRef50	UniRef50_Q09028	0.0	92.31%	Histone-binding protein RBBP4 n=210 Tax=root RepID=RBBP4_HUMAN
NCBI RefSeq	XP_624580.1	0.0	96.25%	PREDICTED: similar to Chromatin assembly factor 1 subunit CG4236-PA [Apis mellifera]
NCBI nr blastp	gi\|345483539	0.0	96.02%	PREDICTED: probable histone-binding protein Caf1 isoform 2 [Nasonia vitripennis]
NCBI nr blastx	gi\|345483539	0.0	96.02%	PREDICTED: probable histone-binding protein Caf1 isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0005515	8.3e-61	protein binding
KEGG pathway
InterPro domain	[116-407] IPR015943	8.3e-61	WD40/YVTN repeat-like-containing domain
	[112-404] IPR011046	3.5e-54	WD40 repeat-like-containing domain
	[19-89] IPR022052	1e-30	Histone-binding protein RBBP4
	[263-303] IPR001680	4.3e-10	WD40 repeat
	[265-303] IPR019781	2.3e-09	WD40 repeat, subgroup
	[194-208] IPR020472	1.8e-08	G-protein beta WD-40 repeat
Orthology group	MCL11414		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215464-TA
ATGGGTGATAAAGATGGAGAAACCTTTGATGATGCTGTGGAAGAGAGGGTTATCAACGAGGAGTACAAAATATGGAAGAAGAATACACCTTTCTTATATGACCTGGTCATGACACACGCTTTAGAGTGGCCCTCGCTGACCGCTCAGTGGCTTCCAGATGTCACAAGACCTGAAGGCAAGGATTACTCCGTACACAGATTGATTCTGGGCACTCACACATCAGATGAACAAAACCACCTCCTCATTGCAAGTGTACAACTTCCTAATGAGGATGCACAGTTTGATGCAAGCCACTATGATAATGATAAGGGTGAATTTGGTGGTTTTGGATCAGTTTCTGGTAAGATAGATATAGAAATTAAAATTAATCATGAGGGTGAAGTCAATAGGGCTCGCTACATGCCCCAAAATCCTTGCGTCATTGCCACAAAGACACCATCTTCTGATGTCCTCGTATTTGACTACACCAAACATCCATCAAAACCTGAACCTTCCGGAGAATGTCATCCCGACCTTAGATTGCGAGGACACCAAAAGGAAGGTTACGGTTTGTCATGGAACCCTAATCTTAATGGATACCTTTTATCAGCCAGTGACGATCATACAATCTGCTTATGGGATATAAACGCCACTCCTAAGGAAGGGCGTGTGATTGAAGCCAAGTCTGTCTTCACGGGACACACAGCGGTGGTTGAGGATGTGGCGTGGCATCTGCTTCATGAATCCTTGTTTGGATCTGTGGCCGACGATCAGAAGCTCATGATATGGGATACGAGATGTAACAACACGTCCAAGCCATCCCACACCGTGGATGCTCACACCGCTGAAGTGAACTGCCTTAGCTTCAACCCATACTCGGAATTTATTCTCGCCACTGGCAGTGCTGACAAAACTGTGGCGTTGTGGGACTTGCGTAACCTTAAACTGAAGTTGCACTCGTTTGAGTCGCACAAGGACGAGATCTTCCAAGTACAGTGGTCGCCACACAACGAGACCATTCTGGCTAGCAGTGGCACAGACAGGAGGCTGCATGTTTGGGATCTATCGAAGATTGGTGAGGAACAGACGGCTGAGGACGCGGAGGACGGGCCCCCGGAACTGTTGTTCATCCACGGAGGTCACACCGCCAAGATATCCGACTTCTCATGGAACCCCAACGAGCCGTGGGTCATCTGCTCCGTCTCCGAGGACAACATCATGCAGGTGTGGCAAATGGCTGAGAACATCTACAACGATGAGGAACCGGAAACGCCGGCTTCGGAGCTGGAATCGGGAGTCAACGTGAACCACGGTTAG

Protein sequence:

>DPOGS215464-PA
MGDKDGETFDDAVEERVINEEYKIWKKNTPFLYDLVMTHALEWPSLTAQWLPDVTRPEGKDYSVHRLILGTHTSDEQNHLLIASVQLPNEDAQFDASHYDNDKGEFGGFGSVSGKIDIEIKINHEGEVNRARYMPQNPCVIATKTPSSDVLVFDYTKHPSKPEPSGECHPDLRLRGHQKEGYGLSWNPNLNGYLLSASDDHTICLWDINATPKEGRVIEAKSVFTGHTAVVEDVAWHLLHESLFGSVADDQKLMIWDTRCNNTSKPSHTVDAHTAEVNCLSFNPYSEFILATGSADKTVALWDLRNLKLKLHSFESHKDEIFQVQWSPHNETILASSGTDRRLHVWDLSKIGEEQTAEDAEDGPPELLFIHGGHTAKISDFSWNPNEPWVICSVSEDNIMQVWQMAENIYNDEEPETPASELESGVNVNHG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: