MonarchBase - Protein-coding gene

DPOGS206810
Transcript	DPOGS206810-TA	1512 bp
Protein	DPOGS206810-PA	503 aa
Genomic position	DPSCF300001 - 3983185-3998025
RNAseq coverage	638x (Rank: top 20%)

Annotation
*Heliconius*	HMEL012199	4e-157	75.27%
*Bombyx*	BGIBMGA000632-TA	2e-153	79.94%
*Drosophila*	CG2812-PA	2e-121	60.42%
EBI UniRef50	UniRef50_UPI0002060F02	1e-148	70.88%	UPI0002060F02 related cluster n=1 Tax=unknown RepID=UPI0002060F02
NCBI RefSeq	XP_001122414.1	4e-165	59.20%	PREDICTED: similar to CG2812-PA [Apis mellifera]
NCBI nr blastp	gi\|307185226	5e-163	59.14%	WD repeat-containing protein 47 [Camponotus floridanus]
NCBI nr blastx	gi\|307185226	2e-162	58.95%	WD repeat-containing protein 47 [Camponotus floridanus]

Group
Gene Ontology	GO:0005515	1.1e-63	protein binding
KEGG pathway	ddi:DDB_G0282189	5e-19
	K06666 (TUP1)	maps->	Cell cycle - yeast
InterPro domain	[185-501] IPR015943	1.1e-63	WD40/YVTN repeat-like-containing domain
	[175-503] IPR011046	2.4e-59	WD40 repeat-like-containing domain
	[235-267] IPR019781	9e-10	WD40 repeat, subgroup
	[230-269] IPR001680	3e-07	WD40 repeat
Orthology group	MCL15641		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206810-TA
ATGGACGCAAGAAACTTTAAAACTTCTTCATCCAAAAGTTCAGCGTATTCTGATTTTTCTGGAATGAGTGCGTACAGTAATAAGTCCCGGGACTATTATTTCCTATCGCCTAGTTATCGATCGGCTGGCGCGCCAACGCCAAGCAATCATGCGGATTTATACTTGAGTAGAGAAAGATCCAGGCAGATTCGAACTGCTAACGCTTCTTCTCCTGCCTGCCCCTGCAGCCGATCTCGATCCCTTGAGGACGTGCGTACGGAAGTGGTTACCGAATGGGAGGATGATGATGAAAATGGAAACCGTATCGTAGCTCCGGCGACCAAATTTAATCGCACAACATACAAAACGAACGCTACGTTTGAAAAACAAAATTTTATGACCCGACATTCCATGGAAAATCTAGTAGAAAGATCGCCACAAGTGCCTCCACCAAAACGCATCAGTGCTTTTCAGGCGCCAAGCAGGAACGGTAGTCAGAGTGCGCTTGGCACTCCAGCCGTTGCGGAAGTGAACGGCTCCCGGCCGACCTTCAAGCCAGTGACAGTGCTAGAAGATCTACAGGCGGTGCGTTGCGCTGAATTCCATCCCGGCGGCAGATTGTACGCTGTGGGCTCCAACACCAAGACGCTCAGGATATGCAGCTATCCCAAGATTGATGATGTCAAAGACAATAGTTCACCGACAGCGCCAACTGTGCTACTAAAACGCACTAAGCACCATAAAGGTAGCATCTATTGTCTGGCCTGGAGCCCGGCCGGAGATCTTCTAGCCACCGGTTCCAATGACAAGACAGTTAAGCTCATGAGATTCAACAGCCACACCTGCAACCTGGAGGGACAGGAGGTTGAGCTGACTATGCATGACGGAACGGTCCGTGACGTGTGCTTCATAGAGGACACCTCAAACAAAACCAGCCTTCTCGTGAGTGGTGGCGCTGGGGACTGCAAGATATACGTAACAGATTGCGCTACCGGGAAGACTTTCCAGGCGCTGAGCGGTCATTCCGGGCACGTGCTGTCTCTATACAGTTGGGGTGGAGCTTTGTTCGTGTCAGGGAGTCAGGATAGGAGCGTCCGTTTCTGGGATCTGAGAACAGCTGGTTGCGTCAACGTGATCGCACCCCCGCCAGCTGGACAGCATGCGAAGGGGTCAGCTGTCGCGTCTCTGGCAGTGGATCCGAGTGGTCGTCTCCTAGTATCTGGTCACGAGGATGGCTGGTGTGGTCTACACGACGTGCGCGGCTCTCGTTCCTTGCAGCGGTTCTCGCCTCACGCGGGCGATGTACGATCAGTTCGTTTCTCACCCGGAGCTTACTATTTACTGACAGCTGGATACGACGGACGTGTAGTACTTACAGATCTTCAAGGTGACCTCACGTGCGCACTTCCTAGCGTACCAGTGGCTCGTCACCCGGACAAAGTGATCTCAGCTCGCTGGCATCCCGATGACTTCTCATTCCTTTCAACGTCAGCTGATAAGACAGCTGTTCTATGGACCATACCGCCACTATAG

Protein sequence:

>DPOGS206810-PA
MDARNFKTSSSKSSAYSDFSGMSAYSNKSRDYYFLSPSYRSAGAPTPSNHADLYLSRERSRQIRTANASSPACPCSRSRSLEDVRTEVVTEWEDDDENGNRIVAPATKFNRTTYKTNATFEKQNFMTRHSMENLVERSPQVPPPKRISAFQAPSRNGSQSALGTPAVAEVNGSRPTFKPVTVLEDLQAVRCAEFHPGGRLYAVGSNTKTLRICSYPKIDDVKDNSSPTAPTVLLKRTKHHKGSIYCLAWSPAGDLLATGSNDKTVKLMRFNSHTCNLEGQEVELTMHDGTVRDVCFIEDTSNKTSLLVSGGAGDCKIYVTDCATGKTFQALSGHSGHVLSLYSWGGALFVSGSQDRSVRFWDLRTAGCVNVIAPPPAGQHAKGSAVASLAVDPSGRLLVSGHEDGWCGLHDVRGSRSLQRFSPHAGDVRSVRFSPGAYYLLTAGYDGRVVLTDLQGDLTCALPSVPVARHPDKVISARWHPDDFSFLSTSADKTAVLWTIPPL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: