MonarchBase - Protein-coding gene

DPOGS209985
Transcript	DPOGS209985-TA	2940 bp
Protein	DPOGS209985-PA	979 aa
Genomic position	DPSCF300148 + 323252-326688
RNAseq coverage	314x (Rank: top 36%)

Annotation
*Heliconius*	HMEL013551	0.0	49.27%
*Bombyx*	BGIBMGA011270-TA	0.0	46.41%
*Drosophila*	CG33172-PA	2e-39	23.80%
EBI UniRef50	UniRef50_E2BQG6	2e-104	30.12%	WD repeat-containing protein 6 n=1 Tax=Harpegnathos saltator RepID=E2BQG6_HARSA
NCBI RefSeq	XP_002430448.1	3e-88	28.53%	WD-repeat protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|307202733	8e-104	30.12%	WD repeat-containing protein 6 [Harpegnathos saltator]
NCBI nr blastx	gi\|307170194	1e-105	29.08%	WD repeat-containing protein 6 [Camponotus floridanus]

Group
Gene Ontology	GO:0005515	2.5e-22	protein binding
KEGG pathway	cnb:CNBA6530	6e-06
	K03361 (CDC4)	maps->	Ubiquitin mediated proteolysis
			Cell cycle - yeast
InterPro domain	[89-424] IPR011046	2.5e-22	WD40 repeat-like-containing domain
	[88-325] IPR015943	1.4e-17	WD40/YVTN repeat-like-containing domain
	[166-203] IPR019781	6.4e-06	WD40 repeat, subgroup
	[164-203] IPR001680	8.4e-06	WD40 repeat
Orthology group	MCL16854		Patchy

Nucleotide sequence:

>DPOGS209985-TA
ATGTCCACTCTAATACGAACTGATGTAACATCAGTAAAATTGTGTAAAGACATTATTTTAGCAGGTATTGGTAGTTTCCTATGCACATTCTATACTAAGAATAGCAAACCAATTCAGAAAATTCAAGCATTGAATGGACAAAAGATACGTGGACTTATCCCTTCAAAGTGTCTCACAAAATTACTTATATTTGGTGGAAAACAGTTTACAATATTTAATGAAATTGAATCTATATTTAAATCTCAAATTGATGCTGTGGTTTATGATGATTGGATTCACACAGCAATTTGGTTGTCAGAGAACAAAGTAGCCCTCTTGAGTGCACATAATGTGGTGACGACTTGGGACATTACAACTACAAAACTCCTACAGCAGCATATTAATAAAGACAACTCTATACTCTACAGTGGGCTACTTCAGCCACTACAACATGACATCCTGGTGTTTAGTGGTACTGTGTACTCACAGGTCATCCTGCAATGGTTTGGTGACGAACAGCCTTTGCACTATTTAAAGGGACATAAGGGTGTCATATTCTCTATAAGCTGTAACCTACAAAGAGGCATTATAGTTACCACCTCAGATGATAGATCAGTGAAGATTTGGTCTGTGACATCCGTTCACTCCGACTATAATATTAAAACTTACTGGCAAAATGCTCATATAGATTGTGTTCATGATCTGTATGGTCACTTGGCACGGGTGATGAGAAACACTCTTACTAATTTATACATAATATCAGTGGGTGAAGACTCGGCTATATGCTTTTGGGATTACAACGGGAACCTGTTGAAGAAAACTATATCCCATAAAAACTCGTGCATTTGGTCCTTAGATGCTGATGAATCTAATTTAGTCACTGGAGGGGGCGACTGTGGGATAATGATGCATCCCCTCTCATCTGTAACTTACAATAGTCATGGTGAGGTCATCAACACCAGTGTGACACCAAAAAAAGTTCTCTTCACTGCTCGAAACAATATTGTCATAACCACGGTTGGTAACGTCTTAAATTATTACAACTCTAACTTAAATAAAATACAAGAAATTCGATTAAATCACACATCTACCTACCAACTGGTCGGCCTGTCTTCATGTAAACAACTTATAGCGGTGGTCGACATGGACGGTAACTTAGACATATTTATGGAAAATTGTAAAGGAGACCCAGGACTCAAGAAGATTATAGAAACGCGGCTGCACCTAGGAAAGATTCTATCGATGCAGTGGGCTGGCAACAGACATTTAGTTTTCTGTTCTGAAGGTGGCGTTATTACAGTCGGAGCCTCCAAAGGAAATACTATCGAGATCATCGCTAACTACCTCCTACCGCCTTGCAAAGAAAGGTGGCTGACTGCCAGCGCCCTCCATGACACCAAAGACACATTGATCGTAGGGGACCGATGTGGACACATACACTTGTATGAGTGGCGACGACAACAACCAGCTTATACCATGAAAAGAGTTCACGGAAGATACGGCCCTACCTCCATCGATATAAGGAATGATATCGTCAGAACGACCGGCAGAGACGGGACGGTCAGGTACTTGAAGATTATCAATTCAGGATTCAAGTATATGAGTTGTAAAGACTTGGAGTTCGAGTGGGTTGAAAAGTTTCTAGACGTACAAGGGAAGTACGTCTGCGGCTTCAGGGAGAGGAGTTTGGTCGTTTATGATGTAGAGAATGATCTGAAGGTAGTGGATGTGTCGTGCGGAGGAGGGCACCGGTCATGGGACGTTGTGCGGTATATCGAAAACAACGGCGGATGTTACGAGGAGTGTCTCAGACTCATGTTTGTAAAGAATACGCAGGTCTATGTCAACACGTTCCGGCTCCGCGACATCGTGTCCACAGTTATATTGCCCGGGACACATTCTAAGGAGATAAACTGTTTGAGAACGTACCGCCGTCGTAACGACGACCCAGTCACGTGGTTCATAACAGGAGGAGAGGACACCACACTGAGAGTGTCCACGTCAGAACAGGAAGCGGAGTTCTGGGACCGAGTGATCTTCAGACATCTGTCGAACGTACGGGCGTTGAAACTGTTGAGTGTGTCCCATGACGAAGTGTTGGTGGTGTCGGCGGGAGGCAGGGCGCAAATATGTATCAGAACCATCGGCTTCGTTGATAAGAATGTAACGGCGGAGGAACTCATTGACTATCAGATAAAAGGAACAGACAGGGAAAGAAGGGGAAACCAAAACTGGAGAAACTGTTCCGTAGACTTCGACCCGGAGACCAGGATCATGGATGTGGAAGTGGACGAACTGAATGAAGCTAAAGTCATGATATACACGGCGTGCTCTGACGGTGAGGTCCGGGTCTTCGAGTGGAACAGACGCGGTGGACAGTTCACTATGATCCAGGAAGTCAGGCATCACAAAACCTGTATACTGAAACTGAAGATGTTTACATGCTCTAATAAAAAAATAATAACTACGTGCGGGACCCGAGGAGACGTGGCCTTTTGGGAGGTCAGCTCAGAGGACGGGACACTGGCGGAGGGACCGGCTCTCGTCCTCAGGACCAACGAATCGGGGATCAATAGTGTCGACATTAAAGTGACCGGAGGCTGTCAATTCGTGTTGGCGACCGGCGGAGATGATAACGCGGTCCATATGAGCCTTGTGAGATTGGGCGGAGACGGGGGCTGGGCGGCGGTGACGTCACACGCGTACCTGAACGCGCATTGCTCACAAGTAACGGGACTGGCACTGGTCGAGGGTTTGTGTGTGACGACCGGCGTGGACCAGAGAGTGACCTCGGTCTCATGGCGCCTGGAGGGAGAGGACATAAAAACAGAGTTCATCGACCAGATGTACAGCGACGTCTCCGACATCCACGGAATGGATGTCGTGCGGGACTCGGGAGACCGGCTCACAGTGTGCGTCTACGGTAAAGGTATCCAAGTCATCGAACTACTGAAACCGTAA

Protein sequence:

>DPOGS209985-PA
MSTLIRTDVTSVKLCKDIILAGIGSFLCTFYTKNSKPIQKIQALNGQKIRGLIPSKCLTKLLIFGGKQFTIFNEIESIFKSQIDAVVYDDWIHTAIWLSENKVALLSAHNVVTTWDITTTKLLQQHINKDNSILYSGLLQPLQHDILVFSGTVYSQVILQWFGDEQPLHYLKGHKGVIFSISCNLQRGIIVTTSDDRSVKIWSVTSVHSDYNIKTYWQNAHIDCVHDLYGHLARVMRNTLTNLYIISVGEDSAICFWDYNGNLLKKTISHKNSCIWSLDADESNLVTGGGDCGIMMHPLSSVTYNSHGEVINTSVTPKKVLFTARNNIVITTVGNVLNYYNSNLNKIQEIRLNHTSTYQLVGLSSCKQLIAVVDMDGNLDIFMENCKGDPGLKKIIETRLHLGKILSMQWAGNRHLVFCSEGGVITVGASKGNTIEIIANYLLPPCKERWLTASALHDTKDTLIVGDRCGHIHLYEWRRQQPAYTMKRVHGRYGPTSIDIRNDIVRTTGRDGTVRYLKIINSGFKYMSCKDLEFEWVEKFLDVQGKYVCGFRERSLVVYDVENDLKVVDVSCGGGHRSWDVVRYIENNGGCYEECLRLMFVKNTQVYVNTFRLRDIVSTVILPGTHSKEINCLRTYRRRNDDPVTWFITGGEDTTLRVSTSEQEAEFWDRVIFRHLSNVRALKLLSVSHDEVLVVSAGGRAQICIRTIGFVDKNVTAEELIDYQIKGTDRERRGNQNWRNCSVDFDPETRIMDVEVDELNEAKVMIYTACSDGEVRVFEWNRRGGQFTMIQEVRHHKTCILKLKMFTCSNKKIITTCGTRGDVAFWEVSSEDGTLAEGPALVLRTNESGINSVDIKVTGGCQFVLATGGDDNAVHMSLVRLGGDGGWAAVTSHAYLNAHCSQVTGLALVEGLCVTTGVDQRVTSVSWRLEGEDIKTEFIDQMYSDVSDIHGMDVVRDSGDRLTVCVYGKGIQVIELLKP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: