MonarchBase - Protein-coding gene

DPOGS204562
Transcript	DPOGS204562-TA	924 bp
Protein	DPOGS204562-PA	307 aa
Genomic position	DPSCF301256 - 496-3807
RNAseq coverage	114x (Rank: top 59%)

Annotation
*Heliconius*	HMEL014224	5e-113	54.89%
*Bombyx*	BGIBMGA009595-TA	2e-110	58.47%
*Drosophila*	CstF-50-PA	3e-85	45.54%
EBI UniRef50	UniRef50_Q9V9V0	4e-83	45.54%	CstF-50, isoform A n=40 Tax=Bilateria RepID=Q9V9V0_DROME
NCBI RefSeq	XP_393185.2	8e-98	49.39%	PREDICTED: similar to CstF-50 CG2261-PA, isoform A isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|307212759	6e-97	50.25%	Cleavage stimulation factor 50 kDa subunit [Harpegnathos saltator]
NCBI nr blastx	gi\|307212759	5e-94	50.25%	Cleavage stimulation factor 50 kDa subunit [Harpegnathos saltator]

Group
Gene Ontology	GO:0005515	2.1e-32	protein binding
KEGG pathway	mgr:MGG_08829	4e-16
	K06666 (TUP1)	maps->	Cell cycle - yeast
InterPro domain	[86-303] IPR015943	2.1e-32	WD40/YVTN repeat-like-containing domain
	[89-302] IPR011046	7.2e-30	WD40 repeat-like-containing domain
	[170-211] IPR001680	1e-06	WD40 repeat
	[141-167] IPR019781	1.6e-06	WD40 repeat, subgroup
Orthology group	MCL13890		Single-copy universal gene

Nucleotide sequence:

>DPOGS204562-TA
CAGTTACATTACGATGGCTTCCAACCTATAGCCGCGACTCTATCAGCCGCTGTACACGCAGACCCACCGTGCCCTCCGAGCGACAGATTATTAAATCTAATGATGGTCGGTCTACAACATGAACCGGACCGGAAGGACAGGCTGGCGGCATCCAGCGGGGCGGAACATCTGCTGGGAACTACCGGCTTTGATCTCGAGTTTGAGATGGACGCGTCCTCGCTCGCCCCTGAGCCGGCCACGTACGAGACGGCGTATGTGACGTCACACAAGATGTCTTGTAGGGCCGGAGCGTTCAGCGCCTGTGGTCAGCTGGTGGCTACCGGCAGTGTGGATGCTAGCATTAAGATTCTGGACGTGGAGCGGATGTTGGCTAAATCAGCTCCCGAGGAAGTTGATCCCGGGAGAGAGCAACAGGGACATCCGGTGATACGAACATTGTTTTCACCGAACGGTAAGTATTACGCGTCGGGCAGCGCTGATGGTAGCGTCAAGCTCTGGGACACCGTCTCCAACAGATGTTTTAACACGTTCACCAACGCTCACGAGGGTGCAGAAGTGTGTTCAGTGGCATTCACCAGGAACAGCAAGTATCTCCTCACATCTGGTTTGGATTCGTCTATAAAGTTGTGGGAGTTAGCGAGCAGCCGTTGTCTGATACAATATACGGGGGCCGGTACTACAGGTAAGCAGGAACACCACGCCCAGGCGATATTCAATCACACTGAGGACTACGTGATGTTCCCGGACGAGGCGACCACCTCGCTCTGCACCTGGCACTCCAGGTCAGCCAGCAGGTGCCAGCTGATGTCTCTGGGGCATAATGGAGCTGTTAGGTACATAGTCCATTCTGGCACGGCTCCAGCGTTCCTCACCTGTAGCGATGATTACAGAGCCAGGTTTTGGTACAGACGGAACACGCATTAA

Protein sequence:

>DPOGS204562-PA
QLHYDGFQPIAATLSAAVHADPPCPPSDRLLNLMMVGLQHEPDRKDRLAASSGAEHLLGTTGFDLEFEMDASSLAPEPATYETAYVTSHKMSCRAGAFSACGQLVATGSVDASIKILDVERMLAKSAPEEVDPGREQQGHPVIRTLFSPNGKYYASGSADGSVKLWDTVSNRCFNTFTNAHEGAEVCSVAFTRNSKYLLTSGLDSSIKLWELASSRCLIQYTGAGTTGKQEHHAQAIFNHTEDYVMFPDEATTSLCTWHSRSASRCQLMSLGHNGAVRYIVHSGTAPAFLTCSDDYRARFWYRRNTH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: