MonarchBase - Protein-coding gene

DPOGS205581
Transcript	DPOGS205581-TA	2115 bp
Protein	DPOGS205581-PA	704 aa
Genomic position	DPSCF300237 - 201545-208624
RNAseq coverage	2033x (Rank: top 6%)

Annotation
*Heliconius*	HMEL008503	5e-78	61.80%
*Bombyx*	BGIBMGA009674-TA	0.0	84.48%
*Drosophila*	lin19-PA	0.0	57.68%
EBI UniRef50	UniRef50_F4W5V7	0.0	70.84%	Cullin-1 n=4 Tax=Coelomata RepID=F4W5V7_ACREC
NCBI RefSeq	XP_971976.1	0.0	66.22%	PREDICTED: similar to SCF complex protein cul-1 [Tribolium castaneum]
NCBI nr blastp	gi\|332030757	0.0	70.84%	Cullin-1 [Acromyrmex echinatior]
NCBI nr blastx	gi\|91085981	0.0	63.23%	PREDICTED: similar to SCF complex protein cul-1 [Tribolium castaneum]

Group
Gene Ontology	GO:0006511	6.8e-155	ubiquitin-dependent protein catabolic process
	GO:0031625	6.8e-155	ubiquitin protein ligase binding
	GO:0031461	6.8e-155	cullin-RING ubiquitin ligase complex
KEGG pathway	tca:660670	0.0
	K03347 (CUL1, CDC53)	maps->	Ubiquitin mediated proteolysis
			Wnt signaling pathway
			Cell cycle - yeast
			TGF-beta signaling pathway
			Circadian rhythm - mammal
			Protein processing in endoplasmic reticulum
			Cell cycle
			Oocyte meiosis
InterPro domain	[30-552] IPR001373	6.8e-155	Cullin, N-terminal
	[29-402] IPR016159	1e-106	Cullin repeat-like-containing domain
	[403-552] IPR016158	1e-58	Cullin homology
	[606-704] IPR011991	1.3e-37	Winged helix-turn-helix transcription repressor DNA-binding
	[631-698] IPR019559	2.9e-37	Cullin protein, neddylation domain
Orthology group	MCL10918		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205581-TA
ATGAATAACCTATCGATTTTGTATGAAAACATTGTTTTTCGTCACTCTAACTTGTATAGCAAACGTCGTAATGTCCTTAACGAGCACAGTCACGTGTACAACTACTGTACGTCGGTACATCAGCAGAGCTCTAGCGGTTCCAGCAAAAGCCTCACCACCAGCAACAGTTTCGGCAGCTACAGCAGTCGGAACAGGAATAAGACCGGTCAAGTCGGCAGCGGGGCTCAATTGGTTGGTCTCGAGCTATACAAACGACTGAGAGAATTCTTGAGGACATATCTATATATGTGTAACGGGTCCGACCTGATGGGTGAGGATGTACTGGCGTACTACACCAAGCAGTGGGAATTGTACCAGTTCTCATCTCGTGTCCTCAACGGTGTCTGTTCATACCTCAATCGGCATTGGGTGAAAAGGGAGTGCGAGGAGGGTAGAAAGAATATATACGAGATATATCAGCTGGCTTTGGTCACGTGGCGCGACAATTTGTTCAAATGTCTGAACAAGCAAGTTACAAATGCTGTGCTCAAATTGATTGAGCGAGAGCGGAACGGAGAGACGATTAACACGAGACTAGTTACAGGAGTTATCAACTGCTACGTAGCGCTGGGTCTGAACGAGGACGATGTGTCTTCGAGGGGCCAAAATCTGGTGGTCTACAAGGACACCTTCGAAGCTGTCTTCCTTGAAGACACAGAGAGGTTCTACATAAGGGAGAGCTCGGACTTCCTAAAGAACAACCCGGTCACAGAATACATGATTAAGGCGGAACAGCGTCTCCACGAGGAACAGAAACGTGTCCAGGTGTACTTACACGAGACAACCATGGAGAGACTCGCCAAGACCTGCGACAGAGTCCTCATAGAGAAACACCTGGAGATATTCCACGCTGAGTTCCAGAAACTTCTTGACGGCAACAAGAACACAGACCTGGGTCGCATGTACAGTTTGGTAGCCAGGATACCCAGCGGTCTATGCGAACTGCGGAAACTTCTGGAACAGCACATACACACACAGGGCCTGCACGCGATCGACAAGTGCGGGGACTGTGTACACACGGATCCTAAAGTGTATGTTTCGACAATACTTGAAGTACACAAGAAGTACAACGCTCTAGTACTAATGGCCTTCAACAACGACTCCGGCTTTGTGGCGGCACTTGACAAAGCCTGTGGCAGATTCATAAACAGTAATTCAGTAACAAAAGCAGCTAACTCTTCATCCAAAAGTCCCGAACTGCTCGCTAAATATTGTGACCTTCTGTTGAAGAAGTCTAGCAAGAACCCCGAGGAAGCTGAGCTGGAGGATACTCTGAATCAAGTTATGGTTGTCTTCAAGTACATAGAGGATAAAGATGTTTTCCAGAAGTTCTACAGCAAGATGCTGGCTAAACGGCTGGTCCAGCACATGTCGGCCAGTGACGACGCCGAGGCGTCGATGATATCAAAACTGAAACAGGCCTGCGGGTTCGAATACACCAGCAAGCTGCAGAGGATGTTCCAGGACATTGGCGTGTCGAAGGATTTAAACGAGAACTTCCGGAAGCACATGTCCAACAGTTCAGAACAACCGCTGCACATAGACTTCAGTATCCAGGTGTTGTCTTCTGGTTCGTGGCCCTTCCAGCAGTCGTCCAGTTTCCAGTTGCCCACGGAGGCGCATACCTCCGTGGGCAACTGGAAACTGGACGACTGCTGGAAGGGCCACGAACCAGAAGACAACACCTGGATACTGAAGTCTATGTGCAGCGGTTGTTCTGAACTGTTGGACATGTGCTTCCGGAAGTTCTCGTTTAAATCCTTCGACACGCCAATTAAAAAACTGCGAGTCAATATAAATATACCGCTGAAGACGGAGTTGAAAGTTGAACAAGAGGCGACCCACAAGCACATCGAGGAAGACAGGAAGATGCTCATACAGGCTGCCATAGTCCGCATCATGAAGACTCGCAAAACTCTCAAACATCAACACCTGGTGGTGGAAGTGCTGAATCAGCTGTCATCCCGGTTCAAACCCCGTGTGCCCGTCATTAAGAAATGCATCGACATACTGATTGAGAAGGAGTACCTGGAACGCACGGAGGGAGAGAAAGACACGTACAGTTATCTAGCTTGA

Protein sequence:

>DPOGS205581-PA
MNNLSILYENIVFRHSNLYSKRRNVLNEHSHVYNYCTSVHQQSSSGSSKSLTTSNSFGSYSSRNRNKTGQVGSGAQLVGLELYKRLREFLRTYLYMCNGSDLMGEDVLAYYTKQWELYQFSSRVLNGVCSYLNRHWVKRECEEGRKNIYEIYQLALVTWRDNLFKCLNKQVTNAVLKLIERERNGETINTRLVTGVINCYVALGLNEDDVSSRGQNLVVYKDTFEAVFLEDTERFYIRESSDFLKNNPVTEYMIKAEQRLHEEQKRVQVYLHETTMERLAKTCDRVLIEKHLEIFHAEFQKLLDGNKNTDLGRMYSLVARIPSGLCELRKLLEQHIHTQGLHAIDKCGDCVHTDPKVYVSTILEVHKKYNALVLMAFNNDSGFVAALDKACGRFINSNSVTKAANSSSKSPELLAKYCDLLLKKSSKNPEEAELEDTLNQVMVVFKYIEDKDVFQKFYSKMLAKRLVQHMSASDDAEASMISKLKQACGFEYTSKLQRMFQDIGVSKDLNENFRKHMSNSSEQPLHIDFSIQVLSSGSWPFQQSSSFQLPTEAHTSVGNWKLDDCWKGHEPEDNTWILKSMCSGCSELLDMCFRKFSFKSFDTPIKKLRVNINIPLKTELKVEQEATHKHIEEDRKMLIQAAIVRIMKTRKTLKHQHLVVEVLNQLSSRFKPRVPVIKKCIDILIEKEYLERTEGEKDTYSYLA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: