MonarchBase - Protein-coding gene

DPOGS215697
Transcript	DPOGS215697-TA	3279 bp
Protein	DPOGS215697-PA	1092 aa
Genomic position	DPSCF300041 - 321757-331179
RNAseq coverage	556x (Rank: top 23%)

Annotation
*Heliconius*	HMEL009653	96.26%
*Bombyx*	BGIBMGA005758-TA	81.07%
*Drosophila*	Cul-4-PA	63.99%
EBI UniRef50	UniRef50_E2AII3	67.96%	Cullin-4B n=2 Tax=Coelomata RepID=E2AII3_CAMFO
NCBI RefSeq	XP_392800.3	71.09%	PREDICTED: similar to cullin 4B [Apis mellifera]
NCBI nr blastp	gi\|307199383	70.80%	Cullin-4B [Harpegnathos saltator]
NCBI nr blastx	gi\|307199383	70.80%	Cullin-4B [Harpegnathos saltator]

Group
Gene Ontology	GO:0006511	1.6e-123	ubiquitin-dependent protein catabolic process
	GO:0031625	1.6e-123	ubiquitin protein ligase binding
	GO:0031461	1.6e-123	cullin-RING ubiquitin ligase complex
KEGG pathway	ame:409279	0.0
	K10609 (CUL4)	maps->	Ubiquitin mediated proteolysis
			Nucleotide excision repair
InterPro domain	[31-480] IPR001373	1.6e-123	Cullin, N-terminal
	[27-373] IPR016159	1.6e-99	Cullin repeat-like-containing domain
	[778-1004] IPR016158	3.3e-74	Cullin homology
	[994-1092] IPR011991	4.9e-37	Winged helix-turn-helix transcription repressor DNA-binding
	[1021-1086] IPR019559	3.7e-35	Cullin protein, neddylation domain
Orthology group	MCL12049		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215697-TA
ATGAATAAACCTGGCGCAACAACAAAGAAACTAGTTATTAAAAACTTTAAAAGTAAACCGAACCTTCCGGAAAATTATCAAGAAACAACATGGAGCAAATTACGAGAGGCTGTTATAGCTATACAAACGTCGAAGGCAATCGCCTATTCCTTAGAAGAATTATATCAAGCAGTTGAAAATATGTGTAGCCATAAGATGGCGTCTCAATTGTATGTTAATTTGACAAACTTAGTGGAGGCCCACGTGAAATCAAACATTGAGCAGTTCCTGTCGGAGAGCATGGATCGCCAAGTGTTTCTCAAACGTATGGACGACTGTTGGCGGGCTCACTGTCGACAAATGATCATGATCAGGAGCATCTTCCTGTACCTGGACCGTACTTATGTTCTCCAAAACCCTAGCATACATTCTATATGGGACATGGGTCTAGATCTGTTCCGGCATCATATAGCTATGAACACTCTGATACAGACTCGCACTGTTGATGGACTGTTGACATTGATAGAACGGGAAAGAGGGGGAGATGCCGTGGACATCTCCCTGCTGAAGAGTTTATTGAGGATGCTGTCCGACCTTCAGATATACCAGGATGCCTTTGAACACAAATTCCTGCAGGCCACAGAGCGTCTGTACTGCGCGGAGGGCCAGCGTCTGATGCGAGAGTTAGCAGTGCCGCAGTATCTGGCACACGTGGAGAAGAGACTCAGGGAGGAGAACGAGCGGCTCCTGCACTATCTGGACCCCTGTACCAAATGGCAGCTCATCCATACGGTGGAGCGTCAGTTGTTGAGCGAGCATGTCAGCGGTGTACTCAGCAAGGGACTCGAGTCGCTTATGGACGGGCCGCGCCTCAGAGACCTCGCCACCCTATACTCACTGTTCAGCCGAGTCAAGGACGGACTCACTGAGCTGTGTAATCACTTTAATGCGTACATTAAGAAAAAAGGTCGTACCATAGTCATCGAGCCGGAGCGTGACAAGACGATGGTAGCGGAACTGTTGGAATTCAAAGAGCAGCTGGACAATGTTGTGAGCACGTGCTTCCAGAGGAACGACCGGTTCCTGTACTCCATGAGAGAGGCCTTCGAGCACTTCATCAACCAGAGACAGAATAAACCGGCTGAGCTCATTGCCAAATTCGTCGATCTCAAACTGAGAGCCGGCAACAAAGAGGCGACGGAGGAAGAATTAGAAAGACTGCTGGACAAAATAATGGTTCTGTTCCGTTTTATACACGGGAAGGATGTGTTCGAGGCATTCTACAAGAAGGATCTAGCAAAGAGGTTGTTGGTGGGCAAGTCGGCCTCCGTGGACGCGGAGAAGTCCATGTTAAGCAAACTGAAGCAGGAGTGTGGAGGGGGCTTCACCTGCAAGTTAGAAGGCATGTTCAAAGACATGGAACTGTCAAAGGATATTAATATTACATACAAGCAGATGGCGTCTCAATTGTATGTTAATTTGACAAACTTAGTGGAGGCCCATGTGAAATCAAACATTGAGCAGTTCCTGTCGGAGAGCATGGATCGCCAAGTGTTTCTCAAACGTATGGACGACTGTTGGCGGGCTCACTGTCGACAAATGATCATGATCAGGAGCATCTTCCTGTATCTGGACCGGACTTATGTTCTCCAAAACCCTAGCATACATTCTATATGGGACATGGGTCTAGATCTGTTCCGGCATCATATAGCTATGAACACTCTGATACAGACTCGCACTGTTGATGGACTGTTGACATTGATAGAACGGGAAAGAGGGGGAGATGCCGTGGACATCTCCCTGCTGAAGAGTTTATTGAGGATGCTGTCCGACCTTCAGATATACCAGGATGCCTTTGAACACAAATTCCTGCAGGCCACAGAGCGTCTGTACTGCGCGGAGGGCCAGCGTCTGATGCGAGAGTTAGCAGTGCCGCAGTATCTGGCACACGTGGAGAAGAGACTCAGGGAGGAGAACGAGCGGCTCCTGCACTATCTGGACCCCTGTACCAAATGGCAGCTCATCCATACGGTGGAGCGTCAGTTGTTGAGCGAGCATGTCAGCGGTGTACTCAGCAAGGGACTCGAGTCGCTTATGGACGGGCCGCGCCTCAGAGACCTCGCCACCCTATACTCACTGTTCAGCCGAGTCAAGGACGGACTCACTGAGCTGTGTAACCACTTTAATGCGTACATTAAGAAAAAAGGTCGAACCATAGTCATCGAGCCGGAGCGTGACAAGACGATGGTAGCGGAACTGTTGGAATTCAAAGAGCAGCTGGACAATGTTGTGAGCACGTGCTTCCAGAGGAACGACCGGTTCCTGTACTCCATGAGAGAGGCCTTCGAGCACTTCATCAACCAGAGACAGAATAAACCGGCTGAGCTCATTGCCAAATTCGTCGATCTCAAACTGAGAGCCGGCAACAAAGAGGCGACGGAGGAAGAATTAGAAAGACTGCTGGACAAAATAATGGTTCTATTCCGTTTTATACACGGGAAGGATGTGTTCGAGGCATTCTACAAGAAGGATCTAGCAAAGAGGTTGTTGCATCTATCAGCGACCAGCGAGGGCGGGGGGCTCGAGCTGTCCGTGTACATCCTGACCATGGGTTTCTGGCCGACGTACGCGGCCGTGGACGTGCGGCTGCCGGGAGAACTCACCCGCCACCAGGAACACTTCGCCAAATTCTACCTCGCCAAGCACTCCGGCAGGAAGCTACAGTGGCAGGCGACGCTGGGACACTGTGTACTGAGAGCGCACTTCACACAGGGTAACAAAGAACTTCAGGTCTCGTTGTTCCAAGCGCTGGTTCTGCTACTCTTCAATGATGGAGACAATCTCTCCTTTGAAGACATTAAGACTGCCACTAACATCGAGGAGGGGGAGCTGCGCCGCACTCTCCAGTCGCTGGCTTGTGGTAAGGCGCGCGTGCTGATGAAGACCCCTCGGGGGAGGGACGTGCAGGACCGGGATCACTTCGCCTTCAACGGGGACTTCACCAACAAGCTGTTCCGCATCAAGATCAACCAGATACAGATGAAGGAGACTAGCGAGGAACAGAAGGCCACCGAGGAGCGAGTGTTCCAAGATCGTCAGTATCAGATAGACGCGGCCATTGTGCGCGTCATGAAGATGAGGAAGGCTCTCTCACACAACCTCCTCATATCCGAACTATACAACCAGCTCAAATTTCCCGTCAAGCCGGGGGACCTCAAGAAGCGGATAGAGTCCCTCATCGACCGCGACTACATGGAGCGAGACAAGGACAACCCCAACCAGTACAACTACGTCGCGTAA

Protein sequence:

>DPOGS215697-PA
MNKPGATTKKLVIKNFKSKPNLPENYQETTWSKLREAVIAIQTSKAIAYSLEELYQAVENMCSHKMASQLYVNLTNLVEAHVKSNIEQFLSESMDRQVFLKRMDDCWRAHCRQMIMIRSIFLYLDRTYVLQNPSIHSIWDMGLDLFRHHIAMNTLIQTRTVDGLLTLIERERGGDAVDISLLKSLLRMLSDLQIYQDAFEHKFLQATERLYCAEGQRLMRELAVPQYLAHVEKRLREENERLLHYLDPCTKWQLIHTVERQLLSEHVSGVLSKGLESLMDGPRLRDLATLYSLFSRVKDGLTELCNHFNAYIKKKGRTIVIEPERDKTMVAELLEFKEQLDNVVSTCFQRNDRFLYSMREAFEHFINQRQNKPAELIAKFVDLKLRAGNKEATEEELERLLDKIMVLFRFIHGKDVFEAFYKKDLAKRLLVGKSASVDAEKSMLSKLKQECGGGFTCKLEGMFKDMELSKDINITYKQMASQLYVNLTNLVEAHVKSNIEQFLSESMDRQVFLKRMDDCWRAHCRQMIMIRSIFLYLDRTYVLQNPSIHSIWDMGLDLFRHHIAMNTLIQTRTVDGLLTLIERERGGDAVDISLLKSLLRMLSDLQIYQDAFEHKFLQATERLYCAEGQRLMRELAVPQYLAHVEKRLREENERLLHYLDPCTKWQLIHTVERQLLSEHVSGVLSKGLESLMDGPRLRDLATLYSLFSRVKDGLTELCNHFNAYIKKKGRTIVIEPERDKTMVAELLEFKEQLDNVVSTCFQRNDRFLYSMREAFEHFINQRQNKPAELIAKFVDLKLRAGNKEATEEELERLLDKIMVLFRFIHGKDVFEAFYKKDLAKRLLHLSATSEGGGLELSVYILTMGFWPTYAAVDVRLPGELTRHQEHFAKFYLAKHSGRKLQWQATLGHCVLRAHFTQGNKELQVSLFQALVLLLFNDGDNLSFEDIKTATNIEEGELRRTLQSLACGKARVLMKTPRGRDVQDRDHFAFNGDFTNKLFRIKINQIQMKETSEEQKATEERVFQDRQYQIDAAIVRVMKMRKALSHNLLISELYNQLKFPVKPGDLKKRIESLIDRDYMERDKDNPNQYNYVA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: