MonarchBase - Protein-coding gene

DPOGS208741
Transcript	DPOGS208741-TA	1449 bp
Protein	DPOGS208741-PA	482 aa
Genomic position	DPSCF300043 + 335638-345109
RNAseq coverage	880x (Rank: top 14%)

Annotation
*Heliconius*	HMEL015237	1e-103	94.42%
*Bombyx*	BGIBMGA003403-TA	0.0	80.27%
*Drosophila*	E2f-PA	6e-41	47.96%
EBI UniRef50	UniRef50_B6ZL89	0.0	80.27%	E2F1 n=3 Tax=Obtectomera RepID=B6ZL89_BOMMO
NCBI RefSeq	XP_001607080.1	5e-69	40.31%	PREDICTED: similar to transcriptional activator [Nasonia vitripennis]
NCBI nr blastp	gi\|350538465	0.0	80.27%	E2F transcription factor 1 [Bombyx mori]
NCBI nr blastx	gi\|350538465	0.0	80.85%	E2F transcription factor 1 [Bombyx mori]

Group
Gene Ontology	GO:0006355	3.5e-21	regulation of transcription, DNA-dependent
	GO:0005667	3.5e-21	transcription factor complex
	GO:0003700	3.5e-21	sequence-specific DNA binding transcription factor activity
KEGG pathway	mdo:100017977	5e-47
	K06620 (E2F1_3)	maps->	Prostate cancer
			Glioma
			Melanoma
			Small cell lung cancer
			Pathways in cancer
			Pancreatic cancer
			Bladder cancer
			Non-small cell lung cancer
			Cell cycle
			Chronic myeloid leukemia
InterPro domain	[50-479] IPR015633	3.9e-78	E2F Family
	[120-187] IPR011991	1.8e-26	Winged helix-turn-helix transcription repressor DNA-binding
	[123-187] IPR003316	3.5e-21	Transcription factor E2F/dimerisation partner (TDP)
Orthology group	MCL15618		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208741-TA
ATGCCGAGGGGGGTGAAGCGAGGAGCGGCGGAAGGCGAAGCTGAGGTGGTGGTACGCGTCGGGGCTTCTCCGTCGCACACCACGCTCCTGGACGACAGCCCTAGCCAGCCCATAAGCTACCACCTGCTCGACCATGGCTATGGTGCCACACCTCAACACCAAATACGCCGGGAAGCGCCCACCGCACCGCCGAAGACATCTGAAGCGGTGAAACGTAGACTGAACCTGAGCGAGAGCAGCTCAGGCAGCCAGGGTCACGTGGTGCCGATGAAGGCGGACTTCAAGACGCCCAAGCAGAAACGCGTCAAAGTCCTAACCCCGTACAGCCGACCGTCCAGTTCTATGAAAAAATACACAGAACGCTCCAGGTTTGACACGTCATTGGGTCTACTGACGAAAAAGTTTGTAGCTCTCCTCAAGTCGTCGCCGAACGGTGTTTTAGATCTTAATATAGCAGCTGAGCATCTCTCTGTACAGAAACGCCGAATATACGACATCACAAACGTATTAGAGGGTATAGGAATATTAGAGAAGAGATCCAAAAATAATATACAATGGAAATGTGGTGTAGGAGGTGGAGGAGTGAACGAAGAGAACCGTGTGCGTCGTCTGCGGCGCGAGGTGCGGTCGCTGGGCGGGCGGGAGGCGCGGGTCAGTCGAGCGGTGGCCGCGGCCGAGCAGGCGCTGTCTCGACTGTCGGCGGAGCACGGGGCGAGGGCCTACATAACGTACGCGGACCTCAGGTCCATTAAGGACTTTAGAAATCAAACTGTTATACCCATCAAGGCCCCGCCGGACACCAGGCTCAGTGTACCACATCCAGATGAGAAAGGGTATATGATACATCTCAAATCAATTTCTGGAGAAATAGAAGTGTACCTCTGTCCTAAAGAACGTCCGCCCACGCCGCCGCCCTCATCTGGTGTGTTGCCATCGGATCCCTTGTTGGAGGATAACAAAGCTCTCCTGGCTCCGCTCATCGCCCAGCTTCAAACACTACCCTCCAGTTCCATCTCAGCCGCCTTCACAACACCAATAAAGCGTGAGCCGGATGAAGGAGCGTGGTCCCGTAGCCTCGTGGTTCGTACTCCGTGCGTCACGGATCCCACCCTGCCGCTGACGCCGGCGTTATCGACCCCCACAGCCCCCACCACACCAGTCGGACCAGCTGCGCCCACCACGCCCACCACGCCGGCACACGCCACTATGACCACACCTGATACGGGAGGCGCCCGTGGTCGTCTTCGGAACGCGTTGATAGCGGACAGCGACGACTTCGCGCCCATCATGGGCGGTGGGCGGTTCCAGCTGCAAACTGAAGACCAGGAGTCAGAGCAAATGGAGTTGGAGCCGTTCCTGCCTCTCGAGCCGCCGATGTCCGCCAACGACTACGGCTTCTGTCTCGACCACGACGAGGGGCTCTCGGAACTGTTTGACTTTGAATTTTAG

Protein sequence:

>DPOGS208741-PA
MPRGVKRGAAEGEAEVVVRVGASPSHTTLLDDSPSQPISYHLLDHGYGATPQHQIRREAPTAPPKTSEAVKRRLNLSESSSGSQGHVVPMKADFKTPKQKRVKVLTPYSRPSSSMKKYTERSRFDTSLGLLTKKFVALLKSSPNGVLDLNIAAEHLSVQKRRIYDITNVLEGIGILEKRSKNNIQWKCGVGGGGVNEENRVRRLRREVRSLGGREARVSRAVAAAEQALSRLSAEHGARAYITYADLRSIKDFRNQTVIPIKAPPDTRLSVPHPDEKGYMIHLKSISGEIEVYLCPKERPPTPPPSSGVLPSDPLLEDNKALLAPLIAQLQTLPSSSISAAFTTPIKREPDEGAWSRSLVVRTPCVTDPTLPLTPALSTPTAPTTPVGPAAPTTPTTPAHATMTTPDTGGARGRLRNALIADSDDFAPIMGGGRFQLQTEDQESEQMELEPFLPLEPPMSANDYGFCLDHDEGLSELFDFEF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: