MonarchBase - Protein-coding gene

DPOGS203908
Transcript	DPOGS203908-TA	3288 bp
Protein	DPOGS203908-PA	1095 aa
Genomic position	DPSCF300005 - 951402-967368
RNAseq coverage	392x (Rank: top 31%)

Annotation
*Heliconius*	HMEL003979	0.0	60.48%
*Bombyx*	BGIBMGA000486-TA	0.0	59.19%
*Drosophila*	per-PA	2e-105	46.38%
EBI UniRef50	UniRef50_Q7Z0C9	0.0	95.98%	Period protein n=2 Tax=Obtectomera RepID=Q7Z0C9_DANPL
NCBI RefSeq	NP_001036975.1	0.0	55.98%	period [Bombyx mori]
NCBI nr blastp	gi\|32483353	0.0	95.98%	period protein [Danaus plexippus]
NCBI nr blastx	gi\|32483353	0.0	95.98%	period protein [Danaus plexippus]

Group
Gene Ontology	GO:0005515	2.1e-07	protein binding
	GO:0007165	1.9e-06	signal transduction
	GO:0004871	1.9e-06	signal transducer activity
	GO:0006355	7.5e-06	regulation of transcription, DNA-dependent
KEGG pathway	tca:659015	2e-143
	K02633 (PER)	maps->	Circadian rhythm - fly
			Circadian rhythm - mammal
InterPro domain	[910-1072] IPR022728	5.1e-34	Period circadian-like, C-terminal
	[329-413] IPR013655	2.1e-07	PAS fold-3
	[305-371] IPR000014	1.9e-06	PAS
	[171-240] IPR013767	7.5e-06	PAS fold
Orthology group	MCL15652		Insect specific

Nucleotide sequence:

>DPOGS203908-TA
ATGGACAACTTGGATGACTCCGAGAACAATGCTAAGATATCCGACTCCGCATATTCCAACAGCTGCAGCAACAGTCAATCGAGGAGAAGCCACAGCTCCAAATCTACACATTCTGGAAGCAATTCAAGTGGAAGCAGTGGGTATGGCGGTAAGCCATCGACTTCCGGCTACAGCAATAACTTAAGTCAGCCACCGGAAAAATGGATTAAAGAAAAAGAATCAAAAAAGAAAAAGCCTGTACAGGTAGAATTGAAACCATCTGAAGAGAAAATAGAAGAATGTCCACAGGAGCTCGCACCTGTATGTGAGGCGCCTAAAGAAGAAACTAAAGATGTTAACCGCACCCCGACTCCATCTTTGGTGCAAACCGAAAAGGGTCCGGAGAACATGGAAATAACAACGTTAAAAAGAAACGATGAAAAAGATGAGTCTGTTTCGTCTAACGCGCCTATGGTGACTTCGCTCAATTTAGTCACGGGACGCTCAAATTCTCCTTCCTGTCCTGAAAGCTTCTCCTGTGTCATATCAATGCAAGATGGTGTGGTCATGTTCACAACGTCCTCCATAGTTACTGCTCTCGGCTTTCCAAAGGACATGTGGATTGGCAGATCATTTATAGATTTCGTTCATCCAAGGGATCGGAACACCTTTGCATCGCAGATCACTAGTGGTCTGGCTGTGCCTAAAAATGTTAATGGTACGCAAGAAAAAGCTCCTGTTCCAGGAAATCATGTTTCGACGATGGTATGTCGCATACGGCGTTACAGAGGTCTCAATCTGGGTTTCGGCATTAAAGAGAAAACCGTTTCATTTATGCCGTTCCTATTAAAGTTCTTCTTCAAAAACATTAACGATGAAGATGGCCAGGTTATATACTTGGTTATACAGGCGACACCATTTTTTTCCGCTTTTAAAACTTCGGCAGAGATAATACATAATGCAATACCATTTGTGATAAGGCACTCGGCTACGGGAAGTTTAGAGTACATAGACCATGAATCGGTGCCTTACCTTGGCTACTTGCCACAGGATATTGTTGAGAAAGACGCCTTGCAGTTGTACCATCCAGGCGATCTTGGATACCTGAGGCAGATTTACGAGACGATTGTAAAGGAAGGCGGAGTTCAACGGTCCAAACCTTACAGAATGATGGCTCAGAACGGGGATTATCTGAAATTAGAGACGGAATGGTCTTCATTCATAAATCCTTGGTCAAAGAAACTAGAATTTGTTATTGGTAAACACTACATCGTGGAGGGTCCATCGAATCCAGACGTTTTCCAAATGCCTGATCCTGAAAAATCTCTTAAATTTACCGATGATGAGAAGGCTAAAGCTGCTGCACTAAGGGAAAAAATTACTAGAGTTATGACCGAGGTCCTTACAAAACCAGCTGAAATAGCTAAACAGCAGATGAGTAAAAGATGCCAGGATCTCGCTTCCTTCATGGAGAGTCTGATGGAGGAGACACCCAAGATAGAAGAAGAACTACGTCTTGAAATACAGGATCAAGATCATAGTTATTATGAACGTGATTCTGTAATGCTCGGCGGTATCTCGCCACACCACGACCACAGCGACAGCAAGTCAGGCACCGACACACCAGTCAGCTACAACCAACTTAATTACAACGAAACTCTTCAAAGATATTTTGACAGTCACGAACCATACAGCTTCGAAGATTATTATTTAATGGATAGCGAAAATAAGATCCAAATGAAAGAAAATGAAGAAGGTTCTGTGAGCAAATGTATATCTCCGATGGCACAAGCTTCGACGGAGTGTGATCGGACCAGTTCCTCCGAATGCAGTGGTCTTGGTATAGGGAACTCTTGTCCTTGTGACTACCAGCCAATGCGATTGACAGAGTCATTGCTTAACAAGCACAACGCAGAAATGGAAAGAGAACTAATAAAAATGTATCGTGAAAACCGTTCAAGTAAAGGAGATAGAGAGAAAGCCTCCAACGAAACGAGACAAAAGAAGAAACAACATTTAGCAAGATGTAATGCGGCTTTTCAACCGACGTCGTTGGGACTGCCCGATTCTCAGCCCCATGGAGTGAAGCGTCCCTCAAAACAGGCGGAAGAAGCCAGCGCCCACAAACACAGATGCTCGTCGCCACGTCCGATCCGACATTCAGCGGTATCAAACAACCAGCCAGTAGCCATCAACTCAGTCGTGACTAATATGTGGCCTACCACTGCAGCTAACACCATGAACACGTGTCACCTCCAAGGATTGGGGATGCCACCACAGGTTTCATTCATGACACCAATGGCTATGCCGGGTCAATATCCGATGTGCTATATTCCAGTGCCCGTACAACCTATACAGCCGCAGTCAGATTCATATCAAAATACAAATTCAAATAACAATTATCCTTATCAACCTCAACCGATGCCATACATGATGTATGGCCATGCTATGTACGGATCTCCGTTTATGTATCCGTCTGTGGATCCGAGGACGTACGTGCCTCAAACTACGTCCGGTCATAACATACCACCTTTCGGACTGTCCAGTAGTAACTACCAAGAAGCTTGTAAACTAACTGTGCCATTGAAGACATCTAAAGCGTGTCGCATCACAAGGGAGAATCACAATCAAGCACTAAGAAGAGACGGCGTCAATTATTCAGCTGGCACATCGAATCGGAATACCGAAGTGAATAACGATAAGGACATTCGTAAGCCTCGTGCCACAAACAGTAATCGCACAGTTGAGAAAACTGACGAAGAATCAAGTTTCTCATCGTTTTATTCATCTTTCTTTAAAACTGAATCTGGTAGTGCTGAAGATAGCGATGCCAAAAAGAGTTGGCACAAAAATCATAAGGGCGATGATCTTATGTCATTGCAAAGTTCTACAGAGGCTGTCACGTATGCACCAAACAAGAGCCAGGCACAACAGAAAAAGGTTGATCCGTCGTGGGTTGAAGAAGTTTGCGTAACATCAGAATTAATTTACAAATATCAGATTCGGACGAAGAGTTTAGAGGAAGTACTTTCGGAAGATAAAAAGAAATTGGAAACTTTGGAACAGCCTCTACTCGTGAGTCAACAGCTGGGTCAATTGTACTTGGATCTGCAACTTCAAGGAGTTGCTGCCAGATTGACTTTAGAAGAAGGAATCACCAGTTCTAGCAGTTCGGGTGAAGAGAATTCGTCGATGTCATCTAAGAAGATACGTCGTAGGAAACGGGAATACAGCAAATTAGTGATGATATATGAAGAGGACGCTCCACTACCACCTCCAGATAACGTTGCCGGTACATCAGATTCTTAG

Protein sequence:

>DPOGS203908-PA
MDNLDDSENNAKISDSAYSNSCSNSQSRRSHSSKSTHSGSNSSGSSGYGGKPSTSGYSNNLSQPPEKWIKEKESKKKKPVQVELKPSEEKIEECPQELAPVCEAPKEETKDVNRTPTPSLVQTEKGPENMEITTLKRNDEKDESVSSNAPMVTSLNLVTGRSNSPSCPESFSCVISMQDGVVMFTTSSIVTALGFPKDMWIGRSFIDFVHPRDRNTFASQITSGLAVPKNVNGTQEKAPVPGNHVSTMVCRIRRYRGLNLGFGIKEKTVSFMPFLLKFFFKNINDEDGQVIYLVIQATPFFSAFKTSAEIIHNAIPFVIRHSATGSLEYIDHESVPYLGYLPQDIVEKDALQLYHPGDLGYLRQIYETIVKEGGVQRSKPYRMMAQNGDYLKLETEWSSFINPWSKKLEFVIGKHYIVEGPSNPDVFQMPDPEKSLKFTDDEKAKAAALREKITRVMTEVLTKPAEIAKQQMSKRCQDLASFMESLMEETPKIEEELRLEIQDQDHSYYERDSVMLGGISPHHDHSDSKSGTDTPVSYNQLNYNETLQRYFDSHEPYSFEDYYLMDSENKIQMKENEEGSVSKCISPMAQASTECDRTSSSECSGLGIGNSCPCDYQPMRLTESLLNKHNAEMERELIKMYRENRSSKGDREKASNETRQKKKQHLARCNAAFQPTSLGLPDSQPHGVKRPSKQAEEASAHKHRCSSPRPIRHSAVSNNQPVAINSVVTNMWPTTAANTMNTCHLQGLGMPPQVSFMTPMAMPGQYPMCYIPVPVQPIQPQSDSYQNTNSNNNYPYQPQPMPYMMYGHAMYGSPFMYPSVDPRTYVPQTTSGHNIPPFGLSSSNYQEACKLTVPLKTSKACRITRENHNQALRRDGVNYSAGTSNRNTEVNNDKDIRKPRATNSNRTVEKTDEESSFSSFYSSFFKTESGSAEDSDAKKSWHKNHKGDDLMSLQSSTEAVTYAPNKSQAQQKKVDPSWVEEVCVTSELIYKYQIRTKSLEEVLSEDKKKLETLEQPLLVSQQLGQLYLDLQLQGVAARLTLEEGITSSSSSGEENSSMSSKKIRRRKREYSKLVMIYEEDAPLPPPDNVAGTSDS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: