MonarchBase - Protein-coding gene

DPOGS213538
Transcript	DPOGS213538-TA	1800 bp
Protein	DPOGS213538-PA	599 aa
Genomic position	DPSCF300033 - 496536-498764
RNAseq coverage	236x (Rank: top 43%)

Annotation
*Heliconius*	HMEL005473	0.0	70.96%
*Bombyx*	BGIBMGA011818-TA	0.0	65.18%
*Drosophila*	dup-PA	3e-90	38.70%
EBI UniRef50	UniRef50_D6WGF9	3e-96	37.17%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WGF9_TRICA
NCBI RefSeq	XP_393349.3	2e-101	41.70%	PREDICTED: similar to double parked CG8171-PA [Apis mellifera]
NCBI nr blastp	gi\|382546457	0.0	65.18%	DNA replication factor Cdt1 [Bombyx mori]
NCBI nr blastx	gi\|382546457	0.0	65.29%	DNA replication factor Cdt1 [Bombyx mori]

Group
KEGG pathway
InterPro domain	[231-390] IPR014939	1.4e-47	DNA replication factor CDT1-like
Orthology group	MCL14070		Single-copy universal gene

Nucleotide sequence:

>DPOGS213538-TA
ATGTCTCAAACGACATTAACAACATTTTTTAACAGTAGAAAAAGACCAGCAACGGAAGACATAGCGAGTACGAAGAATAAAATAGCACACTTGGAACGTTTAGATCCAATCACTAAATCGGGTAGAAAATCTCCATTTCCTAAAAATGATTTACTGCTACATAATGGCAAAGAATTAAACCATGTCACCAAAGTTGAAAATTCCAAGAAACTAGATTCGGAGCAGAAGTTGACCAAAAAACCTGAAAATACATCAGAGCAACAGAAAGCTGTTGCCTTCAGTAAAAAATCAATGTCTCTAATATTGCTAAAAACAGTGAAACCTCCAAAACGGAACACGTCACTGAAGCTCGAAAAGAACTATGTTTGGAGGTTAGCTGGCAGCAGTAGATTATCCGAATTAAGAGCTACAGCGGAACGTCTTAGCAAAGGTATTCAGGAACTAAAAGAAAGTAGTGATAAAAAGAACTTAAAAGAGTTTAAATCTATTAATGTGGATGTACCCCAGAGTCCTAGCAAGAAATCATTAAATCGTCATGAGTTTTTGTCACCTACGAAGCAAGACAGTGTCTCAAGTCAGCAAATACCTTTACTGTCTCCAAGAAAAGTTTTTGTTAGTCCTATCAAAAGTCCAAGCAAAGTACCAGCATACATTAGACATGCCTCTTTGGCTGCTCCATCCAATCTTCAGCTGCCACATCACTATAGATTTCTGGCTGAGCTATTCCGAGGTATGGAAACGGTTGTCGCACTCCTCTATAACAGGAATGAAAAGATCACTTTCAATAAACTGAAGCCTTCTATTCAAGAAATGCTCAAGAGAAGCTTCTGTGAAAAACATTTGGCGCAAATAAAATACTTAGTCCCTGACTTTTATAACTTTGAAGTACAGAAGATAAAGAGTTTTACCTCTACAAATCACAAAGAAACATTTGAACTCATCATATCTCCCAATTTTCCTAATGATATCAAAATCATGAATCCAAGTGTTCTCCTTGAAAGGCGGAGATATTTCTACAATACTTTACTTCAATTGGTGAAAAAGCACCATGCTCAATTTCTCTCAACTCTGGATCCTCCGATTGAAATCCCTGACAATAAGTTAGTGAGATGGCATCCTGAGTTTGAACTTGAAAAGATACCAGACATTGATGGAGCTAAACTGCCCGAATTGCCAAATACCGAAAAATTCTCTTCAGCCCAAGATGTTCTTGCAAAAGCCAGAGAACTTTTTAAATGTAATACTAAAATGGAAAGAGCGCTCGAAAAACTTGCACAAGCTAAAGCAAGAGGTTTAACTGAACAAGAAAAAGCTGTCACCGGTTTAAATGAATCCCCAAAGAAGAATGTATCTACTCAGATAAGCCAACCGTCAACAAGTGGGATTCAAATTTTGAACCCTGCCCTTCGTAATCTACCAGCGGCCTTATTGGAAAAGGTCAAAGCTAAACAAGCAGCTAAAGCATTTGAAGCAATGACTAGATCTTCGGAAACTGAACATAAATACCTGATCTACACTCGCCTTCCAGATTTGGCGAGGACTTTAAGGAATATATTTGTTACAGAGAGGAAAAATGTACTCGCACTCAATATAGTGCTCTCAAAACTTGATAGCAGTTTCAAATCTAATGTCTCTGCTAATGAGTTACAAAAGGACATAAAGCTACTGACCGAGGAAGTCCCAGATTGGATCAAACTTCATGAAATTAGGAACGCCACATATCTGAAACTAGACAAAAATACAGACTTGAAGATAATAACTTCGAAACTGGAAGCGGCTGCGCAAAAATATAAAGATTAA

Protein sequence:

>DPOGS213538-PA
MSQTTLTTFFNSRKRPATEDIASTKNKIAHLERLDPITKSGRKSPFPKNDLLLHNGKELNHVTKVENSKKLDSEQKLTKKPENTSEQQKAVAFSKKSMSLILLKTVKPPKRNTSLKLEKNYVWRLAGSSRLSELRATAERLSKGIQELKESSDKKNLKEFKSINVDVPQSPSKKSLNRHEFLSPTKQDSVSSQQIPLLSPRKVFVSPIKSPSKVPAYIRHASLAAPSNLQLPHHYRFLAELFRGMETVVALLYNRNEKITFNKLKPSIQEMLKRSFCEKHLAQIKYLVPDFYNFEVQKIKSFTSTNHKETFELIISPNFPNDIKIMNPSVLLERRRYFYNTLLQLVKKHHAQFLSTLDPPIEIPDNKLVRWHPEFELEKIPDIDGAKLPELPNTEKFSSAQDVLAKARELFKCNTKMERALEKLAQAKARGLTEQEKAVTGLNESPKKNVSTQISQPSTSGIQILNPALRNLPAALLEKVKAKQAAKAFEAMTRSSETEHKYLIYTRLPDLARTLRNIFVTERKNVLALNIVLSKLDSSFKSNVSANELQKDIKLLTEEVPDWIKLHEIRNATYLKLDKNTDLKIITSKLEAAAQKYKD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: