MonarchBase - Protein-coding gene

DPOGS210404
Transcript	DPOGS210404-TA	1149 bp
Protein	DPOGS210404-PA	382 aa
Genomic position	DPSCF300831 + 255-3028
RNAseq coverage	64x (Rank: top 68%)

Annotation
*Heliconius*	HMEL015614	0.0	81.15%
*Bombyx*	BGIBMGA006931-TA	2e-46	64.29%
*Drosophila*	DNApol-alpha50-PA	5e-89	44.67%
EBI UniRef50	UniRef50_E2BLF5	4e-98	50.72%	DNA primase n=15 Tax=Coelomata RepID=E2BLF5_HARSA
NCBI RefSeq	XP_001601538.1	2e-96	50.43%	PREDICTED: similar to DNA primase [Nasonia vitripennis]
NCBI nr blastp	gi\|307204968	1e-97	50.72%	DNA primase small subunit [Harpegnathos saltator]
NCBI nr blastx	gi\|307204968	7e-96	50.72%	DNA primase small subunit [Harpegnathos saltator]

Group
Gene Ontology	GO:0006269	7.7e-136	DNA replication, synthesis of RNA primer
	GO:0003896	7.7e-136	DNA primase activity
KEGG pathway	nvi:100117238	6e-96
	K02684 (PRI1)	maps->	Purine metabolism
			DNA replication
			Pyrimidine metabolism
InterPro domain	[1-318] IPR014052	7.7e-136	DNA primase, small subunit, eukaryotic/archaeal
	[92-320] IPR002755	8e-50	DNA primase, small subunit
Orthology group	MCL12380		Single-copy universal gene

Nucleotide sequence:

>DPOGS210404-TA
ATGTTACCTGTGTATTATACAAGATTATTTCCTCAGAATATATTTTGTAGATGGCTTGCTTGTGGCAGTAGCCCTCAGCCTCTATCTAACAGAGAGTTATCATTTACACTTGCTGATGATATATACTTACGGTATCTTTCTATTAACAATCAAAAAGAATTCCAAACACTATTACAAAAGAAGTGCCCTCATAAATTAGACATTGGCGCTGTCTACAACACAAAGCCATCCATTGGGCGCCATGATGCAGTTGTGCTGTCCAGGGAACTTGTGTTCGATATTGATCTTACAGATTATGATGAAGTACGAACTTGTTGTCAGGAGGCCAAAGTTTGTAACAAATGCTGGAAATTTATTGTGGTAGCATGTGAAATTATTAACGCTGCTCTGAAAGATGATTTTGGTTTCCAGAATATTCTTTGGGTTTTCTCTGGTAGAAGAGGTTGTCATTGTTGGGTATCAGACTATGAAGCAAGAACACTAGATAGTCCTGGTCGTGCTGCTATTGCTGATTACCTTTGCCTTATTTTTGGAGGGGAAAATAAAAATAAGAAAGTACATCTTGGAAGTGATAACTTGCACTCTAGTATAAAGAGGTCTCTTAATATTATTGATAGATATTTCCTTGAAATACTAGAAGATCAAGATTTTTTGTCAACTTCGGAGGGCACAAAAAAATTTCTAAAAATAATACCAGATGACACCTTACGTAAACAAGTTGAAGATAGCTTCGGAAGAGGATTGTCTACTGTTGACAAATGGGAATGTTTCATACAAACTTACTATCAGTTCTGTAAAGAGAATATTAACGCTATCAGAAAAATGAAATACCTAGTCGAAGAAATTAAAATACAATATTGTTATCCAAGATTAGATGTGAATGTTACAAAGGGCTTTAACCATTTACTTAAATCTCCATTTAGTATACATCCTAAGACTGGTAAAGTATCCATAGTATTCAAACCAGAAAATGCCCGAAACATGAAATTAGAAGATATACCAACCATTTACAGCCTTCTAGATGATAACTCTCCAGATAAAATTCAACATCAAAATAATATGAGAACAGCTGTTAAAAATTTTCAAGAAGTGGTCTTCTCACTGGAGAAAACTGAAGCATTGAGAAGAAGGAATGAAGCTAGTAAGTAG

Protein sequence:

>DPOGS210404-PA
MLPVYYTRLFPQNIFCRWLACGSSPQPLSNRELSFTLADDIYLRYLSINNQKEFQTLLQKKCPHKLDIGAVYNTKPSIGRHDAVVLSRELVFDIDLTDYDEVRTCCQEAKVCNKCWKFIVVACEIINAALKDDFGFQNILWVFSGRRGCHCWVSDYEARTLDSPGRAAIADYLCLIFGGENKNKKVHLGSDNLHSSIKRSLNIIDRYFLEILEDQDFLSTSEGTKKFLKIIPDDTLRKQVEDSFGRGLSTVDKWECFIQTYYQFCKENINAIRKMKYLVEEIKIQYCYPRLDVNVTKGFNHLLKSPFSIHPKTGKVSIVFKPENARNMKLEDIPTIYSLLDDNSPDKIQHQNNMRTAVKNFQEVVFSLEKTEALRRRNEASK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: