MonarchBase - Protein-coding gene

DPOGS213934
Transcript	DPOGS213934-TA	1053 bp
Protein	DPOGS213934-PA	350 aa
Genomic position	DPSCF300226 - 185226-189493
RNAseq coverage	222x (Rank: top 45%)

Annotation
*Heliconius*	HMEL002844	3e-179	86.57%
*Bombyx*	BGIBMGA003377-TA	0.0	86.61%
*Drosophila*	CG8142-PA	9e-118	56.25%
EBI UniRef50	UniRef50_Q9VX15	1e-115	56.25%	CG8142 n=16 Tax=Coelomata RepID=Q9VX15_DROME
NCBI RefSeq	NP_001040483.1	1e-180	86.61%	replication factor C4 [Bombyx mori]
NCBI nr blastp	gi\|114052591	3e-179	86.61%	replication factor C4 [Bombyx mori]
NCBI nr blastx	gi\|114052591	2e-172	86.61%	replication factor C4 [Bombyx mori]

Group
Gene Ontology	GO:0005524	2.6e-15	ATP binding
	GO:0003677	1.9e-14	DNA binding
	GO:0006260	1.9e-14	DNA replication
	GO:0000166	5.1e-12	nucleotide binding
	GO:0017111	5.1e-12	nucleoside-triphosphatase activity
	GO:0005663	1.4e-10	DNA replication factor C complex
	GO:0003689	1.4e-10	DNA clamp loader activity
KEGG pathway	tca:663583	1e-122
	K10755 (RFC2_4)	maps->	DNA replication
			Mismatch repair
			Nucleotide excision repair
InterPro domain	[66-191] IPR003959	2.6e-15	ATPase, AAA-type, core
	[255-346] IPR008921	1.9e-14	DNA polymerase III, clamp loader complex, gamma/delta/delta subunit, C-terminal
	[62-196] IPR003593	5.1e-12	ATPase, AAA+ type, core
	[261-342] IPR013748	1.4e-10	Replication factor C
Orthology group	MCL12903		Single-copy universal gene

Nucleotide sequence:

>DPOGS213934-TA
ATGCAGGCATTTTTAAAAACCGGCAAGATATCAAGTACTGATAAACCATCTACTTCGGGAGTTAAATCCACAAAGAAAAAGGCTCCAGCTCCATGGGTTGAAAAATACCGTCCAAAAACTATAGATGATATCGTTGATCAAGGAGAAGTGGTTCAAGTTTTAAGAGAATGTCTGGCTGGAGGTGATTTACCACATCTGTTGTTTTATGGTCCACCAGGAACTGGTAAAACAAGTGCTATCTTGGCTGCTGCTAGACAGCTCTTTGGAGACATTACTAGAGAGCGAGTTCTTGAACTGAATGCTTCAGATGAAAGAGGAATACAAGTCATAAGAGATAAAGTAAAAACTTTTGCCCAGTTAACAGTCAGCAATACAAGACCAGATGGCAGACCGTGCCCGCCATACAAACTGGTTATCTTGGACGAAGCAGATTCAATGACAACGGCAGCGCAGGCAGCCTTACGTCGAACTATGGAGCGAGAGACGAGGACTACACGTTTTTGTCTCATATGTAATTATGTATCAAGAATCATTCCACCAATTACCAGCAGATGTTCGAAGTTTCGATTCAAACCGCTGGCGAGGGAGAATGTTATCAAGAGATTACAAGAAGTATGTAAATCAGAGGCTGTGGAGGTTGGTGATGGTGAAGTACTCCATCAAGCTGTGGACACATGTGGGGGAGATCTTAGGCGAGCACTCACAGCACTGCAGTGCTGTCAGCGCTTACTCGGCAAAATTACAGCTGATGGATTAATTGAGGTGACGGGACTCGTACCTGAAAATCTAGTGGATGAATTTCTAAACGTGAAAAACTACAATGAGTTGGAGAGATTCGTTGAGAATTTTCTCATGGACGCGTATTCAGCATCTCAATTATTGGAACAGCTGTCAGAGAGAGTGGTGAATGCTGGTCATTTGACTAACAAGCAGAAGTGTGTGATTAGTGAGAAGCTGGCTGTGTGTTCTCACCGACTACTAGAGGGTGGAGCTGAGGTGATGCAGCTGACAGACCTCGGCTGTACCGTGATCATGGCTAATAATAACCCGTGA

Protein sequence:

>DPOGS213934-PA
MQAFLKTGKISSTDKPSTSGVKSTKKKAPAPWVEKYRPKTIDDIVDQGEVVQVLRECLAGGDLPHLLFYGPPGTGKTSAILAAARQLFGDITRERVLELNASDERGIQVIRDKVKTFAQLTVSNTRPDGRPCPPYKLVILDEADSMTTAAQAALRRTMERETRTTRFCLICNYVSRIIPPITSRCSKFRFKPLARENVIKRLQEVCKSEAVEVGDGEVLHQAVDTCGGDLRRALTALQCCQRLLGKITADGLIEVTGLVPENLVDEFLNVKNYNELERFVENFLMDAYSASQLLEQLSERVVNAGHLTNKQKCVISEKLAVCSHRLLEGGAEVMQLTDLGCTVIMANNNP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: