MonarchBase - Protein-coding gene

DPOGS203050
Transcript	DPOGS203050-TA	3258 bp
Protein	DPOGS203050-PA	1085 aa
Genomic position	DPSCF300206 + 25605-30863
RNAseq coverage	227x (Rank: top 44%)

Annotation
*Heliconius*	HMEL016153	88.37%
*Bombyx*	BGIBMGA014045-TA	87.85%
*Drosophila*	RpIII128-PA	72.75%
EBI UniRef50	UniRef50_Q7Q416	70.47%	DNA-directed RNA polymerase (Fragment) n=2 Tax=Bilateria RepID=Q7Q416_ANOGA
NCBI RefSeq	XP_001958974.1	73.31%	GF12287 [Drosophila ananassae]
NCBI nr blastp	gi\|312374784	73.45%	hypothetical protein AND_15508 [Anopheles darlingi]
NCBI nr blastx	gi\|383862931	72.92%	PREDICTED: DNA-directed RNA polymerase III subunit RPC2 [Megachile rotundata]

Group
Gene Ontology	GO:0003899	0	DNA-directed RNA polymerase activity
	GO:0032549	0	ribonucleoside binding
	GO:0006351	0	transcription, DNA-dependent
	GO:0003677	8.1e-122	DNA binding
KEGG pathway	dan:Dana_GF12287	0.0
	K03021 (RPC2)	maps->	Cytosolic DNA-sensing pathway
			Purine metabolism
			Pyrimidine metabolism
			RNA polymerase
InterPro domain	[28-1086] IPR015712	0	DNA-directed RNA polymerase, subunit 2
	[622-995] IPR007120	8.1e-122	DNA-directed RNA polymerase, subunit 2, domain 6
	[28-365] IPR007644	1.4e-38	RNA polymerase, beta subunit, protrusion
	[997-1081] IPR007641	1.5e-27	RNA polymerase Rpb2, domain 7
	[162-337] IPR007642	9.4e-24	RNA polymerase Rpb2, domain 2
	[392-457] IPR007645	3e-22	RNA polymerase Rpb2, domain 3
	[493-554] IPR007646	5.9e-20	RNA polymerase Rpb2, domain 4
	[575-616] IPR007647	8.2e-10	RNA polymerase Rpb2, domain 5
	[734-845] IPR014724	1.8e-09	RNA polymerase Rpb2, OB-fold
Orthology group	MCL10170		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203050-TA
ATGGGTGAATTAAATAAAAATCACGGTAAAGAGTGGGATTCAGGCAAAAGCCTCAGAGAACCTATAAAAACCTTAGAGAAAAAAAAAATTGTTCAAGCAAATGAAAAAGTATTCTGTGATTCCGATCCATTATTCTACATAAAGTATTTAAACGCCTATGTCGGAACACCAGATCTGGAAGAAGGATTTAATGTGACCAAGCCAACAACACCTCATGAATGTCGACTGAGAGACATGACTTATTCTGCACCAATCACTGTTGACATAGAATATATAAGAGGCAATCAAAGAGTCATTTTTAAAAATAAGCAATTAATTGGAAGAATGCCTTTAATGCTGAGATCCTCGAATTGTGTTTTAACGAATAAATCAGATTTCGAGTTAGCTCAATTAAATGAATGTCCACATGATCCCGGTGGCTATTTTATTATAAGAGGACAAGAAAAAGTAATTTTAATTCAAGAACAACTCTCTAGGAATAGAATGATTGTTGATGAATTTAAAGGTGCCATCCAGTGTCAAGTAACGAGTTCGACCCATGAGAAGAAAACTAGGACTATAGTTATTGTTAAAAATGGGAAATATGTTTTGAGGCACAATGCTTTATCTGATGATATACCAATATGTGTAGTTTTTAAAGCCATGGGTATATGTAGTGACCAAGAAATAATGCAGTTAGTGGGTACAGATGATGCTATTGCAAAAAAAATGGCACCCTGCATCATGGACTGCCATAATTTAAAAGTTTTCACACAGAATCAGGCGCTTGCTTATATTGGTAGCAAATTAAAAGTTAAGAGGTTCCAATCAGCAACATCAAAATTTAGAACTCCGGTGGACGAAGCAAGAGATCTGATAGCAACAACCATTTTAGCACATGTGGTAGTAGAAAATTATAATTTCTATGTGAAAGCTATTTACTTGGCGATAATGGTGAAAAGAGTCATAGAGGCAGAGACTAACAAAGCGGCTATAGATGACCCAGACTATTATGGAAATAAGAGGCTGGAACTGGCAGGGTCACTACTGGCGCTCATGTTTGAAGATCTGTTCAAAAGATTTAATTGGGAATTGAAATCTATAGCCGATAAAATAATACCGAGAGTAAAAGCAGCGCCGTTTGATGGAAATTGGACTATCAAGAGATTCAAAATGGAACGTCATGGCGTCACCCAAGTATTGAGTCGTCTCAGCTATATTTCGGCTCTCGGTATGATGACGAGAGTTAATTCACAGTTCGAAAAGACCAGGAAGGTTTCTGGGCCTAGATCGCTGCAACCGTCACAGTGGGGAATGCTCTGTCCTTCTGACACCCCTGAGGGAGAAGCTTGTGGCTTAGTGAAAAATCTGGCTTTAATGACGCATATTACAACAGAGTGCTCAGAAGGTCCGATATCAAGGCTAGCTTGTAACGCCGGGGTTGAGGACGTTAGACTACTAGGAGGTGAAGAAATAAACCATCCAGCTCTCTATATGGTCTTTTTAAACGGTAACATCTTAGGCGTCACTAGAGAATATAAGAAACTAATAAAAATCTTCAGGATGTTTAGAAGACGAGGTCTGATCTCTGCGTTTGTGTCTATATATCCTAATCACAATCAAAGAACGGTGTATATATGCAGTGACGGTGGTAGACTCTGCCGTCCGTATATAATAGTGGAGAAAGGTTTGCCTTTGGTTCAACAGCATCATATCAATGAGCTCAACAGGGGTATACGAAAGTTTCAAGATTTTCTCAACGATGGTCTCATAGAATATTTGGACGTGAATGAAGAAAATGACAGTCATATAGCGACTGTTGAGACCGAGATAGATCCGTACGTGACAACGCATCTCGAGATAGAGCCGTTCACTATACTTGGAGTTTGTGCGGGTCTTGTGCCTTATCCCCACCACAATCAGAGCCCCAGGAACACATACCAATGTGCTATGGGCAAACAGGCCATGGGTACAATAGGCTATAATCAGAAGAATAGAATAGACACGCTTATGTATAATTTAGTGTACCCGCAGTGTCCGATGGTTAAAACGAGGACTATAGAATTGACAAATTTTGATAAGCTGCCGGCCGGGCAGAACGCTACTGTCGCTGTTATGAGTTACAGTGGCTATGATATAGAAGATGCTTTAATTTTGAACAGAGCATCGATAGACCGTGGTTACGGACGTTGTTTGGTATACAAAAGTGCCAAAACAATTATGAAGCGATACAGCAATCAGACGTCGGACAGAATCCTAGGACCATCAAGAGACGCCAACACTGGAAAAGTTATTAAGGCTCACGAAGTTCTGGATTCCGATGGCATAGCAGCTCCGGGTGAAATGGTCGAGAACCGTCAAGTGTTGATAAACAAACAAATGCCTCCCGCCACGCTCAATCCTATAAATCAAGGTCAACCGCAACAAATAGATTATAAAGACGTGCCAATAACGTACAAAGGGCCAGTCGAATCTTATATAGAAAAGGTCATGGTGTCCTCCAACTCTGAAGATGCGTTTCTAATAAAAATATTACTGAGGCAAACTAGAATACCAGAGATCGGTGATAAATTTAGTTCCAGGCATGGACAGAAAGGAGTGACAGGTTTGATAGTTCAACAGGAAGACATGCCGTTCAATGATAGAGGGATATGTCCCGATATGATCATGAATCCACATGGTTTCCCCTCGAGAATGACGGTGGGAAAAACTATAGAGCTATTGGCGGGAAAAGCTGGACTGATGGAGGGAAAATTTCATTACGGCACAGCATTTGGTGGGTCGAAAGTTCGCGATGTATGTCAGGAGTTGGAAAAGCATGGCTATAACTACCACGGAAAGGATATATTCTATTCTGGTATAACAGGAGAACCTTTGGAAGCGTACATTTATTCCGGGCCAGTTTACTATCAGAAGTTGAAACATATGGTGCAAGACAAAATGCACGCTCGTGCTAGAGGACCGAGAGCTGTACTGACGAGACAACCCACTGAAGGAAGGTCGAGGGATGGAGGACTACGACTTGGGGAGATGGAACGAGATTGCCTCATTGGTTATGGTGCAAGTATGCTGTTGATGGAACGTCTGATGTTAGCGTCTGACGCGTTCAGTGCGGACATTTGCAGTAGTTGCGGCAGGCTGGCCTCCCGTGCTTGGTGCCACGCCTGCCGGTCCTCGGCCGTCTCGGCGGTCGATATGCCTTACGCCTGTAAGCTGTTGTTCCAGGAGCTGGCCTCCATGAATATAGTCCCGAGGCTGAAATTGAAGAAGTACTCGTGA

Protein sequence:

>DPOGS203050-PA
MGELNKNHGKEWDSGKSLREPIKTLEKKKIVQANEKVFCDSDPLFYIKYLNAYVGTPDLEEGFNVTKPTTPHECRLRDMTYSAPITVDIEYIRGNQRVIFKNKQLIGRMPLMLRSSNCVLTNKSDFELAQLNECPHDPGGYFIIRGQEKVILIQEQLSRNRMIVDEFKGAIQCQVTSSTHEKKTRTIVIVKNGKYVLRHNALSDDIPICVVFKAMGICSDQEIMQLVGTDDAIAKKMAPCIMDCHNLKVFTQNQALAYIGSKLKVKRFQSATSKFRTPVDEARDLIATTILAHVVVENYNFYVKAIYLAIMVKRVIEAETNKAAIDDPDYYGNKRLELAGSLLALMFEDLFKRFNWELKSIADKIIPRVKAAPFDGNWTIKRFKMERHGVTQVLSRLSYISALGMMTRVNSQFEKTRKVSGPRSLQPSQWGMLCPSDTPEGEACGLVKNLALMTHITTECSEGPISRLACNAGVEDVRLLGGEEINHPALYMVFLNGNILGVTREYKKLIKIFRMFRRRGLISAFVSIYPNHNQRTVYICSDGGRLCRPYIIVEKGLPLVQQHHINELNRGIRKFQDFLNDGLIEYLDVNEENDSHIATVETEIDPYVTTHLEIEPFTILGVCAGLVPYPHHNQSPRNTYQCAMGKQAMGTIGYNQKNRIDTLMYNLVYPQCPMVKTRTIELTNFDKLPAGQNATVAVMSYSGYDIEDALILNRASIDRGYGRCLVYKSAKTIMKRYSNQTSDRILGPSRDANTGKVIKAHEVLDSDGIAAPGEMVENRQVLINKQMPPATLNPINQGQPQQIDYKDVPITYKGPVESYIEKVMVSSNSEDAFLIKILLRQTRIPEIGDKFSSRHGQKGVTGLIVQQEDMPFNDRGICPDMIMNPHGFPSRMTVGKTIELLAGKAGLMEGKFHYGTAFGGSKVRDVCQELEKHGYNYHGKDIFYSGITGEPLEAYIYSGPVYYQKLKHMVQDKMHARARGPRAVLTRQPTEGRSRDGGLRLGEMERDCLIGYGASMLLMERLMLASDAFSADICSSCGRLASRAWCHACRSSAVSAVDMPYACKLLFQELASMNIVPRLKLKKYS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: