MonarchBase - Protein-coding gene

DPOGS209164
Transcript	DPOGS209164-TA	1617 bp
Protein	DPOGS209164-PA	538 aa
Genomic position	DPSCF300061 - 118848-125269
RNAseq coverage	1x (Rank: top 94%)

Annotation
*Heliconius*	HMEL009747	3e-107	73.93%
*Bombyx*	BGIBMGA011480-TA	8e-97	64.75%
*Drosophila*	CG13690-PA	2e-64	60.56%
EBI UniRef50	UniRef50_Q9VPP5	3e-62	60.56%	Ribonuclease H2 subunit A n=41 Tax=Coelomata RepID=RNH2A_DROME
NCBI RefSeq	XP_001356439.2	2e-64	61.36%	GA12461 [Drosophila pseudoobscura pseudoobscura]
NCBI nr blastp	gi\|198473777	4e-63	61.36%	GA12461 [Drosophila pseudoobscura pseudoobscura]
NCBI nr blastx	gi\|312379086	8e-62	63.24%	hypothetical protein AND_09149 [Anopheles darlingi]

Group
Gene Ontology	GO:0003723	5.8e-80	RNA binding
	GO:0004523	5.8e-80	ribonuclease H activity
	GO:0003676	3.8e-29	nucleic acid binding
KEGG pathway	dpo:Dpse_GA12461	6e-64
	K10743 (RNASEH2A)	maps->	DNA replication
InterPro domain	[331-536] IPR001352	5.8e-80	Ribonuclease HII/HIII
	[332-488] IPR012337	3.8e-29	Ribonuclease H-like
	[441-484] IPR023160	2.2e-16	Ribonuclease HII, helix-loop-helix cap domain
Orthology group	MCL11203		Single-copy universal gene

Nucleotide sequence:

>DPOGS209164-TA
ATGGCGCTTAAAAAACTGTGCTTTGTGTTCGCGATTTTGACGTGTGCTTCAGCTATAGTTGGCCCGGCTGCGAACAGCTCTAAAGTAGTTGTTGTTACTAAAGCCGACACTTACCTCGACGCTTATTCAAAATCACGAGTAGACGCAGAAGAAGCTAAGAAGGGTGTTGTTATAGTAACGGCCAGAGATGGCGAGAAGAAATTGACAAATCGTGACGACAGTTACAGCGGATACGACTACACGCCGTCGTATTCTAGCGGAGATAGTTATTCATCGGGACCGTCAAACAGCTATTTGCCTTCAGGCAATCATGGGCCGGTGAAGTTTGAGCCAGAAATCACGTACAATGCTCCCGCGAATACATACGGGCCACCGTCTCCAAGCTACGGACCTCCATCATCCAACTACGGTCCACCTTCAAGCGGCCCATCGCCGAGCTATGGCCCTCCGCAGTCCTACGGGCCTCCTACTCCCGTATACGGACCCCCAATACATAAACCATCACCCCCGGTATATGGACCACCTCTCAAACCGTTCTATGGCGTCCCATACACGGCGCCCGGTCTCAGTTTCTTCGACAAATTATCTTTAAAGTTAGACATCCTCACTATCGCAAAACTGATGCTGAAGTTCCTTATATTCAAGAAGATTGTGACCATGATCGCTGTGGTGTGCATGCTGCTCGTCATACCTAAACTAATATCTTTTAAGAAAGATAAAACTGGAGACGAGGGCGGCGACGAGGATGAACGTAGATTCGGTGGTAGACATCTTATGGAGTTAACCTCAGCTCAACAATTGTTGGACCGCGCGATGTATGTCTACGGACATCAGCGGCCGGACTGTGGGTTCGCGTGTCGCGTCAGACGCGTGTTAGACGATGTATACGAATTTCAGCCTTATTTCAGGTTTATTCGCCTGGAACGCGGGCTCATTGCGGGATCTACACGTGCCGTCGCCACACGTGTTGATGTGTCGTGTGTGCCNGCTGAAGTTATATCACCAAATTACATTTCAAACTCTATGTATAAAAGAGCCAAACACTCTCTCAACGAGGTATCAATGAATTCCGCGATATCTTTGATAAAAAAATCTATTGAATTAGGTGGGAATATAACAGAGGTGTATGTGGATACTGTCGGCCCTCCCGAGAAATATCAGGCCAGGTTAAAAGAAATCTTCCCTGATATTACGATCACTGTGGCAAAGAAAGCTGATTCCATCTACCCAATAGTGTCGGCGGCCAGTATAGTGGCTAAGGTCACGAGAGACCACGCCCTCAAGGTTTGGGAATTTCCCGAAGGTCTTGAGATCAATCACAAGGACTTTGGGAGTGGTTACCCAGGAGATCCATTGACTAAGAAGTTTATAAGGGAACAGATTGACAGAATATTCGGCTACCCCCTGTTGGTAAGGTTTAGTTGGTCCACGGCCGAGCTGGCTCTCCAGGAGAGAGCAGCGAAGTGCAGCTTCGAGGACATAGACGATGAGAATACGAAGAAACCGAAAGGAACCCAGGCCATCAGCTCGTTCTTTTCACCGAAGAACGAGCGGAAACGGAAGAGGCATAAATTTTTCGAAGAAAGAAATTTGACAATGAGCAACGCTTTCGAATAA

Protein sequence:

>DPOGS209164-PA
MALKKLCFVFAILTCASAIVGPAANSSKVVVVTKADTYLDAYSKSRVDAEEAKKGVVIVTARDGEKKLTNRDDSYSGYDYTPSYSSGDSYSSGPSNSYLPSGNHGPVKFEPEITYNAPANTYGPPSPSYGPPSSNYGPPSSGPSPSYGPPQSYGPPTPVYGPPIHKPSPPVYGPPLKPFYGVPYTAPGLSFFDKLSLKLDILTIAKLMLKFLIFKKIVTMIAVVCMLLVIPKLISFKKDKTGDEGGDEDERRFGGRHLMELTSAQQLLDRAMYVYGHQRPDCGFACRVRRVLDDVYEFQPYFRFIRLERGLIAGSTRAVATRVDVSCVPAEVISPNYISNSMYKRAKHSLNEVSMNSAISLIKKSIELGGNITEVYVDTVGPPEKYQARLKEIFPDITITVAKKADSIYPIVSAASIVAKVTRDHALKVWEFPEGLEINHKDFGSGYPGDPLTKKFIREQIDRIFGYPLLVRFSWSTAELALQERAAKCSFEDIDDENTKKPKGTQAISSFFSPKNERKRKRHKFFEERNLTMSNAFE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: