MonarchBase - Protein-coding gene

DPOGS201680
Transcript	DPOGS201680-TA	4092 bp
Protein	DPOGS201680-PA	1363 aa
Genomic position	DPSCF300103 + 507888-513733
RNAseq coverage	348x (Rank: top 34%)

Annotation
*Heliconius*	HMEL012070	0.0	70.09%
*Bombyx*	BGIBMGA005382-TA	0.0	79.25%
*Drosophila*	Kdm2-PB	3e-08	55.81%
EBI UniRef50	UniRef50_Q5W7N6	0.0	80.07%	Cytosine-specific methyltransferase n=2 Tax=Obtectomera RepID=Q5W7N6_BOMMO
NCBI RefSeq	NP_001036980.1	0.0	80.07%	DNA cytosine-5 methyltransferase [Bombyx mori]
NCBI nr blastp	gi\|112983430	0.0	80.07%	DNA cytosine-5 methyltransferase [Bombyx mori]
NCBI nr blastx	gi\|112983430	0.0	73.96%	DNA cytosine-5 methyltransferase [Bombyx mori]

Group
Gene Ontology	GO:0005634	0	nucleus
	GO:0003886	0	DNA (cytosine-5-)-methyltransferase activity
	GO:0090116	0	C-5 methylation of cytosine
	GO:0003677	1.6e-51	DNA binding
	GO:0006306	1.6e-51	DNA methylation
	GO:0008270	6.1e-14	zinc ion binding
KEGG pathway	nvi:100122029	0.0
	K00558 (E2.1.1.37, DNMT, dcm)	maps->	Cysteine and methionine metabolism
InterPro domain	[1-1364] IPR017198	0	DNA (cytosine-5)-methyltransferase 1, eukaryote
	[162-1361] IPR001525	0	C-5 cytosine methyltransferase
	[162-283] IPR022702	4.5e-26	DNA (cytosine-5)-methyltransferase 1, replication foci domain
	[389-432] IPR002857	6.1e-14	Zinc finger, CXXC-type
	[503-631] IPR001025	2e-12	Bromo adjacent homology (BAH) domain
Orthology group	MCL11989		Patchy

Nucleotide sequence:

>DPOGS201680-TA
ATGGACAATGCTACACATTCAACAACTCGAAAGTCCGACAGAAAAGCTTCAACAAGAGACGGTCAACTAAAAATTACAAGTATGTTTGCAAAAAAGAGAAGTAGAAGTCCAATTGAAAGTGCTGAGAAAGATGATACGAAAAAGCTAAAGATTAACACAGAGTCCCATGAACATGAAGTCTTTAATGAAAAATCAAAAGTAGTAAATGGAATAAATAGTAAATCAGACGACGTCAATTCTCAAGAAAGTGAAGAAACTTCACCAAACTTGGTTTCTATGAAATTAAACAACGAGAGAAGTCTTGTAGATGAAGATGAAAACCATAATATTGAAGCTAAAACTGTTCCTGAGATTATTAATACTATGAATGGTTGTAACCAAAACGGGGATGAAATGACTAGAGACGGCCTTGAAAACCAGGTCCAACAAAATGCTATAGTAGAACAAGATCCACCAGAACCAAAACCAACTGCTAAAATTCCAGATCAACATGGCCATTTATGTCCCATAGATGGAGGTCTTATTGAGAGTGATGTAAGGATATACATGTCGGGCTATCTTAAATCTATTTGTTCTGATTCACCTGATATTGATGAAGAATCTATAGCAGTCAAGGATGTCGGTCCCATCATAGAATGGTTTATTCATGGATTCGACGGTGGTTCGAGAAATTGTATTACACTGTCGACGGAATTTGGTGAATACAATCTACTCAAACCGAGCGCTGAATATACTCCCTTGATGGATAATTTGTATGAAAAAATATGGCTCAGTAAAGTAGTCGTTGAATATTTAGAAGAATACCACTATCTTCAGCCAACTTATGAGGATTTGTTAGAAGTTATAAGGGAACATTCCATACCAGATTTGGAGGACAAGAGGATGACCGAAGAAATGCTCCACAAACATGCTCAATTTGTTTGTGACCAAGTTGTTAGTTTAGAAGCCGATGAAGACAATGAACCCTTGATAACCCTTCCCTGTATGAGAGAGTTAATAAAATTAATGGGCATTAAATTCGGCAAGAGGAAAGTTCGCGCGAAAATCGACTACAAGAAGATTGACAAAAAAGCTTGGACCAAAGCAACAACGACTCCGCTCGTTCAGAAGACATTCGAGCATTTCTTTGCAAACCAATTAGATAAGACGAATCATGAGCTGGTGTTGAGAAGGAAACGATGTGGGGTTTGCGAAGCTTGCCAATTACCTGACTGTGGAGAGTGCAATGCTTGTAGGGCCATGTTAAAATTTGGTGGTCACGGCCGCACCAAAAAGGCGTGCGTCAGACGATTGTGTCCCAACATGGCGGTTCAACAGGCTGAAGATTCGGAGATAGAAGACGAAGAAGAATACCAACAGATGGCTGAAAAGCGACATCTCGATAAAATCGATGACGCTCTACCCGTTAAATTAACTGGCGGAAGTAATAAGATCATTAGATGGATCGGCGACCCTGTTAAGGCCGACGCTACTAAAGTTTACTACGAGAAAGTTGAAATTGACGGATCAGAACTGTCGCTAGGGGACTTCGTTATGGTCGAAACGTCACAATCGAATATCCCCGCGTTAGTAGCCAGAGTCACGTATATGTGGAAGGAGAGTATTAATCCTAAGTCGGGTTATTTCCATGCTGAAGTTTTCATTAGATCGTCTGACACCGTGTTGGGAGAGGTCGGTGACCCGCGAGAAGTGTTCTTGGGCGATAGATGCTGCCATGGCGCCCCTTTATCGTCTATATTGAGAAAAGCGTTCGTCGAAAAGAAAGAAACACCGGCTGATTGGTTCAAGCTCGGCGGGAAGGAAGTGGTCGACCACTTCTTTGAAGATGACGGCAAAACTTACTTTTATCAGAAATACTATGAAAGGTTCACGGCACGATTCGAAGATCTTCCGAACGATCCAGAATGTCCTAACGCATTACGAAAACACAGATTCTGTCCATCCTGTGAACGGAAGACGAGACGGGATGCTCGCGATATACCAAAAATATCTGGAAAACTAACAGAGAAGTCTGAAATTGTTAAAGAAGCTAACAGATTTGAATGGACGACTATCAGGTGGCGGGACCACGATTACAAGAAGGGCTGCGGAGTGTTCTTAAAACCTGGAACATTTAGATTCAAAAACTCCATGATCAATAGCAGTAATGGCATTAATAGGGTTAAGTTAGACAAAGTCGACGAGGATATATATCCAGAGTATTATAGGAAGACTGATAATTATTTGCGAGGCTCGAATATAGACACCGGCGAGCCGTTCTGCGTCGGTTATATAGCAGCGGTGACGGCGGCTAGCGAGGGGCCGCTGGTTATTCCACAGGATATCTACATTAAAGTCAACGTGATGTATCGGCCAGAGAACACCAACAACAGATTTCCGCATCACGAGGACGTCAATGTCGTGTATTGGAGCGACGAAATCAAGGAGATATCGTTTTCAGCCGTCGTAGGACCTTGTAATATATGTTATGTAGACAACATACCACAGCAAGATCACATCTACGACTGGTTAGAGAAGGACCCAAGTAGAGTATACTTCCGTATGGCATTTAACAAGAAATCCGGTCAAGTAGAGGATGTTCCGCAGCACGTTAAATATGTCGGTAGGGGTGATAAGGGTAAAGATAAAGGTAAAGGGAAAGGGAAGTCGAGCAAAGGCGCACAATCTACAGTCACGGTGAAAGTCGATGAAGTTAAGGTCAGGCCTTTAAGGACTTTGGACGTGTTCGCGGGTTGCGGCGGTTTATCTGAAGGCCTTCATCGATCAGGTGTCGCCGAGTGTCGTTGGGCCGTCGAAAATCTAGAAGCGGCCGCTCATGCTTATTCCATCAATAATAAAAACTGCATCGTGTTCAACGAAGATTGCAACGCCTTGCTGAAGGACGCAATGGATGGGGCGACTCACAGTGCGGGGGGATTGAGAATTCCGATGCAAGGCGAAGTGGAACTGCTCTGCGGTGGACCGCCGTGTCAAGGCTTCTCAGGGATGAACAGATTTAACTCGAGAGAATATTCCAACTTCAAAAACTCTTTAGTTGCATCGTATCTGTCGTTCTGCGATTTTTACAGGCCTAAATACTTCATCTTAGAGAATGTTAGGAATTTCGTCGCCTTCAAGAAGGGCATGGTTTTGAAATTGACTCTCAGAGCGTTGTTGGATATGGGATACCAATGCACGTTCGGTATCCTTCAGGCTGGGAATTATGGGGTACCGCAGACTCGTAGAAGACTCATTATACTAGCCGCGGCGCCGGGCTACAAGCTTCCTTTATATCCGGAACCCACGCACGTTTTCAGCAGGCGAGCTTGCTCATTAACAACCACCATAGACGGGAAGCGTTTCGTCACTAACATACAATGGGACGAATCCGCGCCGAGACGGACTTGCACCATCCAGGACGCTATGAGCGATCTACCGCAGATATGTAACGGTGCGAATAGAATAGAAATCGATTACGGCTGTATGCCAGAAACTTACTTCCAGAGACTTATTAGGAGCAGAGATGAGAGCGCCAAACTGCGGGATCACATATGTAAGAACATGGCGCCGCTTATACAGGCACGTATGAGTAGAATACCAACTACGCCGGGCTCTGATTGGAGAGATTTGCCAAATATATCCGTTGCACTATCTGATGGTACCAAATGCAAGGTGTTGCAATATCGTTACGACGACATCAAAAACGGTCGTTCCACCAGCGGTGCACTCCGCGGAGTCTGCGCCTGTTCCGCCGGTGGAGTGTGTTCCGTAGCCGACAAGCAAGAAAACACGCTCATACCGTGGTGTCTACCGCATACAGCCAACAGACATAACAATTGGGCCGGACTCTATGGGCGTATATCCTGGGACGGCTACTTCAGTACAACTGTGACGGACCCCGAGCCGATGGGCAAGCAAGGCCGCGTGCTCCACCCCGAGCAAAACCGCGTCGTTTCTGTTCGCGAGTGCGCTCGCTCGCAGGGATTCCCCGACACTTACCTATTCGCCGGCTCCATACAGGACAAACATCGACAGGTTGGCAACGCGGTGCCGCCACCTTTAGGAGCGGCTTTGGGCAGAGAAATCAAGAAAGCGTTGAGTGCCTTATCTTGA

Protein sequence:

>DPOGS201680-PA
MDNATHSTTRKSDRKASTRDGQLKITSMFAKKRSRSPIESAEKDDTKKLKINTESHEHEVFNEKSKVVNGINSKSDDVNSQESEETSPNLVSMKLNNERSLVDEDENHNIEAKTVPEIINTMNGCNQNGDEMTRDGLENQVQQNAIVEQDPPEPKPTAKIPDQHGHLCPIDGGLIESDVRIYMSGYLKSICSDSPDIDEESIAVKDVGPIIEWFIHGFDGGSRNCITLSTEFGEYNLLKPSAEYTPLMDNLYEKIWLSKVVVEYLEEYHYLQPTYEDLLEVIREHSIPDLEDKRMTEEMLHKHAQFVCDQVVSLEADEDNEPLITLPCMRELIKLMGIKFGKRKVRAKIDYKKIDKKAWTKATTTPLVQKTFEHFFANQLDKTNHELVLRRKRCGVCEACQLPDCGECNACRAMLKFGGHGRTKKACVRRLCPNMAVQQAEDSEIEDEEEYQQMAEKRHLDKIDDALPVKLTGGSNKIIRWIGDPVKADATKVYYEKVEIDGSELSLGDFVMVETSQSNIPALVARVTYMWKESINPKSGYFHAEVFIRSSDTVLGEVGDPREVFLGDRCCHGAPLSSILRKAFVEKKETPADWFKLGGKEVVDHFFEDDGKTYFYQKYYERFTARFEDLPNDPECPNALRKHRFCPSCERKTRRDARDIPKISGKLTEKSEIVKEANRFEWTTIRWRDHDYKKGCGVFLKPGTFRFKNSMINSSNGINRVKLDKVDEDIYPEYYRKTDNYLRGSNIDTGEPFCVGYIAAVTAASEGPLVIPQDIYIKVNVMYRPENTNNRFPHHEDVNVVYWSDEIKEISFSAVVGPCNICYVDNIPQQDHIYDWLEKDPSRVYFRMAFNKKSGQVEDVPQHVKYVGRGDKGKDKGKGKGKSSKGAQSTVTVKVDEVKVRPLRTLDVFAGCGGLSEGLHRSGVAECRWAVENLEAAAHAYSINNKNCIVFNEDCNALLKDAMDGATHSAGGLRIPMQGEVELLCGGPPCQGFSGMNRFNSREYSNFKNSLVASYLSFCDFYRPKYFILENVRNFVAFKKGMVLKLTLRALLDMGYQCTFGILQAGNYGVPQTRRRLIILAAAPGYKLPLYPEPTHVFSRRACSLTTTIDGKRFVTNIQWDESAPRRTCTIQDAMSDLPQICNGANRIEIDYGCMPETYFQRLIRSRDESAKLRDHICKNMAPLIQARMSRIPTTPGSDWRDLPNISVALSDGTKCKVLQYRYDDIKNGRSTSGALRGVCACSAGGVCSVADKQENTLIPWCLPHTANRHNNWAGLYGRISWDGYFSTTVTDPEPMGKQGRVLHPEQNRVVSVRECARSQGFPDTYLFAGSIQDKHRQVGNAVPPPLGAALGREIKKALSALS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: