MonarchBase - Protein-coding gene

DPOGS200458
Transcript	DPOGS200458-TA	3435 bp
Protein	DPOGS200458-PA	1144 aa
Genomic position	DPSCF300260 - 80432-94536
RNAseq coverage	52x (Rank: top 70%)

Annotation
*Heliconius*	HMEL014564	0.0	61.94%
*Bombyx*	BGIBMGA011407-TA	7e-156	69.62%
*Drosophila*	egg-PA	1e-87	54.05%
EBI UniRef50	UniRef50_E9J254	1e-139	46.11%	Putative uncharacterized protein (Fragment) n=1 Tax=Solenopsis invicta RepID=E9J254_SOLIN
NCBI RefSeq	XP_392624.3	1e-139	44.86%	PREDICTED: similar to CG30426-PA [Apis mellifera]
NCBI nr blastp	gi\|340722851	1e-140	46.37%	PREDICTED: histone-lysine N-methyltransferase SETDB1-like [Bombus terrestris]
NCBI nr blastx	gi\|380029447	2e-141	44.81%	PREDICTED: histone-lysine N-methyltransferase SETDB1-like [Apis florea]

Group
Gene Ontology	GO:0005515	3.7e-25	protein binding
	GO:0005634	4.2e-18	nucleus
	GO:0008270	4.2e-18	zinc ion binding
	GO:0034968	4.2e-18	histone lysine methylation
	GO:0018024	4.2e-18	histone-lysine N-methyltransferase activity
	GO:0003677	2.4e-10	DNA binding
KEGG pathway	ame:409098	4e-139
	K11421 (SETDB)	maps->	Lysine degradation
InterPro domain	[797-1119] IPR001214	3.7e-25	SET domain
	[160-271] IPR007728	4.2e-18	Pre-SET domain
	[158-263] IPR003606	4.1e-15	Pre-SET zinc-binding sub-group
	[646-717] IPR016177	2.4e-10	DNA-binding, integrase-type
	[642-684] IPR001739	1.3e-06	Methyl-CpG DNA binding
Orthology group	MCL11836		Single-copy universal gene

Nucleotide sequence:

>DPOGS200458-TA
ATGCTACACATCTCTACCACCAACCACCAGGGATTTCCTCGTCAGCGCGCCGTTGCCAAGAAGACTACCACGAAGACTCGCCAATCATCCCGTACAGCCGTACAGAGCCTCGACCACTTTACTAGTAAACTAGTGTACTACAGTCCAAAGAAACATGTGAAGCCATACAAGATGGTGCCCCATACTTGCTCGACTGCGTGCAAGAGGACGGATGTTTTGGAACTCAAAGATTTAAAATCTTACAATCCATTAGCCAAGCCACTGTTGAGTGGCTGGGAGAGACAGATAGCCAATTTCAAGGGCAACAAGGTTGTATTGTACTTGTCTCCGTGCGGTCGCCGCGTCCGCTCTCCGCGGGAGCTACATCGCTATCTGCGAACCGTTGGTAGTCTGGACGGTCAGCTGGAGAAGCTCTTCACACCATCCACGCACTGTCTGGCCGAGTTTGTGCTCAACAAATACTGCGTCAGCAAGAAGGACTTATCAAATGGCAAAGAGAACGTCCCAGTGGCTTGCGTCAATTACTACGACGGATCACTGCCAGAGTTCTGTTTCTACAACACTGAGCGGACTCCGACCGCTGGGGTTCCACTCAACCTGGACCCGGAGTTCCTGTGTGGCTGTGACTGCGAGGACGACTGCGAGGACAAGAGCAAGTGCGCCTGCTGGCAGCTGACTCTGGAGGGCGCTAGGACGATAGGTCTGGAGGGGGAGAACGTCGGTTACGTTTATAGAAGACTAATGGAACCGCTCCCGACTGGTATTTACGAGTGCAACTCTAGGTGCAAGTGTAAAGACACTTGTCTTAACCGCGTCGCTCAATATCCACTTCAGCTAAATTTGCAGGTGTTCAAGACCCAGAACCGCGGTTGGGGCATTCGCACCCTGAATGACATACCCAAGGGGAGCTTCCTCTGTACTTACGCAGGGAAACTACTAACAGAGGCCACAGCTACCCTCGACGGTCTGAACGAGGGTGACGAGTACCTGGCGGAGTTGGACTACATCGAGGTCGTGGAACAGATGAAGGAGGGTTACGAAGAGGACATACCAGAGAACATCAAGAAGATGGATGAGGCTCAAATAGCGGAACAACTCTCGATGGCGGGCGAAGAAACACAGTCATCGTCTTCAGGGGAAAGCAGCCCCAAAAGCGCTGAAAATGACGACCTTAGCCTCGAAGACATTGGTCCGGGGGTCACAGAGTCCAGCAAAGAACTAAGGGGGAAAGACTCAAAGACAGACGAAGAAATAGAGAGTGCGGTGCTGAAAGTTACCGAGAGATTAGTGCCCACAGAAGAAGATGAAACAGTTTTCACAGAGGAACAGAAATCTGTTGTCATAGAAGTGGAAAGTTCAGTGCCCACGGAGGACGAACTCTCTGAAATGCAGGAGGAAATCGATGAAGATTATGATTCTTCGAGTGATGACGGAGAAGATCGAGAACCTTCGAATTTCTCAGCCAGTGCTGGGATGGGAGCAAAGAAGTTTAAATCAAAGTATAGGTCTGTCCGTAGTCTGTTTGGTGAAGATGAAGCCTGCTACATCTTGGACGCCAAGGTTCAAGGGAATATAGGCAGATATCTCAATGTAAGGGGATGTACAACACCGCGGTCCTTGTATGACCGGCAGAGTTGTGATCTGTATATAGAACTCAACGTCCTCGTTCCTGCAAAGACTCATTCCCCTGTCTCCGCCTCCCGCCAGCACTCGTGCGTGCCGAACGTGTTCGTCCAGAACGTGTTCGTGGACACGCACGACCCTCGCTTCCCGTGGGTGGCTTTCTTCGCTCTCACAGCCGTGCGGGCCGGGGGCGAGCTCACCTGGAACTACAACTACGACGTAGGTTCCGTGCCCGGGAAGGTCCTCTACTGTTACTGCGGGGCTCCGACGTGTCGCGGCAGACAGATAGCCAATTTCAAGGGCAACAAGGTTGTATTGTACTTGTCTCCGTGCGGTCGCCGCGTCCGCTCTCCGCGGGAGCTACATCGCTATCTGCGAACCGTTGGTTCAGACCTGCCAGTCGACCTCTTCGACTTCACACCATCCACGCACTGTCTGGCCGAGTTTGTGCTCAACAAATACTGCGTCAGCAAGAAGGACTTGTCAAATGGCAAAGAGAACGTCCCAGTGGCTTGCGTCAATTACTACGACGGATCACTGCCAGAGTTCTGTTTCTACAACACTGAGCGGACTCCGACCGCTGGGGTTCCACTCAACCTGGACCCGGAGTTCCTGTGTGGCTGTGACTGCGAGGACGACTGCGAGGACAAGAGCAAGTGCGCCTGCTGGCAGCTGACTCTGGAGGGCGCTAGGACGATAGGTCTGGAGGGGGAGAACATTCTCAACTCATTCCCCATGTATCAGGTGTTCAAGACCCAGAACCGCGGTTGGGGCATTCGCACCCTGAATGACATACCCAAGGGGAGCTTCCTCTGTACTTACGCAGGGAAACTACTAACAGAGGCCACAGCTACCCTCGACGGTCTGAACGAGGGTGACGAGTACCTGGCGGAGTTGGACTACATCGAGGTCGTGGAACAGATGAAGGAGGGTTACGAAGAGGACATACCAGAGGACATCAAGAAGATGGATGAGGCTCAAATAGCGGAACAACTCTCGATGGCGGGCGAAGAAACACAGTCATCGTCTTCAGGGGAAAGCAGCCCCAAAAGCGCTGAAAATGACGACCTTAGCCTCGAAGACATTGGTCCGGGGGTCACAGAGTCCAGCAAAGAACTAAGGGGGAAAGACTCAAAGACAGACGAAGAAATAGAGAGTGCGGTGCTGAATGTTACCGAGAAATTTGTGCCCACAGAAGAAGATGAAACAGTTTTCACAGAGGAACAAAAATCTGTTGTCATAGAAGTGGAAAGTTCAGTGCCCACGGAGGACGAACTCTCTGAAATGCAGGAGGAAATCGATGAAGATTATGATTCTTCGAGTGATGACGGAGAAGATCGAGAACCTTCGAATTTCTCAGCCAGTGCTGGGATGGGAGCAAAGAAGTTTAAATCAAAGTATAGGTCTGTCCGTAGTCTGTTTGGTGAAGATGAAGCCTGCTACATCTTGGACGCCAAGGTTCAAGGGAATATAGGCAGATATCTCAATGTAAGGGGATGTACAACACCGCGGTCCTTGTATGACCGGCAGAGTTGTGATCTGTATATAGAACTCAACGTCCTCGTTCCTGCAAAGACTCATTCCCCTGTCTCCGTCTCCCGCCAGCACTCGTGCGTGCCGAACGTGTTCGTCCAGAACGTGTTCGTGGACACGCACGACCCTCGCTTCCCGTGGGTGGCTTTCTTCGCTCTCACAGCCGTGCGGGCCGGGGGCGAGCTCACCTGGAACTACAACTACGACGTAGGTTCCGTGCCCGGGAAGGTCCTCTACTGTTACTGCGGGGCTCCGACGTGTCGCGGCAGGTTACTGTGA

Protein sequence:

>DPOGS200458-PA
MLHISTTNHQGFPRQRAVAKKTTTKTRQSSRTAVQSLDHFTSKLVYYSPKKHVKPYKMVPHTCSTACKRTDVLELKDLKSYNPLAKPLLSGWERQIANFKGNKVVLYLSPCGRRVRSPRELHRYLRTVGSLDGQLEKLFTPSTHCLAEFVLNKYCVSKKDLSNGKENVPVACVNYYDGSLPEFCFYNTERTPTAGVPLNLDPEFLCGCDCEDDCEDKSKCACWQLTLEGARTIGLEGENVGYVYRRLMEPLPTGIYECNSRCKCKDTCLNRVAQYPLQLNLQVFKTQNRGWGIRTLNDIPKGSFLCTYAGKLLTEATATLDGLNEGDEYLAELDYIEVVEQMKEGYEEDIPENIKKMDEAQIAEQLSMAGEETQSSSSGESSPKSAENDDLSLEDIGPGVTESSKELRGKDSKTDEEIESAVLKVTERLVPTEEDETVFTEEQKSVVIEVESSVPTEDELSEMQEEIDEDYDSSSDDGEDREPSNFSASAGMGAKKFKSKYRSVRSLFGEDEACYILDAKVQGNIGRYLNVRGCTTPRSLYDRQSCDLYIELNVLVPAKTHSPVSASRQHSCVPNVFVQNVFVDTHDPRFPWVAFFALTAVRAGGELTWNYNYDVGSVPGKVLYCYCGAPTCRGRQIANFKGNKVVLYLSPCGRRVRSPRELHRYLRTVGSDLPVDLFDFTPSTHCLAEFVLNKYCVSKKDLSNGKENVPVACVNYYDGSLPEFCFYNTERTPTAGVPLNLDPEFLCGCDCEDDCEDKSKCACWQLTLEGARTIGLEGENILNSFPMYQVFKTQNRGWGIRTLNDIPKGSFLCTYAGKLLTEATATLDGLNEGDEYLAELDYIEVVEQMKEGYEEDIPEDIKKMDEAQIAEQLSMAGEETQSSSSGESSPKSAENDDLSLEDIGPGVTESSKELRGKDSKTDEEIESAVLNVTEKFVPTEEDETVFTEEQKSVVIEVESSVPTEDELSEMQEEIDEDYDSSSDDGEDREPSNFSASAGMGAKKFKSKYRSVRSLFGEDEACYILDAKVQGNIGRYLNVRGCTTPRSLYDRQSCDLYIELNVLVPAKTHSPVSVSRQHSCVPNVFVQNVFVDTHDPRFPWVAFFALTAVRAGGELTWNYNYDVGSVPGKVLYCYCGAPTCRGRLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: