MonarchBase - Protein-coding gene

DPOGS201317
Transcript	DPOGS201317-TA	2334 bp
Protein	DPOGS201317-PA	777 aa
Genomic position	DPSCF300176 + 298478-303699
RNAseq coverage	495x (Rank: top 25%)

Annotation
*Heliconius*	HMEL017250	8e-81	56.20%
*Bombyx*	BGIBMGA003106-TA	5e-97	74.80%
*Drosophila*	Set2-PA	5e-34	37.61%
EBI UniRef50	UniRef50_E9IEB7	4e-65	29.23%	Putative uncharacterized protein (Fragment) n=1 Tax=Solenopsis invicta RepID=E9IEB7_SOLIN
NCBI RefSeq	XP_001606723.1	8e-66	30.96%	PREDICTED: similar to huntingtin interacting protein [Nasonia vitripennis]
NCBI nr blastp	gi\|340726897	1e-67	30.12%	PREDICTED: hypothetical protein LOC100652142 [Bombus terrestris]
NCBI nr blastx	gi\|322799945	4e-81	30.80%	hypothetical protein SINV_04653 [Solenopsis invicta]

Group
Gene Ontology	GO:0006355	6.3e-10	regulation of transcription, DNA-dependent
	GO:0005694	6.3e-10	chromosome
	GO:0034968	6.3e-10	histone lysine methylation
	GO:0018024	6.3e-10	histone-lysine N-methyltransferase activity
	GO:0005515	7e-07	protein binding
KEGG pathway	nvi:100123115	2e-65
	K11423 (SETD2, SET2)	maps->	Lysine degradation
InterPro domain	[725-771] IPR013257	6.3e-10	SRI, Set2 Rpb1 interacting
	[526-570] IPR001202	7e-07	WW/Rsp5/WWP
	[667-744] IPR007143	1.8e-06	Vacuolar protein sorting-associated, VPS28
Orthology group

Nucleotide sequence:

>DPOGS201317-TA
ATCAACCAAGAGGAAGAAGACGTAACAACCTCAAAGACGGGCACTTCAGAATCCTCTGAGGACAAGCATGCTGTGAACGCCACAGACCAGGCCCGGCCGAGAGTACGGAAACCCAAGAGGGACAGGAAGTATAAACCAAAGTCTGGAGACTTAGTACAAGACGCTGATATCGAGGAGGACCTAGAAGCGCTCGGTCGTACTGGCATTAAGAATCAGGCTCACACGCTGCGACTGTCACGTACGGTGGTCCGCGCTAAAACACGACGCGCACAGACGGCACTGCTGCGACTACTGAGAGACGCGCACCTCCCGTGCCGCAGACTGTTCCTCGACTACCGCGGTCTCAGGCTGCTGGCGCCCTGGTGTAACGACGCTCCTTTGAACTTCAAATTGGAAATGCTCCAAACTGTTGATCGTCTACCGATCACCAATAAGACGATGGTTCAAGAGAGTCGTTTCTTCACAATCGTGGAGCGATGGCTCAGTTCCTCGGACGCTCCTCCTGAACCCGTCTTTATTGATGAGGCCACTGGCTTGCCAGTAGAAATCCCGAGGCCAACTCCAGATGAACCCGTCACACCAGAAAAGACAAAAGAAAATGCAGCAATGTCTGAAAAAGTTAAAGATCTCTGTAACCAAATGCTTGAAAGGTGGTCCAGTTTAAAGGAGGTTTTCAAGATACCAAAGAAAGAGCGCATACAGCAAATGAAAGAACACGAGAGGCAAGCGAACGTCGAGAGGCGAGCGGCTGATTCGAGCGGTACGAGAGATCGAGATAGAGAACGGGATAGGAGGGACGAGAGGGATAGAGACAGAGATAGAAGAGATGAGCGAGATAGAGAGAGGGACAGGGACCGAGACCGCGAGAGAGAGAGGGAGAGAGACAGGGACAGAGACAGGGAGAGGGAACGGGAGAGAGAACGAGAGAGAGACAGATATAGGGACAGAGACCGGGATAGAGATAGAGACGACCGCGACAGAAGAAAACGGAGAAATAGTCCGGAGGGAGGACGGCGCAGTATAAAACTGAGCGAGCGAGTGTTAGCGGCCGTGCCTCCTATAAGTAAAGAGGAGCGGCGACGCGCGTTCGCGGAAGCTGCGGCCGCCGCCGACGAGAGCAGGAGGCAGAGGGAGAGGGAGCACGCGCAGGCCTGGCACTACAGGCACTGGCCGCAAGAGGCGTTCGCACAGATGTTTCCCCAGGGCATGATGGGTAACGGACAGAATATGATGGGCGGTGGACCGAATATGATGAACGGCGCACCGAACATGTTGGGGGGAGGTCAGAACATGATGGGTGGGCCTAACATTATGGGGCAGATGGTCCCTGGGATGCTACCGGGGGTGATGCCGTCGGAGGTCTCCAATGAATGGATCGGTCCCAACGGCGAATTCCAAGGCCCGCCCGGGTTTTGCCAGCCTTTCCCTGGACCACAATCGTTTTGTCTGCCTCAGTCTAATATGATGGGTTTACCCGGTTTCGGCATGGGTGGTTTTATGTTCGGTCAGCAACTGCCGGGCGCCTTCCCGCCCCCTCAACCTGCTCTACAACAACCACAGCAACCTCAGACCATCACAGATAATATAACGGAGTCGGGGGGCGAGCCTCCTCTGCCGTCGATGTGGCGGAGCGCCGTGGATGGTCGAGGTCGCCGGTACTACTACCACGTGAAGCTGAGACAACCACAGTGGCTGCCACCGCCGCCACCACCACAAGAGGAAAGTTCGTCTGAGGAGGAAGTGGAGCCCATGACCGCCATGGAGTCCGCTGTGATCGGGCGGCCGGTCAAAGGGAAACTCGTTGAGGGGGTCAACGGTATATACGAAGTTATCAAAGAGGATCCCCAGAACGGCCTCATTCCAGATCACGCCTTACTCAACATGAAGCCGCGCAAGAGAAGGCCCGGGCTGGTCACTGAGAGGCCTATCAGTCCGAGAACCGAAGAGGACAAGCTGGCCGGACGTATGGAGGTGAAGAGATACAAGCAAACCAAAGAGAAGTTACGGAGACGAAGAGAGAAGTTGCTGCAGAAGGTGAAGATGTTGACTGACAGGAGACGGAAAGATATGAAGTTAGATTGTCCGGCAGCATTAGAGAGGATAAGGGAGAACAAACCAAACCTGATTAAAGATGACAAAGGGAACACTAACAAATATATCGCTGAAATTGTATCGTTGACGCACTTCGTGATGCTGAAAGAGTTGAAGCACTGTCGGTCGGTGGACGAGCTGGAGGTGACGGATTCCGTCCGCACCAAGGCCAAGCTGTTCGTCAAGAGATATATGATGAAGTTCGGGCCCGTTTACAAGAGACCGCCCGAGGAGGCCGACTAG

Protein sequence:

>DPOGS201317-PA
INQEEEDVTTSKTGTSESSEDKHAVNATDQARPRVRKPKRDRKYKPKSGDLVQDADIEEDLEALGRTGIKNQAHTLRLSRTVVRAKTRRAQTALLRLLRDAHLPCRRLFLDYRGLRLLAPWCNDAPLNFKLEMLQTVDRLPITNKTMVQESRFFTIVERWLSSSDAPPEPVFIDEATGLPVEIPRPTPDEPVTPEKTKENAAMSEKVKDLCNQMLERWSSLKEVFKIPKKERIQQMKEHERQANVERRAADSSGTRDRDRERDRRDERDRDRDRRDERDRERDRDRDRERERERDRDRDRERERERERERDRYRDRDRDRDRDDRDRRKRRNSPEGGRRSIKLSERVLAAVPPISKEERRRAFAEAAAAADESRRQREREHAQAWHYRHWPQEAFAQMFPQGMMGNGQNMMGGGPNMMNGAPNMLGGGQNMMGGPNIMGQMVPGMLPGVMPSEVSNEWIGPNGEFQGPPGFCQPFPGPQSFCLPQSNMMGLPGFGMGGFMFGQQLPGAFPPPQPALQQPQQPQTITDNITESGGEPPLPSMWRSAVDGRGRRYYYHVKLRQPQWLPPPPPPQEESSSEEEVEPMTAMESAVIGRPVKGKLVEGVNGIYEVIKEDPQNGLIPDHALLNMKPRKRRPGLVTERPISPRTEEDKLAGRMEVKRYKQTKEKLRRRREKLLQKVKMLTDRRRKDMKLDCPAALERIRENKPNLIKDDKGNTNKYIAEIVSLTHFVMLKELKHCRSVDELEVTDSVRTKAKLFVKRYMMKFGPVYKRPPEEAD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: