MonarchBase - Protein-coding gene

DPOGS200578
Transcript	DPOGS200578-TA	3513 bp
Protein	DPOGS200578-PA	1170 aa
Genomic position	DPSCF300303 + 150321-157985
RNAseq coverage	20x (Rank: top 79%)

Annotation
*Heliconius*	HMEL016949	0.0	67.72%
*Bombyx*	BGIBMGA002246-TA	0.0	59.27%
*Drosophila*	Mes-4-PA	2e-148	46.90%
EBI UniRef50	UniRef50_D6WZP0	0.0	46.84%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WZP0_TRICA
NCBI RefSeq	XP_973711.1	0.0	46.84%	PREDICTED: similar to NSD1 [Tribolium castaneum]
NCBI nr blastp	gi\|91090902	0.0	46.84%	PREDICTED: similar to NSD1 [Tribolium castaneum]
NCBI nr blastx	gi\|270014006	0.0	42.43%	hypothetical protein TcasGA2_TC012700 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	4.8e-40	protein binding
	GO:0005634	1.3e-13	nucleus
	GO:0018024	1.3e-13	histone-lysine N-methyltransferase activity
	GO:0008270	1.1e-07	zinc ion binding
KEGG pathway	tca:662527	0.0
	K11424 (NSD1_2)	maps->	Lysine degradation
InterPro domain	[921-1044] IPR001214	4.8e-40	SET domain
	[732-794] IPR000313	5.5e-15	PWWP
	[870-920] IPR006560	1.3e-13	AWS
	[670-745] IPR011011	4.5e-11	Zinc finger, FYVE/PHD-type
	[682-731] IPR013083	3.4e-08	Zinc finger, RING/FYVE/PHD-type
	[687-727] IPR001965	1.1e-07	Zinc finger, PHD-type
Orthology group	MCL10357		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200578-TA
ATGGAATTATGTGAAAAGGATAATATAAATCAAGAATTGGATAGAGTTGTAGAAAATATTTCACCAGACATAGAAACTATAAGACGTCGAAAGCGTTGTTTGAATGTGCCTTTAAACAAATCTATCGATATTGTTACGAAAACAAGTGAAGATAAAACGAATATCGACAAAGAAGAGAATTGTGACAATAATTTAAATAAAACTGCCGATGAATTACCTCAAAATGTTAGCAATAACGAAAAAGTAGATAGTATGGAAAATGATCGAGAAATATTGGCAATAAATGATATGCGGAACCCATGCGGCGATAATGATAATGTAGATTTGGAAACTAATGAAGAATCTAGTAGCACTACTCAGGTTCATACATCCGAAGAAAACGAAAATCAAAATACAACAAAGACTGAATTAACTATAAATACTAATACAAACAGCTCGGATGAGGAAGCTGAGGGTAAAAATCCCATCATAACAGATGAGCTATCAGATCAAAATGATGGGAAAGCAGATGAGATTAAAGAAATGGAGATGGAAAAAGATAATGATAATGTATCAGTTGTATCAGAGGGCAGCGATATATCAAGAAAGAAACGCGCCAGAGACAAGCCGTCTGATAAGAAATCTTTGTTATCTGATGTAGAATTCCTGAAATATCTGGAATTGAGACAGGATGCGGTCATAGACGAGCATCCCGAGCTCTCGCAGGAAGACATCACTAGCTATTTATACAAAACCTGGATATACGAGGAAAATTTGAAACCAGATATAAAGAAATGCGATGACATAGACCAAGCTAATTTAGTGAAGGGTTTGAACTTAGACCCAGCGCCGGTCAAAAAAGTCAGGAAGAGGGTTAAAGTTGACAAAGAGATTGCGTGCGAGGACACCGCTACCAAAGAGAAATCTAAAAGAAAAATAATACGCCCATACTATAAAGAGGAATTTTCAGACGGGGATGATAGTGTGGAATATTTTGATATATTTAAATCTAAAAAGGACCAAAAAGGAGCAATTGTGGACAGTAAAGAAATATATCAGAGCGACGGAACTGTCCTCGAACGTATTATAAACGTAGACGAGTACGTTCAGGACGAATACGATGACGTCGAAGAATACTTCAGACAGCTAACAGCGCCTAAACCTAACGTCTTTAAGGGTTACGCGAGGGAAAAGGTGTGCGAAATATGCGAGAAGGTCGGCGGCTTAGTCAAGTGCAAGGGTTGCCATTCGATGTTTCATGTGGAATGTGACAAGAAGGAAATCGAGGTTATAGAATGCCAGACGCCAACAAGAGGCAGGAGGAGGAAGAAGAAAACTAGAGGAAGGAAGACCAGGGACGATCACAACCAAGACTCCGGCAGCGACGAGAAGTCGCAAGACACCAACGGCTCGGACGAATTACATATGTCGCTGGAAGAAGAATCTCATATAATAGCAAATGCGGACGATTTTGAGGCTCAAATGTCCGTAAGAATGCAAGAAATACTCAAGGATCAGGACATTCAGTACGATTTCTATTCACGCGAGGAGCTGGATTGGAACGACACTCACGCGGGCGAATGTAAGGTCGTGGACATAAAGCCGAGGATGGATTCGATAGAAATAACGGATTATTCGGAATTCAAATGCAAGAACTGCCAGAAATACGATCCGCCGGTATGTTTCGTGTGTAAATATCCTATATCGCCCAAAGAGAAACAGGGTCACAGGCAGAAATGTCAAGTGGCTCATTGCAATAAGTATTACCACTTGGAATGCTTGGACCATTGGCCCCAAACACAATTCAACGGGGGAGAAATTTCTAGAACGAATAAGTTCAGCGAAGCCCTAACTTGCCCGAGGCACGTGTGCCACACTTGTGTCTGTGACGATCCCAGGGGTTGTAAGACGAGATTCAGCGGTGATAAATTAGCGAGATGCGTTCGCTGTCCGGCCACTTACCACACATTCACGAAATGTCTACCGGCTGGGTCACAGATACTGACCGCCTCCCATATAATATGTCCACGACATTATGAACACAGGCCTGGCAAAGTCCCCTGCCACGTGAACACCGGCTGGTGTTTCATATGCGCCCTGGGCGGATCTCTGATATGTTGTGAATACTGCCCGACGTCCTTTCACGCTGAGTGCCTTAATATTAAACCTCCTGAGGGTGGTTATATGTGCGAGGACTGTGAGACTGGTAGACTACCGCTGTACGGAGAAATGGTGTGGGTGAAGCTAGGACACTACAGGTGGTGGCCAGGTATAATTCTTCATCCGTCTGAGATTCCAGACAACATCCTAACCGTGAAACATACCCTCGGTGAATTTGTGGTCAGATTTTTTGGACAATACGACTACTACTGGGTCAATAGAGGCAGAGTGTTCCCGTTCCAAGAAGGTGATTCGGGTAAAGTTTCTAGTCAGAAATCCAAGATAGATGCAGCATTCACTATGGCGATGGAGCACGCACAAAGAGCTTGTTCGATTTTGAAAATGGCTGCGCCGAATGAAGAAGAGTCTTCTGACATAGCATCTTCATTGTTACCACCTCATTATGTTAAATTGAAGGTGAATAAACCTTGCGGGTCACTCTGCGGCAAGAAAATAGATTTAGAGGAAAGTTCATTGACCCAGTGCGAATGTGACCCTAATGATGTCGATCCTTGCGGTCCCTATACTCAATGTCTCAATAGAATGCTTCTAACTGAGTGCGGTCCGACGTGTCGCGCCGGAGATCGCTGTAACAACAGAGCGTTCGAGAAACGTCTTTACCCCAGGCTGGGACCCTATCGCACCCCGCATAGAGGCTGGGGGCTACGGACCATGCAGGATTTAAGAGCTGGCCAGTTCGTTATAGAGTATGTGGGGGAGCTGATAGACGAGGAGGAGTTCAGACGTCGCATGAACAGGAAACACGAGGTCCGGGATGAGAACTTCTATTTTTTAACGTTGGACAAAGAGCGCATGATAGACGCCGGGCCGAAAGGGAATCTGGCGAGGTTTATGAATCATTCCTGTGAGCCTAATTGCGAAACACAAAAGTGGACGGTGTTGGGCGACGTGCGTGTGGGATTGTTCGCGTTACGTGACATACCGGCAAACAGCGAGCTCACATTCAACTATAACCTGGAGACGTCGGGTATTGAGAAGAAAAGATGTATGTGTGGAGCCAAGAGGTGTTCAGGATATATAGGGGCTAAGCCTAAACAGGAGGACCAACCAAAGAAAATCAAGCCGCAGGTGAAAAGGATTTACAGGAAGCGCAAAGCGGAAGAATCGCCGTCTACGAGCCAGTACAAGAAACGAGGCAGACCCATAAAACCGCGAGAGCTGACCGAAATAGAAAAAGATCTTTTAATCATCAAAAATGCGACCAACGGCCTGTCTAGCGATTCAGAGTGCTCCAGGATAAGCATGGACAGCTGCAAAGATATAAAGGCGCTCAAAAGGAAAAGAATCAACCTGTCCACCGAGGAGTTGTCCCCGAAGAGGTCTAAGACGGATGAAATGAATTTGGTTTATTGA

Protein sequence:

>DPOGS200578-PA
MELCEKDNINQELDRVVENISPDIETIRRRKRCLNVPLNKSIDIVTKTSEDKTNIDKEENCDNNLNKTADELPQNVSNNEKVDSMENDREILAINDMRNPCGDNDNVDLETNEESSSTTQVHTSEENENQNTTKTELTINTNTNSSDEEAEGKNPIITDELSDQNDGKADEIKEMEMEKDNDNVSVVSEGSDISRKKRARDKPSDKKSLLSDVEFLKYLELRQDAVIDEHPELSQEDITSYLYKTWIYEENLKPDIKKCDDIDQANLVKGLNLDPAPVKKVRKRVKVDKEIACEDTATKEKSKRKIIRPYYKEEFSDGDDSVEYFDIFKSKKDQKGAIVDSKEIYQSDGTVLERIINVDEYVQDEYDDVEEYFRQLTAPKPNVFKGYAREKVCEICEKVGGLVKCKGCHSMFHVECDKKEIEVIECQTPTRGRRRKKKTRGRKTRDDHNQDSGSDEKSQDTNGSDELHMSLEEESHIIANADDFEAQMSVRMQEILKDQDIQYDFYSREELDWNDTHAGECKVVDIKPRMDSIEITDYSEFKCKNCQKYDPPVCFVCKYPISPKEKQGHRQKCQVAHCNKYYHLECLDHWPQTQFNGGEISRTNKFSEALTCPRHVCHTCVCDDPRGCKTRFSGDKLARCVRCPATYHTFTKCLPAGSQILTASHIICPRHYEHRPGKVPCHVNTGWCFICALGGSLICCEYCPTSFHAECLNIKPPEGGYMCEDCETGRLPLYGEMVWVKLGHYRWWPGIILHPSEIPDNILTVKHTLGEFVVRFFGQYDYYWVNRGRVFPFQEGDSGKVSSQKSKIDAAFTMAMEHAQRACSILKMAAPNEEESSDIASSLLPPHYVKLKVNKPCGSLCGKKIDLEESSLTQCECDPNDVDPCGPYTQCLNRMLLTECGPTCRAGDRCNNRAFEKRLYPRLGPYRTPHRGWGLRTMQDLRAGQFVIEYVGELIDEEEFRRRMNRKHEVRDENFYFLTLDKERMIDAGPKGNLARFMNHSCEPNCETQKWTVLGDVRVGLFALRDIPANSELTFNYNLETSGIEKKRCMCGAKRCSGYIGAKPKQEDQPKKIKPQVKRIYRKRKAEESPSTSQYKKRGRPIKPRELTEIEKDLLIIKNATNGLSSDSECSRISMDSCKDIKALKRKRINLSTEELSPKRSKTDEMNLVY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: