MonarchBase - Protein-coding gene

DPOGS200860
Transcript	DPOGS200860-TA	4080 bp
Protein	DPOGS200860-PA	1359 aa
Genomic position	DPSCF300071 + 273367-292525
RNAseq coverage	98x (Rank: top 61%)

Annotation
*Heliconius*	HMEL012645	0.0	74.94%
*Bombyx*	BGIBMGA009848-TA	0.0	58.83%
*Drosophila*	ksr-PA	9e-108	56.94%
EBI UniRef50	UniRef50_UPI0002246AEE	0.0	45.74%	UPI0002246AEE related cluster n=1 Tax=unknown RepID=UPI0002246AEE
NCBI RefSeq	XP_001605076.1	0.0	46.79%	PREDICTED: similar to ENSANGP00000009647 [Nasonia vitripennis]
NCBI nr blastp	gi\|156548452	0.0	46.79%	PREDICTED: kinase suppressor of Ras 1-like isoform 1 [Nasonia vitripennis]
NCBI nr blastx	gi\|156548452	0.0	47.52%	PREDICTED: kinase suppressor of Ras 1-like isoform 1 [Nasonia vitripennis]

Nucleotide sequence:

>DPOGS200860-TA
ATGGATGCAGATAGCGAAAACGAAAAAAAAAGAATCCGTGATGCAATTCAGATGATAGAGACCATTCAGTCGATGATAGACGTTTCAGCAGACAGGCTCGAGGGCTTGAGAACACAATGTTCAACGAGTGCGGAGCTGACGCAGCAGGAGATCCGGACACTGGAGGGAAAGCTGGTGAAGCATTTCTCGCGGCAGCTGGTGATCAAGGCCCAGTTCGTGGAGGAGATCCAACGAGAGCTTGGACATGTGCCGAGTTTGAGACAGTGGCTGAGAGTTGTGGGGCTCAGTGTTGATGCTATAGAGTCGGTGTTATCTCGTGTGTCATCTCTGGAACTGCTCCGTGATCGCTCAGAACATGAGCTGCGAGCGATGCTGTGTGGTGCCAGGGACGAGGAAGTCCGCAGGCTCTGTAGAGCAATGCAAAGACTCAGGACATATACAGAGGCTTTGGCGCGTGGCGAAGGTTCCGCGGAACTGCCCCTATATTGGGACTCGTGGGAGAGACACGTGCGAGGCTCACCCAGGGCCAGGGACGACAGGAACAACGATAATAAGAAGGGCGGTAAATCTCCCACGACGCCCATCAACAAACGCAAGCAGAACTCTCACCTGCCCGCACCACCAGCTCAACCCTCGTCGCTCACCAAGTCGAGGTCACATGAGTCCCAGCTGTCTGTGAAGCCGGACACATCAGACCACAGTGATAACAGTCAGTCTTCGGCCGCCGTGTGTGAGGTGTCGGAGTCGCCCCCGGGCTCCCCTAGAGACCCCGACCCCGACCCACCGCCTCGATACTACACCAACACGATTCCCCCTCCCGCGCCCCGCTCGCCCCGCACGCCCACCGTGAGCGGCTGTATGGCCCACGACATCGCCCACCGGTTCACCAAGACCTTCAACATGATAGCCACCTGCGACTACTGTGACAAGCAGATGCTCTTCGGCAGCGGCTTGAAGTGTAAAGAGTGCAAGTTCAAATGTCATAGTGATAACAGTCAGTCTTCGGCCGCCGTGTGTGAGGTGTCGGAGTCGCCCCCGGGCTCCCCTAGAGACCCCGACCCCGACCCACCGCCTCGATACTACACCAACACGATTCCCCCTCCCGCGCCCCGCTCGCCCCGCACGCCCACCGTGAGCGGCTGTATGGCCCACGACATCGCCCACCGGTTCACCAAGACCTTCAACATGATAGCCACCTGCGACTACTGTGACAAGCAGATGCTCTTCGGCAGCGGCTTGAAGTGTAAAGAGTGCAAGTTCAAATGTCATAGGGATTGTGAGAGTAAAGTTCCTCCATCGTGCGGTCTCCCTCCAGAGTTCGTGACTGCCTTCAAAGAAAAATTTCACAAAGACGGTGGTCTGTACCTGACGTCCGTGTCGTCAGGCCGCACGCTGATACCCTCACTGACTCCTCTCAGACGCCGCCCGCCGCCCACCGCCCATCATCATACGGTAAGGCTGTCTCACACTATGATAAATGAATCTGTATATGATATGACCTCTATATCTATTGTATGCTTAGGGCTCGCGTCTTCCACATCGGCGAGACAGGGTTTCGGTAATGCCTTAGAAGGTAACCCGGATTCATCATCGAACACGTCCTCGTGTAACAGCTCCACCCCGTCCTCCCCCGCGCTGGCCGCGCCCGCCCCCGCGCCCGCCACGCCGCAGGCACACCACCACCACCACCATATAACACTCAAACAGCAGTTCCACTTCCCTGAGATGTCGACACGGTCGGTGGGGACGCCGGTGGAGCGACACGACTCACGACACGACCAGCGACACGACTCCCGACACGACGCTTCCGACCGGTGGCCGAGGCAGAACAGTTACACTGTTGGCATCAGGACTCGAGCAGTGACACGAAGGGTGATGTGTCCAAGGAAGGCTATATGTCAGAGAGAGTTCGGTGCCAATCCCGAGGGAAAGCTGGTGAAGCATTTCTCGCGGCAGCTGGTGATCAAGGCCCAGTTCGTGGAGGAGATCCAACGAGAGCTCGGACATGTGCCGAGTTTGAGACAGTGGCTGAGAGTTGTGGGGCTCAGTGTTGATGCTATAGAGTCGGTGTTATCTCGTGTGTCATCTCTGGAACTGCTCCGTGATCGTTCAGAACATGAGCTGCGAGCGATGCTGTGTGGTGCCAGGGACGAGGAAGTCCGCAGGCTCTGTAGAGCAATGCAAAGACTCAGGACATATACAGAGGCTTTGGCGCGTGGCGAAGGTTCCGCGGAACTGCCCCTATATTGGGACTCGTGGGAGAGACACGTGCGAGGCTCACCCAGGGCCAGGGACGACAGGAACAACGATAATAAGAAGGGCGGTAAATCTCCCACGACGCCCATCAACAAACGCAAGCAGAACTCTCACCTGCCCGCACCACCAGCTCAACCCTCGTCGCTCACCAAGTCGAGGTCACATGAGTCCCAGCTGTCTGTGAAGCCGGACACATCAGACCACAGTGATAACAGTCAGTCTTCGGCCGCCGTGTGTGAGGTGTCGGAGTCGCCCCCGGGCTCCCCTAGAGACCCCGACCCCGACCCACCGCCTCGATACTACACCAACACGATTCCCCCTCCCGCGCCCCGCTCGCCCCGCACGCCCACCGTGAGCGGCTGTATGGCCCACGACATCGCCCACCGGTTCACCAAGACCTTCAACATGATAGCCACCTGCGACTACTGTGACAAGCAGATGCTCTTCGGCAGCGGCTTGAAGTGTAAAGAGTGCAAGTTCAAATGTCATAGGGATTGTGAGAGTAAGGTCCCTCCATCGTGCGGTCTCCCTCCAGAGTTCGTGACTGCCTTCAAAGAAAAATTTCACAAAGACGGTGGTCTGTACCTGACGTCCGTGTCGTCAGGCCGCACGCTGATACCCTCACTGACTCCTCTCAGACGCCGCCCGCCGCCCACCGCCCATCATCATACGCTCCACCCCGTCCTCCCCCGCGCTGGCCGCCCCCGCCCCNNNNNNNNNNNNGCCCCCGCCCCCGCGCCCGCCACGCCGCAGGCACACCACCACCACCACCATATAACACTCAAACAGCAGTTCCACTTCCCTGTACTTGTGTGTTCAGAGATGTCGACACGGTCGGTGGGGACGCCGGTGGAGCGACACGACTCACGACACGACCAGCGACACGACTCCCGACACGACGCTTCCGACCGGTGGCCGAGGCAGAACAGTTTGTCCATGAAGGAGTGGGACATACCTTACGACGAGCTCAAGCTGTTCGAGGTGATCGGAACAGGTCGCTTCGGGACGGTCTACAGGGGCAGCTGGCACGGAGCGGTCGCCGTGAAGCTGCTGCACGTGAACGCTCTCAGCGACCACACCGCGCCTCTGGACACCTTCAAGCACGAGGTGGCGACCTTCAGGAAGACTCGCCACGAGAACCTGGTGCTGTTCATGGGCGCGTGTATGAAGCCACCTCGCCTGGCCATCGTGACGTCACTGTGTAAGGGCATGACGCTGTACACACACATCCACCTCAGGAAGGACAAGTTCACCGCCAACAAGAGCGTCATCGTCGCACAGCAGATATCACAGGGCATGGGTTACTTGCACGCTCGGGGCATCGTGCACAAGGATCTGAAGACGAAGAATATATTCTTGGAGAATGGAAAAGTCGTCATCACAGACTTCGGACTGTTCAGCGTCACCAAGCTGTGTTTTGGCAACAACGCCCGTGGACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACATATCATAATACACGCACGTTCACATATATATTCACTGTATGGTACGAGCTGCTGTGCGGTGAATATCCCTTCAAGGGCCAGCCTCCTGAGGCGGTCATCTGGCAGGTCGGCAAGGGAGTGAAGCAGTCCTTGAACAACATGCAAGCCTCTAGAGATATCAAAGACATCCTTATGCTCTGCTGGGCTTACCGATCAAGTGAGCGGCCAGACTTTCCGCACTTGTTGTCAACTCTGGAGAAGCTGCCAAGGAAGAGACTGGCTCGCTCGCCCTCACATCCTGTTCATCTGTCACGATCAGCTGACTCAGTGTTCTGA

Protein sequence:

>DPOGS200860-PA
MDADSENEKKRIRDAIQMIETIQSMIDVSADRLEGLRTQCSTSAELTQQEIRTLEGKLVKHFSRQLVIKAQFVEEIQRELGHVPSLRQWLRVVGLSVDAIESVLSRVSSLELLRDRSEHELRAMLCGARDEEVRRLCRAMQRLRTYTEALARGEGSAELPLYWDSWERHVRGSPRARDDRNNDNKKGGKSPTTPINKRKQNSHLPAPPAQPSSLTKSRSHESQLSVKPDTSDHSDNSQSSAAVCEVSESPPGSPRDPDPDPPPRYYTNTIPPPAPRSPRTPTVSGCMAHDIAHRFTKTFNMIATCDYCDKQMLFGSGLKCKECKFKCHSDNSQSSAAVCEVSESPPGSPRDPDPDPPPRYYTNTIPPPAPRSPRTPTVSGCMAHDIAHRFTKTFNMIATCDYCDKQMLFGSGLKCKECKFKCHRDCESKVPPSCGLPPEFVTAFKEKFHKDGGLYLTSVSSGRTLIPSLTPLRRRPPPTAHHHTVRLSHTMINESVYDMTSISIVCLGLASSTSARQGFGNALEGNPDSSSNTSSCNSSTPSSPALAAPAPAPATPQAHHHHHHITLKQQFHFPEMSTRSVGTPVERHDSRHDQRHDSRHDASDRWPRQNSYTVGIRTRAVTRRVMCPRKAICQREFGANPEGKLVKHFSRQLVIKAQFVEEIQRELGHVPSLRQWLRVVGLSVDAIESVLSRVSSLELLRDRSEHELRAMLCGARDEEVRRLCRAMQRLRTYTEALARGEGSAELPLYWDSWERHVRGSPRARDDRNNDNKKGGKSPTTPINKRKQNSHLPAPPAQPSSLTKSRSHESQLSVKPDTSDHSDNSQSSAAVCEVSESPPGSPRDPDPDPPPRYYTNTIPPPAPRSPRTPTVSGCMAHDIAHRFTKTFNMIATCDYCDKQMLFGSGLKCKECKFKCHRDCESKVPPSCGLPPEFVTAFKEKFHKDGGLYLTSVSSGRTLIPSLTPLRRRPPPTAHHHTLHPVLPRAGRPRPXXXXAPAPAPATPQAHHHHHHITLKQQFHFPVLVCSEMSTRSVGTPVERHDSRHDQRHDSRHDASDRWPRQNSLSMKEWDIPYDELKLFEVIGTGRFGTVYRGSWHGAVAVKLLHVNALSDHTAPLDTFKHEVATFRKTRHENLVLFMGACMKPPRLAIVTSLCKGMTLYTHIHLRKDKFTANKSVIVAQQISQGMGYLHARGIVHKDLKTKNIFLENGKVVITDFGLFSVTKLCFGNNARGHTHTHTHTHTHTHTHTHTHTHTHTYHNTRTFTYIFTVWYELLCGEYPFKGQPPEAVIWQVGKGVKQSLNNMQASRDIKDILMLCWAYRSSERPDFPHLLSTLEKLPRKRLARSPSHPVHLSRSADSVF-

Group
Gene Ontology	GO:0016772	3.5e-50	transferase activity, transferring phosphorus-containing groups
	GO:0004672	5.1e-45	protein kinase activity
	GO:0006468	5.1e-45	protein phosphorylation
	GO:0005524	2e-21	ATP binding
	GO:0004674	2e-21	protein serine/threonine kinase activity
	GO:0004713	2e-13	protein tyrosine kinase activity
	GO:0035556	2.3e-11	intracellular signal transduction
KEGG pathway	spu:575613	4e-52
	K04365 (BRAF)	maps->	Prostate cancer
			Regulation of actin cytoskeleton
			MAPK signaling pathway
			Glioma
			Melanoma
			Pathways in cancer
			Chemokine signaling pathway
			Endometrial cancer
			Natural killer cell mediated cytotoxicity
			Insulin signaling pathway
			Neurotrophin signaling pathway
			Long-term depression
			Focal adhesion
			ErbB signaling pathway
			Colorectal cancer
			Thyroid cancer
			mTOR signaling pathway
			Progesterone-mediated oocyte maturation
			Long-term potentiation
			Renal cell carcinoma
			Pancreatic cancer
			Acute myeloid leukemia
			Vascular smooth muscle contraction
			Bladder cancer
			Non-small cell lung cancer
			Chronic myeloid leukemia
InterPro domain	[1047-1356] IPR011009	3.5e-50	Protein kinase-like domain
	[1076-1333] IPR001245	5.1e-45	Serine-threonine/tyrosine-protein kinase
	[1075-1339] IPR002290	2e-21	Serine/threonine-protein kinase domain
	[1075-1333] IPR020635	2e-13	Tyrosine-protein kinase, catalytic domain
	[386-434] IPR002219	2.3e-11	Protein kinase C-like, phorbol ester/diacylglycerol binding
Orthology group	MCL11476		Multiple-copy universal gene

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: