MonarchBase - Protein-coding gene

DPOGS205511
Transcript	DPOGS205511-TA	3042 bp
Protein	DPOGS205511-PA	1013 aa
Genomic position	DPSCF300056 - 209288-232823
RNAseq coverage	1473x (Rank: top 9%)

Annotation
*Heliconius*	HMEL011296	0.0	80.24%
*Bombyx*	BGIBMGA011088-TA	2e-121	39.51%
*Drosophila*	JIL-1-PB	2e-133	42.93%
EBI UniRef50	UniRef50_UPI000224668E	0.0	53.97%	UPI000224668E related cluster n=3 Tax=unknown RepID=UPI000224668E
NCBI RefSeq	XP_395099.3	0.0	57.74%	PREDICTED: similar to ribosomal protein S6 kinase, 90kDa, polypeptide 5 isoform a [Apis mellifera]
NCBI nr blastp	gi\|328778650	0.0	57.74%	PREDICTED: ribosomal protein S6 kinase alpha-5 [Apis mellifera]
NCBI nr blastx	gi\|91093150	0.0	60.43%	PREDICTED: similar to ribosomal protein S6 kinase, 90kDa, polypeptide 5 [Tribolium castaneum]

Group
Gene Ontology	GO:0016772	3.6e-78	transferase activity, transferring phosphorus-containing groups
	GO:0005524	6.4e-77	ATP binding
	GO:0004674	6.4e-77	protein serine/threonine kinase activity
	GO:0006468	6.4e-77	protein phosphorylation
	GO:0004672	4.7e-57	protein kinase activity
	GO:0004713	5.1e-09	protein tyrosine kinase activity
KEGG pathway	ame:411630	0.0
	K04445 (MSK)	maps->	MAPK signaling pathway
			Neurotrophin signaling pathway
InterPro domain	[1-265] IPR011009	3.6e-78	Protein kinase-like domain
	[342-609] IPR002290	6.4e-77	Serine/threonine-protein kinase domain
	[347-600] IPR017442	4.7e-57	Serine/threonine-protein kinase-like domain
	[239-299] IPR000961	1.5e-14	AGC-kinase, C-terminal
	[259-301] IPR017892	3.9e-09	Protein kinase, C-terminal
	[342-601] IPR020635	5.1e-09	Tyrosine-protein kinase, catalytic domain
Orthology group	MCL10897		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205511-TA
ATGAAGGTGCTGAAGAAGGCCAGCATAGTGCAGAAACTCAAGACGGCGGAGCACACCAGGACGGAGAGACAGGTCTTGGAGGCTGTGAGGGCCTGTCCCTTCCTGGTGACCCTACATTACGCCTTCCAGACAGATGCCAAGCTACATCTCATACTCGACTACGTGGCCGGCGGGGAGCTGTTCACACACCTGTACCAGCGAGAACACTTCCACGAAAACGAAGTCAGGATATACATCGCCGAGATCATACTGGCGTTGGAACAGCTGCACAAGCTGGGCATCATCTACCGCGACATCAAGCTGGAGAACATCCTGCTTGATGCGGAAGGTCACATCGTGTTGACGGACTTCGGGCTGTCCAAGGAGTTCTGCGGCGGAGAGAGCCGCGCCTACAGCTTCTGCGGCACCATAGAGTACATGGCCCCGGAGGTCGTGAGGAGCGGCTCCCAGGGACACGACATAGCTGTGGACTGGTGGTCTGTGGGAGTATTAACGTACGAACTGCTGACGGGTGCTTCGCCCTTCACAGTCGAGGGTGAGAAGAACACTCAGCAGGAGATCACCAAGAGAATTGTGAGATGCAGTTACCCCGTGCCCAACGACGTCAGCCCCGCTGTTCAGGACTTCATCAAGAAACTTTTAGTAAAGGACCCTCGTCGTCGTCTAGGAGGCGGTGATGATGATGCAGAGGAATTGAAACGACACCCCTTCTTCCAGGACCTGGACTGGGAGGCGGTGTCCCGGCGCGAGGTGGCCGCCCCGTTCGTGCCGCAGCTGTCGCACGCAGCTGACACGTGTAACTTCGCCGACGAGTTCACCAGGATGCCGCCCACCGACTCGCCGGCACAGGCGCCCAAACACCACGACAAACTGTTCCTAGGTTACTCATATGTGGCACCCAGCATCCTGTTCTCTGAGAACATCATCTCGGATCAGATCTGGCTTCAGGCGACCGGACAGAAGCACGAGAAGCTCAAGGGATGGATCGCTAAGGACTCGCCGTTCTTCCAGAAGTATTCTGTTGACTTGAGCACTCCTCTGCTGGGTGACGGCTCATATGCTGTTTGTAGGAAGTGTATACACAGACAGACGGGCAAGGAATATGCTGTTAAGATAATATCGTCACAGAAGAAGGACGTGAAGCAAGAGATAGACCTGCTGAAGACCTGTCAGGGCTGTCCTTACATCATACAGCTGCATGAGGTGTTCCACGACACTGCGTTCACCTACATAGTGACGGAGCTGGCGATGGGCGGTGAGCTATCCTCGGTGCTGGGCGCGGTCAGCGAGCGGGTGGCGAGGAGGCTCATCGTGCAGCTGTCGCTGGCCGTTAGACACATGCACGCCAGGAGTGTCGTGCACAGGGACCTCAAGCCTGAGAACATCCTGCTCAGCAGCACCCGGCTGCACGAAGCTAAGGTGAAGGTGGTGGACTTCGGGTTCGCGAGGCGCCTCCCCGACTGTGACGACCGGCAGAGGATGATGACGCCCTGCTTCAGCCTGCCGTACGCGGCGCCAGAGGTCGTGTCGTGCGCGAGGGGCGCGGCCGCCGGCTACGGGCCGGGGTGCGACCTGTGGAGCTTGGGAGTTATATTTTACTGCCTGGTGTCTGGGCGGGCGCCCTTCTCTCCGGGGGGCCGGGAGCCGGTCGCCGCGCTCGTACAGAGGATCAGGGCGGGGACCTTCACTATGGACGGTCCTGTTTGGGACAACATATCCAATGACAGTAAACGTCTGATCGCCGGCCTCCTGGCCGTGGAACCGGCGGACAGGCTGACCATCACGCAGGTGTTGCAGGAGCTGGGAGTTAACTGTGACGACGGGAGCGGGTTCAAATTACAGGACATGACCAAAGCCGATCTCTACAAACGTCGCAGCAAGAACAAGCAGCGGGGCTACAGTGACGGCGACCAGGGAGCGACGGATGCCGACAACGACCACGACACCTCCATCACGGACACGCTCGACACGCTGCACCGCATCAACAAGAACTCCATAGAACACGACGTGGCGCTCATCAAAGCTAACACCGCGCACACGCCCGACGCCGGGGACCACCATCTCACGGAGGACAACTACGAAGTCTCTCCGCTCAAACCCGACATGACCAAAGCCGATCTCTACAAGCGTCGCAGCAAGAACAAGCAGCGGGGCTACAGTGACGGCGACCAGGGAGCGACGGATGCCGACAACGACCACGACACCTCCATCACGGACACGCTCGACACGCTGCACCGCATCAACAAGAACTCCATAGAACACGACGTGGCGCTCATCAAAGCTAACACCGCGCACACGCCCGACGCCGGGGACCACCATCTCACGGAGGACAACTACGAAGTCTCTCCGCTCAAACCCGTGGAGAAGACCTACTCCAAGTCTAGATCCAAACTAGACGAATATATTTATATAGAGAGCAGCCAGGGACTCGAGGACACGGAAGTAGCGTTCCCGAAAACCACGCGCAAGAAGGAGTCTGCATCGCCCCTACCAGCGAAGAGAAGAAAAATAGACACCAGGTCCGCCAAGAAGACAGACTCGACCGCCGAGACACAGAAGAGAGGCAGAGGGAGGCCCAAGAAGAACGTAGAGGAAGTTAAAAACACGGAGAAGAAAACTAGAAATACCAAAGAGTCCATAGAAAACGACAAAACTACACTCACGAGAGTCACGCGGAAGAGAAAGTACGAGGAGATCGCGAAACCGGTGTTAAGGGAGAAGGGGCAGAACGGGAGACAGTCTAAGAACAGTGACGGGAAGGTGGAGAACAGAAAGATAGCGAGGCCCAAGAGGAATGTAGAAGTAAGAGTAGAACTGGACAACGTGAGGATGACCAGGTCCAGGAGGAGGAGGCTGGAGGTGAGTCTGTCGCCCTCCGAGGTCAAGACTGTCATACCCGCCTTCTCCTTCGAGTCGGACAGGAGAGTCAACTCCGTAGAGAGCAACAGGACAGCCGGCGCTAAGAACAAGAAAGCCAAAGGCAAAGCGAAAAGACAAGCCAAGCCCAAACGATCCACACGAGCCCGCGCCGCCAGGAGGTGA

Protein sequence:

>DPOGS205511-PA
MKVLKKASIVQKLKTAEHTRTERQVLEAVRACPFLVTLHYAFQTDAKLHLILDYVAGGELFTHLYQREHFHENEVRIYIAEIILALEQLHKLGIIYRDIKLENILLDAEGHIVLTDFGLSKEFCGGESRAYSFCGTIEYMAPEVVRSGSQGHDIAVDWWSVGVLTYELLTGASPFTVEGEKNTQQEITKRIVRCSYPVPNDVSPAVQDFIKKLLVKDPRRRLGGGDDDAEELKRHPFFQDLDWEAVSRREVAAPFVPQLSHAADTCNFADEFTRMPPTDSPAQAPKHHDKLFLGYSYVAPSILFSENIISDQIWLQATGQKHEKLKGWIAKDSPFFQKYSVDLSTPLLGDGSYAVCRKCIHRQTGKEYAVKIISSQKKDVKQEIDLLKTCQGCPYIIQLHEVFHDTAFTYIVTELAMGGELSSVLGAVSERVARRLIVQLSLAVRHMHARSVVHRDLKPENILLSSTRLHEAKVKVVDFGFARRLPDCDDRQRMMTPCFSLPYAAPEVVSCARGAAAGYGPGCDLWSLGVIFYCLVSGRAPFSPGGREPVAALVQRIRAGTFTMDGPVWDNISNDSKRLIAGLLAVEPADRLTITQVLQELGVNCDDGSGFKLQDMTKADLYKRRSKNKQRGYSDGDQGATDADNDHDTSITDTLDTLHRINKNSIEHDVALIKANTAHTPDAGDHHLTEDNYEVSPLKPDMTKADLYKRRSKNKQRGYSDGDQGATDADNDHDTSITDTLDTLHRINKNSIEHDVALIKANTAHTPDAGDHHLTEDNYEVSPLKPVEKTYSKSRSKLDEYIYIESSQGLEDTEVAFPKTTRKKESASPLPAKRRKIDTRSAKKTDSTAETQKRGRGRPKKNVEEVKNTEKKTRNTKESIENDKTTLTRVTRKRKYEEIAKPVLREKGQNGRQSKNSDGKVENRKIARPKRNVEVRVELDNVRMTRSRRRRLEVSLSPSEVKTVIPAFSFESDRRVNSVESNRTAGAKNKKAKGKAKRQAKPKRSTRARAARR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: