MonarchBase - Protein-coding gene

DPOGS203914
Transcript	DPOGS203914-TA	2493 bp
Protein	DPOGS203914-PA	830 aa
Genomic position	DPSCF300005 - 749336-779619
RNAseq coverage	10x (Rank: top 84%)

Annotation
*Heliconius*	HMEL008048	0.0	90.45%
*Bombyx*	BGIBMGA000491-TA	0.0	83.46%
*Drosophila*	Ddr-PA	3e-71	35.14%
EBI UniRef50	UniRef50_E9HQT9	3e-131	34.44%	Putative uncharacterized protein n=1 Tax=Daphnia pulex RepID=E9HQT9_DAPPU
NCBI RefSeq	XP_966707.2	5e-171	36.38%	PREDICTED: similar to Discoidin domain receptor CG33531-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189234894	1e-169	36.38%	PREDICTED: similar to Discoidin domain receptor CG33531-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189234894	6e-167	36.48%	PREDICTED: similar to Discoidin domain receptor CG33531-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0004713	4.2e-56	protein tyrosine kinase activity
	GO:0004672	1.2e-53	protein kinase activity
	GO:0006468	1.2e-53	protein phosphorylation
	GO:0016772	1.3e-46	transferase activity, transferring phosphorus-containing groups
	GO:0007155	1.7e-12	cell adhesion
	GO:0005524	2.3e-10	ATP binding
	GO:0004674	2.3e-10	protein serine/threonine kinase activity
KEGG pathway
InterPro domain	[544-817] IPR020635	4.2e-56	Tyrosine-protein kinase, catalytic domain
	[550-817] IPR001245	1.2e-53	Serine-threonine/tyrosine-protein kinase
	[506-817] IPR011009	1.3e-46	Protein kinase-like domain
	[1-152] IPR008979	1.6e-35	Galactose-binding domain-like
	[11-147] IPR000421	1.7e-12	Coagulation factor 5/8 type, C-terminal
	[544-825] IPR002290	2.3e-10	Serine/threonine-protein kinase domain
Orthology group	MCL26556		Lepidoptera specific

Nucleotide sequence:

>DPOGS203914-TA
ATGCAGAACGGCATGATATCAAATGAGTCCCTCGCCGCTAGTTCCAGTTATGACCAGAGCGTGTCTCCACTAAGTTCAAGAATTAGAACAGAGATACGAGGTGGAGCTTGGTGTCCTAATGGTTTGATATCCCCTCGAAGTCGTCAATACTTGGAAATAGATTTACACGATGAATACCTGATCACTGCAACGGAGTCACAGGGCAGGTTTGCCAACTCTGTTGGAGTAGAGTTTGTTGAGAGTTATTCGGTTGAGTACTGGCGGAACGTTTTGAGCCGTTGGGTCAAATACAAGGACTTCAACGGCAGCCGTCTAATTCCAGGCAATGTCAATACTTATACGCCGAGAAAGACCACATTAGAAGCCCCATTTGTTGCTTCAAAAGTGAGATTCTTTCCATACGCCGCACATCCTCGAACAGCTTGCATGCGTGTCGAAATCTACGGCTGCCGCTGGAAACAGGCCCTCGTCGCGTATTCAGCCCCTCAAGGAGGAGATATGCAAGCTATGACTGGTGGAGCACGTTTTGAAGATCTCTCATATGATGGTATCATGCGCAACGGCAATATGATAAATGGACTTGGTCAAATAACTGATTCCTTCATTGGTCCAAATGACTTCGAACTACCAGATCCCCTAGATACTCGGGGTACCCGTTGGGTCGGTTGGAATAAAACAATGTTAACCAATGATGAAATCAACATAACATTCAACTTTACCGACCCAAGACTTTTTCATTTCATGGACGTTCATACTAATAACATGTTTACAAAAGACGTGCAGTTGTTTAAAGAAGCTGAGGTGTACTTTTCTCTGGAAGGGGAACGTTGGCAAGAAGACTTTATTTCTTACGAGCCTAAACAAGACAGGGTCTCCGAACATGCTCGTACAATTCATATTGATCTAGAGAACAGGACAGCGAAACATATCAAGATGAAACTAAAGTTTCAACATGAATGGATCCTTATCAGCGAAGTCACTTTTAAATCTGTTCCAACAGTTATAAATTCATCGGCGGAATTTCTTGAGGAATATTATCGGAGCGACTCACCTCCATATTCAAGAAAGAAAAGAAATTCCTCTTTACGAGTTTCTGTGGGTCTTGCTTGCGGAGCCGTCGTTGGAGTCGGAGCATGTATTGCAGCCATAGCTGTGTTAATAACAAAGCGTACCAGAAGGAGGATACCGAATGTTTTGAAGAAGCCTTTTTGTCCTTCACTAAGAAATGCTAATGCTCGAAATAATCGCAGAGCCCCGAGGCTTGCTTTGGCGTTAGCAAATTGTCCACCAATTCACATGCTCCGGCCTGCTGTAGTTGACGAGGACTACAGGGAACCATACAATATATGGAGAGAAACACTTGGTCGACGAGATAAACAAGAGATTCATGATCAAAACGAATACAACGAAATTTGCGAGGATCCTGAGTTCCCCCGACCCTACATGATGAAAAGACCCGATCCGCATGAAAGTTTCTACGCCGCCACTGACATTATTCATCACACTTATCCCGACGAGCGAACTCTAAGACGCGAACGTCCTGCCCCAGGACTCTTCACGTCCATTAAACTACCTGAAGCCGAGCCCCCAAACGGAGTGGCGCCCCTGCTGGATTTCCCGCGGGGGCGCATGCGACCGGTTACTTTCCTAGGCGAGGGACAACATGGCACTCTCCAGATTTGCGAGACGGACGGCATCGAAGAATTGAACGACGAAGATACACCGATTGGCCATCGCCGCCGCCTTGTTGTCGTCAAGACGTTATGGCGCGGATGCCATAGCGATATCAAAGCGGCGTTTGCCCGCGAAGCTACATGGGGTGCGGGCCTGAAACATCCACAGCTCGCACGTGTGCTTGGATTGAGCCTTCTAGAACCCCCATGCGCGGCACTCGACCGCGGAGACGCTGTCCCTCTCCCGACGATACTGAAAATGGAACGGAGATTGAATTATTCGAGTTTGATTCACATATGCTGTCAAATAGCCAGCGGCATGAAGTATCTGGAATCGTTCGAGTTAGTACACCGGGATCTCGCGGCAAGAAACGTAACTGTGAGCGACGACCTCCATATTAAAATATCTGACTACGCTATGTTCTGCGAGGAATTTGTTGGTGACTACCATATTTTAGCTGACGGATCTCGCATCCCACTACGATGGATGGCCTGGGAAAGCTTATTATTGGGTGTCTTCTCACCAGCTAGCGATGTTTGGTCCTTTGGTGTAACCGTTTGGGAAGTGCTTACATACTGTTTGGTCAAGCCATTCGAGGAGATGAACGATGACCAGGTTGTAGCCAACGCTAACGAATGGCGTTCAGGCGGCCGTAATGCAAGAGTGCCGGCTGCTCCTCCACCACGCTGTCGCCGGGAACTGTACGATCTGATGCATGAGTGCTGGCGTCGAGAACCCATGCAACGCCCGCGCTTCCATGAACTCCACCGCTTTCTTGACCAGATGACCCACGGCTACAAACCACCTATTCGCCGCTGA

Protein sequence:

>DPOGS203914-PA
MQNGMISNESLAASSSYDQSVSPLSSRIRTEIRGGAWCPNGLISPRSRQYLEIDLHDEYLITATESQGRFANSVGVEFVESYSVEYWRNVLSRWVKYKDFNGSRLIPGNVNTYTPRKTTLEAPFVASKVRFFPYAAHPRTACMRVEIYGCRWKQALVAYSAPQGGDMQAMTGGARFEDLSYDGIMRNGNMINGLGQITDSFIGPNDFELPDPLDTRGTRWVGWNKTMLTNDEINITFNFTDPRLFHFMDVHTNNMFTKDVQLFKEAEVYFSLEGERWQEDFISYEPKQDRVSEHARTIHIDLENRTAKHIKMKLKFQHEWILISEVTFKSVPTVINSSAEFLEEYYRSDSPPYSRKKRNSSLRVSVGLACGAVVGVGACIAAIAVLITKRTRRRIPNVLKKPFCPSLRNANARNNRRAPRLALALANCPPIHMLRPAVVDEDYREPYNIWRETLGRRDKQEIHDQNEYNEICEDPEFPRPYMMKRPDPHESFYAATDIIHHTYPDERTLRRERPAPGLFTSIKLPEAEPPNGVAPLLDFPRGRMRPVTFLGEGQHGTLQICETDGIEELNDEDTPIGHRRRLVVVKTLWRGCHSDIKAAFAREATWGAGLKHPQLARVLGLSLLEPPCAALDRGDAVPLPTILKMERRLNYSSLIHICCQIASGMKYLESFELVHRDLAARNVTVSDDLHIKISDYAMFCEEFVGDYHILADGSRIPLRWMAWESLLLGVFSPASDVWSFGVTVWEVLTYCLVKPFEEMNDDQVVANANEWRSGGRNARVPAAPPPRCRRELYDLMHECWRREPMQRPRFHELHRFLDQMTHGYKPPIRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: