MonarchBase - Protein-coding gene

DPOGS203506
Transcript	DPOGS203506-TA	3678 bp
Protein	DPOGS203506-PA	1225 aa
Genomic position	DPSCF300055 - 607273-611891
RNAseq coverage	64x (Rank: top 67%)

Annotation
*Heliconius*	HMEL006120	0.0	65.50%
*Bombyx*	BGIBMGA008562-TA	0.0	54.39%
*Drosophila*	CG15894-PB	8e-09	27.17%
EBI UniRef50	UniRef50_E2BY48	3e-29	40.33%	Putative uncharacterized protein n=3 Tax=Formicidae RepID=E2BY48_HARSA
NCBI RefSeq	XP_968049.2	2e-50	37.26%	PREDICTED: similar to rac serine/threonine kinase [Tribolium castaneum]
NCBI nr blastp	gi\|189236031	5e-49	37.26%	PREDICTED: similar to rac serine/threonine kinase [Tribolium castaneum]
NCBI nr blastx	gi\|194896240	4e-70	30.56%	GG19585 [Drosophila erecta]

Nucleotide sequence:

>DPOGS203506-TA
ATGGCAGCACTGGCGACGGAGCTCGGCGTGCCGTCGACGCGCTTGCGCGCTGCAGCGCTCGATGTCGCGTCTCAGAAGGGAACTGCGGGGTCAGGGGTCGAGGGGCGGCCGCCTGCCGACTGCCGAGCGAGTCGTCCTATCGGCGGTTGCGGCACGCACCGCACGGCGAGATTGCCAGCTGCCTGCCTCATAACCCTGGGAGCGTATGATTGTGTCATCCACTTTCCCTCATCCACCACCGTCCTGGTTAATGTATCTGACGTCAGGAATAAATGCTTAGCAGAAGACCTCAATCAAGGGATGAACAGAGGTGAACTTACATTAAGTACACCCGATGTGAGAGAGTGCAGGAAGCAGGCGGCAGGGGCAGAGGCAGGCGGGCGCATGGAGGCTCGCGAGCGCGAGCGCCGGGCGCGCCGCGGGCCCGCGCCCATCGCCTCCTTCGACCACGACGCCTCCGATGAATCGAGTCCAGAAAATAAACAAGCGATACGATTGCCTGAAATCCGCGAAGATCCTGCAAGTTCAAGTTGCAGCGTTGCACAGTCCACAAGCACAGGAGAAGGCCTGGCCCCACCGGAACAGCGCGCCCGCTCCCTGTCATCACCAGCCGTTCATACCGCGACCGTAGTCACACCCGTAGCCTTGCAAACACCATCTGCTCCACGCATCGATATTTCTCGTGCTTCCAGTTCCAGTCATCACGACTCTCGGGACAGCTCACCGGAGCTTGCATTGTTTGCCGGAGGTGGTAGCAGTGAGGAAACAAGAGAACGTCTGGAATTAGGTTTTCGTGAAGACGGCGCCCTGGACTTGCGGTCGTCTACAGAAGAACTGGCATTCCTGGAGGGTGCTCCGGAAGCTGCAGAAGTGCGTCCACCACCTGTGGCGCAACCATCGCGCAGGCACTCGCGTAAAGATAGTCAAAGTTCTGAGGCCGCGCTTCTTGCTGTGTCCGGTCGCACTAGTCGATTGTCCAGCGTAGGTTCTCAATGCTCTGCTCATTCTGCAATTTCGGCTTTTAGTCAAATAAGTCGCGTGTCACGACTTTCTGTTGTATCAGGGACATCTCGATCACCTTCTCCGCATAAAATGCTTCTGGAAACATCATTTTGTGGTCCCAAGCCCATAGAAACGGATCCCGAAATATGCGCTGCTGCAGTGGAGGAACGGCTATTAGAAATTGCTAAATTAACAAATGAAGCCGGAGCAGCCTCATCCTCTGATCCACAACCTTTGCCAATGCCAACTATTCCTATTGCTATAGATGCACGCGATCGAAGAGAAGTTCGTACGGAAGTTACATTAGAAAATACTAGACCAGCTAGTGCACCAAAACTTACTTCACCCAGTGCTCCACCCACTACACCAGTACCAGATCTCGCCGTTTCAACTAGTTCCTTAGATGATGACAAGCGTCTAAAAGAGACAAGAAATCGAGCTAAAGTAGAAGAACACCGGGCTAGGTCAAGAGACAGACATGAGACGAACAAGCCAGAAGTCTATCGAGCGGGAAACAGATCTAAGGATATCATTAGAATCAAACTTAAACCAGACAATGAATACGACGACGAAGAGGAGGGTGAGAGTGAAGCGACTTTAGTCAGCAGTGAACCAGCTAAAAAACCAATAACCCTTGAATTAAATGATCAGTGCTCTAAACCAACTAAACCTGTAAGTCCATTAGTAACAACTCGTCGCCAACGTGATAGTAGAACGCCATCTCCAAGTGGCGTTCCCGTTTCGAGAAAGTCGTCGTTTTGTTCGCTTTTTAAATCGCGCGAGACAATTGCTTCACCAGATTCCCCTTCAGACGTATTTCGTCGTAAAAAAAGTTTAAATGAAGGTCGATCAAGAAGTAAAAGCCGTGACCGTACGACTACACCAACTTCGGCTGGAAAAATAAAAGGGTCTGTTTTATCTTTATTTAAAACACCAAGGCGTAGCGGGGCATCACCATCTCCAAGTTCACGTGATGTGTCTCCAGTTGTTCAACAGCAGCGTCAATTTCCCCAAACCCCTCATGACAAACAACGTGGCGAAAAATTGAAATACTATGAAGATGCAAAGGATGGCATAATTCATATTCCCCTTCGCACACCCCCTGATGAAATTGAGCCCAAAAAAGGTAAAGAAGGTAGCGATGATAAAATAACGGAAAAGCCACGCCAAGTTATCCGCCCCGCTTCAGCGCCACAGCCACGAGCTCTCCCGGACCGCTCATTGGTCATGTCACCCGTGCCTTCACCCAAACCCACTCAAAGGACGGTTCTTCCAGATGGAAGCATTATAATTCCATTACATTCACCAACAGATAAAACTGCTAAAGTTATACTTCCGTTCGAAACACAAGTTAAATCCGAATCTGACATCAAATATCCCGAACAAATAGATCTGAATCATAAAGAACTTAACTTATATAATAATTTAAAACATAAAGAACTCGAATATGCAACTGAAAGAATCGATTCGATTCCTAACGAGCCCGACGGTTCACAGTTTATCTCTTCGCCACCGCCAGATATAGTTCCAGAAACTTACATCGGAGAGCGACCTAGACGTAAAGAACGAATAGTTTTCACGACACATGTGGGCAGTAAAGAACATGTATTTAGTACACAGTTTAGTATAACAAAAACACCAAGCGTAACCAGTGAAATATCAGAATCAATACAGAGTGTTCCTGAATTTGAAGAAGTCAAACAGAACGAAACTTCCCCTCAAGAAACAGATTGGAAAAGTAATGACGTAATAGATAACGACCAAAAGTATCATTCACAAAGAGAATCTTTTTGTGAAACAGGAGAAGAGAACGTGACCCGAGAATTGAGCAGAGAAGTGAGTAGAGAAGTGAGCAGAGAAGTGAGTAGAGAAGTGAGTCCTACCCCAGATACTGGGAGGGATTCTTCAGAATCCGAGACCAGTTTAGAAATAGCAGCTACACACGGTGGAAGCGAAGCGGAGAGACGAGGACTTGTAGTTCAGGAATCATTTGAAGAGTTACCGTACGTTCCTACTACGCTACCCCTAGAGCGTTCACTAGCGCTCCCTATGGTGCCGGTGCGAGAGCGAGGTGGAGTGCACGTGGCCGGAGTACAGCGGCCGCGCGCAACAAAGAGTGCGGGTCGCCAACCTGGAGCTCTGACATCTCCCGCGCCCCTGGTCGCGCCTGCTGCCGTATCCCCCGCCGCCGGAGACTCTCCCGCTGACCGTCTCTACATCAAACTTCCGCGGCGCGCACGCACGGTCTCCACAGCCTCCGCTGCTCCTCCACCGCCACCTCGCAACCTTCGCACTCGCTCCCGAAGCGGCGGCGATGCGAGCTCTATGGAAACGCGGAGCAAAACGGAGTGGATCGATTTCTCCGAGGTTCCTGAGCGTCGAAAGCAACCGAAGCGCATTCAGACACTGCCAGCGAGCGCTCGCGACACCGTGGTGTTTAGTTACGTGCCCCCCGAGCGCTGCCGCTGCGACTGTCACGCTCACGACACTGCTGACGATGAGTTGCCGCTTCTACAGGACGCCAGCCCAGCACGCGCTTCCAGTGCCGCCTCCCTGGATGACCACGACCGCCACGAGCCCTTCATCGCCGATCTCGACCTTCGTCATAGCACCTCGGACTCGGTACAGTACACTTATCATTTCAGAACCGACTCATTTCTCGTTTACCCCGAGTAG

Protein sequence:

>DPOGS203506-PA
MAALATELGVPSTRLRAAALDVASQKGTAGSGVEGRPPADCRASRPIGGCGTHRTARLPAACLITLGAYDCVIHFPSSTTVLVNVSDVRNKCLAEDLNQGMNRGELTLSTPDVRECRKQAAGAEAGGRMEARERERRARRGPAPIASFDHDASDESSPENKQAIRLPEIREDPASSSCSVAQSTSTGEGLAPPEQRARSLSSPAVHTATVVTPVALQTPSAPRIDISRASSSSHHDSRDSSPELALFAGGGSSEETRERLELGFREDGALDLRSSTEELAFLEGAPEAAEVRPPPVAQPSRRHSRKDSQSSEAALLAVSGRTSRLSSVGSQCSAHSAISAFSQISRVSRLSVVSGTSRSPSPHKMLLETSFCGPKPIETDPEICAAAVEERLLEIAKLTNEAGAASSSDPQPLPMPTIPIAIDARDRREVRTEVTLENTRPASAPKLTSPSAPPTTPVPDLAVSTSSLDDDKRLKETRNRAKVEEHRARSRDRHETNKPEVYRAGNRSKDIIRIKLKPDNEYDDEEEGESEATLVSSEPAKKPITLELNDQCSKPTKPVSPLVTTRRQRDSRTPSPSGVPVSRKSSFCSLFKSRETIASPDSPSDVFRRKKSLNEGRSRSKSRDRTTTPTSAGKIKGSVLSLFKTPRRSGASPSPSSRDVSPVVQQQRQFPQTPHDKQRGEKLKYYEDAKDGIIHIPLRTPPDEIEPKKGKEGSDDKITEKPRQVIRPASAPQPRALPDRSLVMSPVPSPKPTQRTVLPDGSIIIPLHSPTDKTAKVILPFETQVKSESDIKYPEQIDLNHKELNLYNNLKHKELEYATERIDSIPNEPDGSQFISSPPPDIVPETYIGERPRRKERIVFTTHVGSKEHVFSTQFSITKTPSVTSEISESIQSVPEFEEVKQNETSPQETDWKSNDVIDNDQKYHSQRESFCETGEENVTRELSREVSREVSREVSREVSPTPDTGRDSSESETSLEIAATHGGSEAERRGLVVQESFEELPYVPTTLPLERSLALPMVPVRERGGVHVAGVQRPRATKSAGRQPGALTSPAPLVAPAAVSPAAGDSPADRLYIKLPRRARTVSTASAAPPPPPRNLRTRSRSGGDASSMETRSKTEWIDFSEVPERRKQPKRIQTLPASARDTVVFSYVPPERCRCDCHAHDTADDELPLLQDASPARASSAASLDDHDRHEPFIADLDLRHSTSDSVQYTYHFRTDSFLVYPE-

Group
KEGG pathway	tca:656423	7e-50
	K04456 (AKT)	maps->	Prostate cancer
			Fc epsilon RI signaling pathway
			Toll-like receptor signaling pathway
			MAPK signaling pathway
			Fc gamma R-mediated phagocytosis
			Glioma
			B cell receptor signaling pathway
			Melanoma
			Pathways in cancer
			Chemokine signaling pathway
			Adipocytokine signaling pathway
			Endometrial cancer
			Chagas disease
			Insulin signaling pathway
			Neurotrophin signaling pathway
			T cell receptor signaling pathway
			Focal adhesion
			ErbB signaling pathway
			Colorectal cancer
			mTOR signaling pathway
			Tight junction
			Progesterone-mediated oocyte maturation
			Apoptosis
			Renal cell carcinoma
			Small cell lung cancer
			Pancreatic cancer
			Acute myeloid leukemia
			Non-small cell lung cancer
			Jak-STAT signaling pathway
			Chronic myeloid leukemia
			VEGF signaling pathway
Orthology group	MCL24794		Lepidoptera specific

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: