MonarchBase - Protein-coding gene

DPOGS206061
Transcript	DPOGS206061-TA	2958 bp
Protein	DPOGS206061-PA	985 aa
Genomic position	DPSCF300028 - 582123-596005
RNAseq coverage	525x (Rank: top 24%)

Annotation
*Heliconius*	HMEL014066	0.0	77.10%
*Bombyx*	BGIBMGA006843-TA	2e-180	58.90%
*Drosophila*	ssh-PB	1e-170	61.70%
EBI UniRef50	UniRef50_D6WZR9	0.0	57.81%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WZR9_TRICA
NCBI RefSeq	XP_974392.1	0.0	58.23%	PREDICTED: similar to slingshot dual specificity phosphatase [Tribolium castaneum]
NCBI nr blastp	gi\|91090936	0.0	58.23%	PREDICTED: similar to slingshot dual specificity phosphatase [Tribolium castaneum]
NCBI nr blastx	gi\|383854174	0.0	58.55%	PREDICTED: uncharacterized protein LOC100877919 [Megachile rotundata]

Group
Gene Ontology	GO:0008138	4.1e-45	protein tyrosine/serine/threonine phosphatase activity
	GO:0006470	4.1e-45	protein dephosphorylation
KEGG pathway	tca:663242	0.0
	K05766 (SSH)	maps->	Regulation of actin cytoskeleton
InterPro domain	[327-465] IPR020422	4.1e-45	Dual specificity phosphatase, subgroup, catalytic domain
	[335-463] IPR000340	7.3e-35	Dual specificity phosphatase, catalytic domain
	[270-322] IPR014876	1.1e-15	DEK, C-terminal
Orthology group	MCL16476		Insect specific

Nucleotide sequence:

>DPOGS206061-TA
ATGATAAGGTTAATAAATGTAATCCCATATTACTCCAGCTTTCCCAGTGAAATTAAGGTTTACAGTGTCTGTGGCTTCAGTCAAATCATCGAATATGCCCACATTATTTTCAGTTCTCTATATGTCTTGGATGAGGAAGAAAAGTCAGCTGAAGTCACAGAAGAGGATGTCGGGAATCGAACCAGTAAGAGTCTCAATGAGTGTTACTTCGCTAACAAAGGCGCGGCGTTGGTGCTCGGTAGTACGGAGCAGGGTTGCGCAGACCGGCGCGCGTCTCCCGCCCGTGTGCACCCGCAGCCCGACATACATCACCACCTACAGTCCATGTTTTATCTGGTGCGCCCGGAGGAGACGCTCAAAATGGCGGTGAAGCTGGAGAGCGCCCACGCTGGTCGTACTCGTTACCTGGTGGTGGTTTGTCGATGTGATGAGGCAGCGCTGCTTGGGATAGATTGTAACGAGCGCACCACCGTGGGACTGGTGCTGAGGGTACTGGCCGATACCTCCATCAAACTCGATGGTGATGGCGGTTTCAGCGTTTGTGTATGCAATCAACAGCACATATTCAAACCAGTGTCCGTTCAGGCCATGTGGTCAGCGTTACAAACGCTTCACCGTGCGAGCGCCCGGGCCCGGGAGTTGAACCATTTCGCTGGTGGTTCGTCCCACGGCTGGTGTTCCCACTACGAGAGGGCTGTGGACTCCGACCGCTCCTGCCTCAACGAGTGGCACGCCATGGACAGTATCGAGTCGAGGCGACCACCGTCACCTGACTCGCTCAGGCATAGGCCGCGAGAGCGTGATGAAACGGAACGAGTGATCAGATGCACCCTCAAGGAAATTATGATGAGTGTGGATCTTGACGAAGTTACAAGCAAAGCTATCAGAGGACGGCTCGAGGAAGAATTAGACATGGACCTTACGGAGTTCAAGTCGTTCATAGACCAAGAGATGCTTACGATACTAGGACAAATGGACGCGCCGACGGAAATATTCGACCACGTGTACCTGGGTTCCGAGTGGAACGCCAGCAATTTGGAGGAATTGCAAAGAAACGGAGTTCGCCATATACTCAACGTGACAAGAGAAATAGATAATTTTTTTCCGGGTATGTTTGATTACCTAAATATTAGAGTTTATGACGACGAAAAGACTGATCTACTAAAACATTGGGATAACACATTTAAGTACATAAACAAAGCTAGAAATGAAGGTTCTAAGGTTCTCGTGCATTGCAAGATGGGAATAAGTAGGTCGGCTTCAGTCGTTATCGCTTACGCCATGAAGGCTTTCAACTGGAATTTCGATAAGGCTTTGAAGCACGTGAAGACTAAGAGGAGTTGTATCAAACCGAACATAAATTTCCTCAGTCAGCTGGAGACCTACCAGGGCATACTGGACGCCATGAAGAACAAGGAGAAGTTACAGCGTTCTAAATCTGAAACTAACTTAAAAGCTCCGATTTCATCATCAAAGAGTGAAAACAAAAATATGGAGCCGACGCCGTTGGTGCTGGCACTGACGGGGTCGTACTCGGGCCGGCCGCGGTCCTGGTCTCCCGACACTAAGCTGGCTGCCGAGTTACTGCCGCCTACTTCCGTGTCGCTGGAGAATCTCGCCTCCGAGACTAGACACATGCTCATGCCGTGCGCCAGCGGCTCCTACAGCGTCTCGCCAAACCAGATAATACGGCTCAAGGAGGAAGGCGCACCTTCAGTCAAACACATCGTTAACGAAATCGAGAGTGCCGCCTCGAGCGACAGAAAAGATATCCCCAAAAGAAACCACAGGTTGAATTTCGGAAATTCCGGGGACGTGATTTCTGGTCGATCATCAGAGAGCTCCGGTCCTGTGGAATCTAGTGGCAAAAATCAATCATCTCCAATACAGAATACAGTGAACCAGCCCGACCTAGACGTGGAGAAAATTCACACCTGGGATCCGGGGGAGACCGCTTGGTCGCGTTGCGAGGAGGTCCGGACAGTCTCGGACAGTGATTATATAGTTAAGAGTGACAGTGGTATCATAGACAAAATTAAATTGAGTGACATTATATACAATTCGTTAGAACGCAACGTAGAGTTGGAGGAGAGGAGGGGCGGCGAGGAGGACGCGCCGCCACCCAGCAGGCAGAGTTCGTGGAGCTCGTTCGACAGCGCAGTGGTCGCTGACCTGTCTCGACATTCGTCGTGGGGGTCATACGATACACGCGGAGCGAGACCACCGGTGGGCCCGCGAGAGGTCCGAGAGGAGCCTGCGCCTCCCGCGGACCTGGCAGTCATAAGGGAGCATACCGAGCGCACCCGCCCTCTTTCGAACATAGCCGCCAACGAGAGGAAGTTCTACGAGACCTGTGCCATACTGAAGGAGCTGGCGGCCGCGCGCTCTGGCGCCTGCACCTGGGGCGGCCGGCTGTCCGCCTCCGCGCCCGCCGACACGTGGCTGCGCGCCGGTCCGCGCCGCCGTCGCCTAGCTGCGTCTTCGCACGGAGACCTGCCACGAGCCGCGCCCGCCGGTCCGCCTCCGCCGCCAGCGCTGGGCCTCGTCAGCAACCTCAAAAAGGAGTTCGAGGCTCGTTCCGAGTCGGAGGTCCCCCGGCGTTCGGGGTCTCGCACGAGACAACCGCAAATTGAGGATTTGTCGGTGCGCGTGCTCGTGGACCGCTACGACCAACCCGGCCGGACGCGTTCCGAATCCGCGGCGGAACCGATTCGAGTGAAAGCGCCTCAAGAGTCTGTGTCCAAGAAGTGCAAGTTGGCGTCTGAGGTCGACAGCCGGGCTCGTATGCGCAACTCGTACTGCGCGGGTCTGGCGGGCGGCGCCGGGGGCGAGAGGCCGCCCGTGGTGCCGACCGTGGTCGCGCTCGCTCCCCTCGACTACTCTAATGTAGTGGTATCAACTGTGATGTCGAAAGCTCAAAATAAAAACAATTACAGCATGGGAAAACCCATCCGTTGA

Protein sequence:

>DPOGS206061-PA
MIRLINVIPYYSSFPSEIKVYSVCGFSQIIEYAHIIFSSLYVLDEEEKSAEVTEEDVGNRTSKSLNECYFANKGAALVLGSTEQGCADRRASPARVHPQPDIHHHLQSMFYLVRPEETLKMAVKLESAHAGRTRYLVVVCRCDEAALLGIDCNERTTVGLVLRVLADTSIKLDGDGGFSVCVCNQQHIFKPVSVQAMWSALQTLHRASARARELNHFAGGSSHGWCSHYERAVDSDRSCLNEWHAMDSIESRRPPSPDSLRHRPRERDETERVIRCTLKEIMMSVDLDEVTSKAIRGRLEEELDMDLTEFKSFIDQEMLTILGQMDAPTEIFDHVYLGSEWNASNLEELQRNGVRHILNVTREIDNFFPGMFDYLNIRVYDDEKTDLLKHWDNTFKYINKARNEGSKVLVHCKMGISRSASVVIAYAMKAFNWNFDKALKHVKTKRSCIKPNINFLSQLETYQGILDAMKNKEKLQRSKSETNLKAPISSSKSENKNMEPTPLVLALTGSYSGRPRSWSPDTKLAAELLPPTSVSLENLASETRHMLMPCASGSYSVSPNQIIRLKEEGAPSVKHIVNEIESAASSDRKDIPKRNHRLNFGNSGDVISGRSSESSGPVESSGKNQSSPIQNTVNQPDLDVEKIHTWDPGETAWSRCEEVRTVSDSDYIVKSDSGIIDKIKLSDIIYNSLERNVELEERRGGEEDAPPPSRQSSWSSFDSAVVADLSRHSSWGSYDTRGARPPVGPREVREEPAPPADLAVIREHTERTRPLSNIAANERKFYETCAILKELAAARSGACTWGGRLSASAPADTWLRAGPRRRRLAASSHGDLPRAAPAGPPPPPALGLVSNLKKEFEARSESEVPRRSGSRTRQPQIEDLSVRVLVDRYDQPGRTRSESAAEPIRVKAPQESVSKKCKLASEVDSRARMRNSYCAGLAGGAGGERPPVVPTVVALAPLDYSNVVVSTVMSKAQNKNNYSMGKPIR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: