MonarchBase - Protein-coding gene

DPOGS216187
Transcript	DPOGS216187-TA	3369 bp
Protein	DPOGS216187-PA	1122 aa
Genomic position	DPSCF300080 - 445997-457877
RNAseq coverage	154x (Rank: top 53%)

Annotation
*Heliconius*	HMEL005842	0.0	79.46%
*Bombyx*	BGIBMGA004537-TA	0.0	69.16%
*Drosophila*	Ptp99A-PF	3e-61	53.21%
EBI UniRef50	UniRef50_E2A427	5e-63	53.07%	Tyrosine-protein phosphatase 99A n=7 Tax=Formicidae RepID=E2A427_CAMFO
NCBI RefSeq	XP_001121162.1	3e-65	54.39%	PREDICTED: similar to Protein tyrosine phosphatase 99A CG2005-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|321472438	2e-64	55.56%	hypothetical protein DAPPUDRAFT_48090 [Daphnia pulex]
NCBI nr blastx	gi\|321472438	5e-62	55.56%	hypothetical protein DAPPUDRAFT_48090 [Daphnia pulex]

Group
Gene Ontology	GO:0006470	8.2e-63	protein dephosphorylation
	GO:0004725	8.2e-63	protein tyrosine phosphatase activity
KEGG pathway
InterPro domain	[215-458] IPR000242	8.2e-63	Protein-tyrosine phosphatase, receptor/non-receptor type
	[359-455] IPR003595	1.5e-32	Protein-tyrosine phosphatase, catalytic
	[49-156] IPR008957	1e-08	Fibronectin type III domain
	[42-140] IPR013783	9.8e-06	Immunoglobulin-like fold
Orthology group	MCL25031		Lepidoptera specific

Nucleotide sequence:

>DPOGS216187-TA
ATGCTCTCTACTCAGCATCAACATTCTAACGAACCATTCACACCGTATAAGATATGGGTGCGTGCGTTTTATAACATACCCTTAGCCGGTGTGATGTCGTCCGACCTCCTGGCCCGCCTGGGACCCCAGTCCGAGTCCCTCTACGTGTTGACGGACGTTAGACCTCCATCAGCACCTGTTATACTCAACCTGACCTGCGACCAACAGAATGGTATTCTCTACCTGCAATGGCGTCAACCTCTCGAGTACAACAACTCATTAGACCAGTACGTGGTGACGCTGAGGAAGATACCGGAACAGCAGCCGAGGACCAGACTCACGCTGTTCACCAAGAAGGAGGACATCGAGACTATGATCAGTGTTAAAGTGGATTTATCAAACTCTACAATGTACGAGGTGAAGATTTACGCCGTGACCTTATCAGTTGCGACGCCGAAAACACTTATCAATGGATCGGAATCACCTCCGAAGGATGTGTCGAGTGAGTCGTGCGCGGTGGTAGCGGCACGAGCGGGGATCGCGGATATGGAGGGCGAAGCGCCGGGTGCTCCGGCAGCACTGTTGGCTGCCGCCCTACTAGCCGCCCTAGCAGCCGGTGGAGCCGCCCTAGTTTACTGGAGATGTAGATCTCGTGTGAGCAAATGTATCAGCGCCGCTTACAATTACTTGGAAGAGGGCGGTGAGAGAGCGGCCAGGGCTCCACTAAATATAAACAAGAAACCTCATGGCGTCCCCCGTCAGATCAAGCTGGAGTGGGTAGTGTGGCGGCGGAGGTACATCGCCACTCAAGGCCCCACGCCAGCCACACTAGACGCCTTCTGGCGGATGATCTGGCAGCACAGGGTCTGCACCTTGGTCATGATCACCAACCTCGTGGAGCGGGGCAGGCGTAAGTGCGACATGTACTGGCCGGCGGGCGGGCGCGGCAGTTCCGCGGAGTTCGGCGGGATACACGTGACGCTGCTGTATGAGGACGTGAGGGCCGCTTACACCGTCAGACATCTCAGGGTCAAGAGTACAGTCGCGGGTAGCGAATCGTCGAGCGAGTCGAGTACAGCGAGTGGCGAGGGTCGCCACGTGGTCCAGTACCACTACACCGTGTGGCCCGACCACGGCACGCCACGGCATCCGTTAGCTGTGTTGCCGTTCGTACGGGCCGCTGCAGATCCGGCAACCGTGCTCGTTCATTGCAGTGCGGGCGTTGGAAGAACGGGTACATACATAGTGATAGACGCACAACTGAATCAATTAAAACTCACGGGAACCCTGTCGCCTTTAGGGTTCCTCTGTCGCGCGCGAACGCAAAGGAACCATTTAGTGCAGACCGAGGAACAGTATGTATTCGTACATGACGCTCTGTTAGAGTACGTGCGTTCGGGTAACACAGAAGTGGAGTTCACAAAAGCTAGGGAATATCTGGCGAAGCTTCTAGAACCGATATCAGAGGAGGAGCTAGCGGTTATGGACCTTAATCCTATAAAGCATAAGAGCGTTAACGAAATGAACGGCGAGAACGACATGTCGAGTGTCAAATCTATAGAATGTAGCGATAATATAGTAGAAAATGGAAGCAGTCAAGTGTCGATAAAAACTGACGAATTGAACAGCGAAAGTAAATCATCTGTGGACAACCAAGAGAAGGATGGATTGGTCAACGGCGATGACTCGGAGGGAGTTTATGATCTGGCGCCGAGGTCCACAGATACTTATAATAAGAAAATGGCGGCCTATAACAGCATGAATGAACAAGAGAAAGAGGAAATGCGCAGAGTAAACCGAGCCGAAAACTACGCGCTGTTGGAACGGATGCGCTCTTTATCGAACAGGCACCAACTGTACCAAGGACCTCCTCCTGTTAACTTGTTAGAGAAACAGAATCAGTTGATAACACGTTCGTGTGTGGAGGCGAGTGTGTGTGCTCGAGCTCCTCACAACGCTGATAAGAACAGACCGGGTGGCATCCTACCCTCAGACTCCGCCAGGGTCATGTTGGTACCGAAACCCGGTGTTGAAGGAAGTGAATATATAAATGCTTCGTGGGTTTGTGGCGTGCGTCGTGTGAGAGAGTACGCCGTGTGTCAACACACAGAGGCACCTGACCCGTGGCGGCTGTTGTGGGATCACACCGCACAACTAGTGTTGTTACTACACGATGATGAACATCCGGAGTGCGATGTGTTTTGGCCGACAGAAGATGAGAAGGAACTGTTCGTGGCTAATTTCCGTGCGAGTTTTGTGTCTAAGGAAGTATATGTGGCGCACAGGAGATCGGATAGGACGAGTCGAACAGACACACCCAGCGAGCCCGAGACCAACGGGTACAGAAGGCAGGAGGGCAGCGACTGTGCTGACGACGAACGACTCATACCTGATAATAATTCACCAGTTAATAATACGGAACCATCCTACAGGTTCGACAGGACGGAACTCCGATTGGAGCGTCTCAGTAACAGAGATCTGTCCGCCCGGAAATCCATAGCGAACGGAGATTTATTCTCGTCATTATCAGAGAAGAAGAACGGTCCAAAATCACCGAGAAGTCCATCGAAGATGTCGTTGAAGAACTTTAAGCTGAGCTCTCCCACCAAGTTCAAATTCCCCGAGTGGGGTTCTAGAGCGGCTGGTTCACCGCCAGATACTGCACCACCACCGCCACCTATCACACCATCGCTCACCGTAGAAGAGGAAGCTGAACTACGAAGACCCGTGTACACATTCGAAAAAGTAAAACACCTCCCAAACGTACCATCAGACAGGGTTATAGAAGTGACGAACGTGAGCGTGCATTCATTGCAGGACGATTACCAGTTAAGTGTTAAGTTCATAAAGTGCAGTGGCTGGTTGAAAGGTGCTACCACCAAATACAGCGCGGGTCGGCCGGATGATAATGAATACGTTCGTGCTGTGAGGCATTCCAGCGGGAGCGAACGGGAAGCGGCCATCGATAGGCTCATAGCGCCCTACCAGGATTCGTTCGCGTTGATAGAGTTCGTCGCTGGATGTCAGATGGAATACAAGAATGGACCGGTTGTTGTTGTTGACAAATACGGCGGCTGGCGAGCGTTAACTTTTTGTTCGCTAAGCGCTGCGTGTGGTGGAGTAAGGAATCCAGATATCAAGGAACCTGGCAGTGAGTGGGCTTCACCCTGTGTGGCCGCTGATTTATACTGCAGTAGTGCTCTGAACGCTCACGCCCGCTGCCAGGCCTCACCAAATTCCCCGGCCTCACAGACTTCTCAGACTTCTCAGGCCTCACAGAGCTCTCAGACATCTCAGGAACGTCCCGTGACCCACTCGCCGGAGGCTCTGCTGGCGGCGTACTGCGCCCTCACCGCGTACGCAACTAAACTACCGAGGCCCGATAGCTGA

Protein sequence:

>DPOGS216187-PA
MLSTQHQHSNEPFTPYKIWVRAFYNIPLAGVMSSDLLARLGPQSESLYVLTDVRPPSAPVILNLTCDQQNGILYLQWRQPLEYNNSLDQYVVTLRKIPEQQPRTRLTLFTKKEDIETMISVKVDLSNSTMYEVKIYAVTLSVATPKTLINGSESPPKDVSSESCAVVAARAGIADMEGEAPGAPAALLAAALLAALAAGGAALVYWRCRSRVSKCISAAYNYLEEGGERAARAPLNINKKPHGVPRQIKLEWVVWRRRYIATQGPTPATLDAFWRMIWQHRVCTLVMITNLVERGRRKCDMYWPAGGRGSSAEFGGIHVTLLYEDVRAAYTVRHLRVKSTVAGSESSSESSTASGEGRHVVQYHYTVWPDHGTPRHPLAVLPFVRAAADPATVLVHCSAGVGRTGTYIVIDAQLNQLKLTGTLSPLGFLCRARTQRNHLVQTEEQYVFVHDALLEYVRSGNTEVEFTKAREYLAKLLEPISEEELAVMDLNPIKHKSVNEMNGENDMSSVKSIECSDNIVENGSSQVSIKTDELNSESKSSVDNQEKDGLVNGDDSEGVYDLAPRSTDTYNKKMAAYNSMNEQEKEEMRRVNRAENYALLERMRSLSNRHQLYQGPPPVNLLEKQNQLITRSCVEASVCARAPHNADKNRPGGILPSDSARVMLVPKPGVEGSEYINASWVCGVRRVREYAVCQHTEAPDPWRLLWDHTAQLVLLLHDDEHPECDVFWPTEDEKELFVANFRASFVSKEVYVAHRRSDRTSRTDTPSEPETNGYRRQEGSDCADDERLIPDNNSPVNNTEPSYRFDRTELRLERLSNRDLSARKSIANGDLFSSLSEKKNGPKSPRSPSKMSLKNFKLSSPTKFKFPEWGSRAAGSPPDTAPPPPPITPSLTVEEEAELRRPVYTFEKVKHLPNVPSDRVIEVTNVSVHSLQDDYQLSVKFIKCSGWLKGATTKYSAGRPDDNEYVRAVRHSSGSEREAAIDRLIAPYQDSFALIEFVAGCQMEYKNGPVVVVDKYGGWRALTFCSLSAACGGVRNPDIKEPGSEWASPCVAADLYCSSALNAHARCQASPNSPASQTSQTSQASQSSQTSQERPVTHSPEALLAAYCALTAYATKLPRPDS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: