MonarchBase - Protein-coding gene

DPOGS210446
Transcript	DPOGS210446-TA	1944 bp
Protein	DPOGS210446-PA	647 aa
Genomic position	DPSCF300062 - 19244-32425
RNAseq coverage	284x (Rank: top 39%)

Annotation
*Heliconius*	HMEL006336	3e-71	33.73%
*Bombyx*	BGIBMGA001962-TA	0.0	94.02%
*Drosophila*	CG7180-PA	0.0	77.12%
EBI UniRef50	UniRef50_E0VQ18	0.0	83.25%	Receptor protein tyrosine phosphatase, putative n=16 Tax=Pancrustacea RepID=E0VQ18_PEDHC
NCBI RefSeq	XP_001606669.1	0.0	81.96%	PREDICTED: similar to ENSANGP00000011584 [Nasonia vitripennis]
NCBI nr blastp	gi\|118789389	0.0	82.50%	AGAP008077-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|383858696	0.0	84.64%	PREDICTED: receptor-type tyrosine-protein phosphatase T-like [Megachile rotundata]

Group
Gene Ontology	GO:0006470	1.6e-88	protein dephosphorylation
	GO:0004725	1.6e-88	protein tyrosine phosphatase activity
KEGG pathway
InterPro domain	[64-332] IPR000242	1.6e-88	Protein-tyrosine phosphatase, receptor/non-receptor type
	[223-329] IPR003595	4.1e-28	Protein-tyrosine phosphatase, catalytic
Orthology group	MCL14518		Insect specific

Nucleotide sequence:

>DPOGS210446-TA
ATGCCGGTAATTTGTAAGACGCTCGCTATCATTTTCTCATCTACGCCGTATTCCAGAACTCATCAATTCATCGTTAGGTTGACTAATAATGCTGACGAGAACGGATCAATATCGGAGACTATCCCTGACCGGCCTGTGGAGCTGAAAAACTTCCCCAAGCTCTGCGAACAGAGGAGGAAATTCCCTGTGCTATACAAACTTGAGTTTCAGACAGCCATAAAGGTGGAGACGCACGCATGCCGCCACGCCCAAAAAAAAACCAATTCCCACAAAAACCAGAACCAAAAAGTTACTCCCTACGATTACAATAGAGTGGTTCTACAGACAGTCGATAGAGAACCCGATTCGGATTACATAAACGCTTCCTACATAGATAGTATTTTAAAACCTAACGCATACATAGTGACTCAGGGGCCAACAGAGGAGACAGTGGTGTCATTCTGGCGAATGATCTGGCAGGAGAGAGCTGCTGCAATAGTCATGTTAACTAAGACATTCGATTTTATAAAAGTGATGTGCGTACAGTATTGGCCTCCCAGTAAGGACAAGGACGAAACTTACGGCGAGATAAGTGTAGGTATAGTTCAAGAGGAGGAACTAGCGAATTTCCACATACGCACTTTCCGATTGTACAAGATGGAGAAAGATGTAGTGGTAGAAGAAAGGTTCATTCTTCAATTCCATTACACGCAATGGCATTCCCATACATGCCCATTCAGCAATGCCTTGCTGGAGTTCAGACGTCGAGTGCGAGCGGTGGTTGGGAGAAGACTCGCTACTAATAACGTCACAGGACCTATGGTTGTCCACTGCAATGATGGAGGTGGACGATCTGGCGTGTACTTAGCTATTGACGCGAATTTAGAATTAGCTGAAGAAGAAGACTGCTTTGATGTTTTCGGATATTTGAAAAAATTGAGACAATCAAGAAAAGGCCTTATAGAGAATGAAGAGCAATACAAATTCGTGTATGACACGTTAGAGGAGCATGTAGTCTGTGGCGTATCTTGGTTTCCTGTCTCGGAACTGTCACAAAGACTGAAACAGAAGTCCCAAAGGGATCCCGTGACGAAGTTAAATGAATATCAAAAGGAATATCAGCAGATTTGCAAACAAACACCCAGATTTACCATCGGGGACTGTGCGGGGGGACACAGAGGGGATAACAGAGAAAAAAATAGAGATGTCCTCGTTGTGCCGCCGGACAATTTTCGTCCATATCTAACATCCTTTCAAGGGAATAGTTTCACTGATTACATTAACGCTGTATTCGTTGACGGTTACACAAAACCTCGTGAATACATTGTGACAGAGTGGCCCTTAATACGGACGCAAGGAGAATTTTGGTCTCTAGTGTATGATTATGAATGTGCCGCTGTTGTAGTACTTTGTGTTCCACCTAAAAACTCTCAACAATATCCACCATTTTGGCCTGAAGGACGCCACTCTAAGAAATACGGACCTGTCTTTACAATAGATCATGTTTCGCACAACCATTATACCAACATCAAGACGTGGATATTCAGAATTAACAAGAAAATCGTGTCTCTGACGGAATTGATGGCCGGATTGAAAGCTCCTCCGAAAACAGTACAACTGTTCCAATTGACGTGTTGGCCGATGGGCCATAAAGTGCCTTCGTCCACTAACTCACTAGTTGAACTTATGAATATGGTCGAGCGGTGGCGACAACGTACCGATTATGGGCCTGTTTGCGTTGTTTCACCGGATGGTCGTAGTCGTGCTGGGGTTTATTGCGCCGCTAACGCCTGCATAGAACAAGTTATTCAACATGGAGAAGTTGACGTATTTCAGGCTGTGAAAACAGTTCGACGACATCGACCTCAATTGGTAGAAAACATGACTGAATACAAATACTGCTACGACTTAGTTCTTCATTACGTACTACATTATTTAAATAAAGATATGAATGAGAAGAAGTGA

Protein sequence:

>DPOGS210446-PA
MPVICKTLAIIFSSTPYSRTHQFIVRLTNNADENGSISETIPDRPVELKNFPKLCEQRRKFPVLYKLEFQTAIKVETHACRHAQKKTNSHKNQNQKVTPYDYNRVVLQTVDREPDSDYINASYIDSILKPNAYIVTQGPTEETVVSFWRMIWQERAAAIVMLTKTFDFIKVMCVQYWPPSKDKDETYGEISVGIVQEEELANFHIRTFRLYKMEKDVVVEERFILQFHYTQWHSHTCPFSNALLEFRRRVRAVVGRRLATNNVTGPMVVHCNDGGGRSGVYLAIDANLELAEEEDCFDVFGYLKKLRQSRKGLIENEEQYKFVYDTLEEHVVCGVSWFPVSELSQRLKQKSQRDPVTKLNEYQKEYQQICKQTPRFTIGDCAGGHRGDNREKNRDVLVVPPDNFRPYLTSFQGNSFTDYINAVFVDGYTKPREYIVTEWPLIRTQGEFWSLVYDYECAAVVVLCVPPKNSQQYPPFWPEGRHSKKYGPVFTIDHVSHNHYTNIKTWIFRINKKIVSLTELMAGLKAPPKTVQLFQLTCWPMGHKVPSSTNSLVELMNMVERWRQRTDYGPVCVVSPDGRSRAGVYCAANACIEQVIQHGEVDVFQAVKTVRRHRPQLVENMTEYKYCYDLVLHYVLHYLNKDMNEKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: