MonarchBase - Protein-coding gene

DPOGS203439
Transcript	DPOGS203439-TA	5055 bp
Protein	DPOGS203439-PA	1684 aa
Genomic position	DPSCF300242 - 156990-164255
RNAseq coverage	492x (Rank: top 25%)

Annotation
*Heliconius*	HMEL015030	0.0	72.92%
*Bombyx*	BGIBMGA011162-TA	0.0	70.88%
*Drosophila*	PTP-ER-PA	3e-83	32.37%
EBI UniRef50	UniRef50_Q16Q35	2e-100	39.85%	Putative uncharacterized protein n=1 Tax=Aedes aegypti RepID=Q16Q35_AEDAE
NCBI RefSeq	XP_001661653.1	4e-101	39.85%	hypothetical protein AaeL_AAEL011434 [Aedes aegypti]
NCBI nr blastp	gi\|157129359	8e-100	39.85%	hypothetical protein AaeL_AAEL011434 [Aedes aegypti]
NCBI nr blastx	gi\|157129359	1e-126	31.66%	hypothetical protein AaeL_AAEL011434 [Aedes aegypti]

Group
Gene Ontology	GO:0006470	2.6e-79	protein dephosphorylation
	GO:0004725	2.6e-79	protein tyrosine phosphatase activity
KEGG pathway
InterPro domain	[1334-1678] IPR000242	2.6e-79	Protein-tyrosine phosphatase, receptor/non-receptor type
	[1522-1675] IPR003595	7.2e-28	Protein-tyrosine phosphatase, catalytic
Orthology group	MCL18369		Insect specific

Nucleotide sequence:

>DPOGS203439-TA
ATGTATGTCTCTATAGCCAAGAATCTCTGTTACTTTCTGTTCACTACCGTCAATTCACATGAAGTCATTCTGATCCTCATCACAGCTGAACAGAGGACTTCACCGACAACCTGTCGCTGCAAACCAAAAATTAAGTATCACTCCAATTACTGTTATTCAGTGACTCTATACAGTTTCAATGCTTGGCAGTTCTCCAGATGTGAAGGTGTCGGTATGTGGGGCGCGTGGGGCGCGCAGGCGGGCTGGTGGTGCGGCGCGCTGGCGGCCGCGCTGCTGGCGCTGCTCGCGTTGTGTCGCCGCGCCCAGAAGAGGACACCGCCGCGACCGCCTGGCACCGTCACACAGGTGCAGATCGTGTATGGCGGTCCGGCGCGTGTAGTCGTGGCTGGTCCGCCGCCGGGCGCGTCTTGTGCTACAGCGTCCCTGTCGGCTGCGCCGCCCCCCGACCCTCCGACCCCCGCCGACCCCCCGCAACCCGCTCTCCCACAAATCCTCGTCGTCCAGGACAGCACTCAAAATACTGTCCCCCAACAGAGTGATCCTCAACCCTCGAGCTCCCAAGGCCCCAGACCTCTGGAGTACCACGGTATCCCCAAATTGCCACTTCCTGAGCAGTGGCTCCATAAACGACCTTTCGATTACAAGTACTCTGCTATACCCCGACCTCTAGCTCAAATCGTCAGCTCGGATCTATCAGTAGATCTGCAGAGAGAGTCGCGGGCTAAGAAATTTAGTGCTACGAGGTCGCCATCGTTGGAAAAAGACGAGAAGTCCCCCTTCGTTAGCAGTGCTAAGTCTGAAGATATGGAAGTGTTCGGTTTCGATGCTGAATCCGTGAGAAAATTAAGTGAAGATAGAGAAAAACCCGTGGAAATGGCGGAACCTCCGCCACAATCTCCACAAGAGAGCGATAAAGAAATGTCGCCCATTAACCTCAGGAGGTTCCGGTCAGTGAGCACTCGCCTTAATCTGTGCAGTGTCAGCGAAAGCCCCCATCCCGAAGGTCATCAAGAAAGGTTGGAAATGCAGAACTCCCCTCGCGTCATTGAATGCAGTTCCGCCAAAGAGAAGTCATCGGGTACTAAATTCGACTTCTCTCCAAAAATCCTAGCTGATAGCATGTGCTCCCCGCGTTTCTTCACTCCTCCCGAGATGGTTTCACCGATGTTCTTCGCGGAACCTTCACCAAAATCGGTTTATTACGATAGCGTGCGATCTCCGAAGTTTTTTCCTGAAACTCCACGAGACGTTGAGGTGCCGCAATCGCCGCGTCTTTTGGGAGACCATCGAAACAAAACGAACGGCTTAACCGAGAAACCGACCTCTCCGAAGGTTTTAAGTGCTCGACCCAGTCCTAAGGTTCATAGTCACAATAAAGAGAATTACTTCACCTTCGAACAAGCGAGTGCCACAGAAGAGAGTGCAGCGAGGATGTCGCCCAGACCGAGGAGGTACGGAGGAAGAAATTCCATAGAAAGAGAAAGGTTCACGCCCCCCGCTGATAAAGAAGTTAAGAAATACAGGCGACACAACAGTTGCGACACGAGTTACAAAAGTGTAGAGTTAAATATATCCAAGTGTGATAATATCTTAGAGACTGATGCCACCACCGTGGATGTGATAGAGAAAGACGTAGTGGACTGCTGTGCCAAAGTAGATTCCTTGCATGTCGATGCGAAACTTGAAAGTGATAAACACGAATTGAAGCCAATATCGAATACGGCGCAGGCGAGACGACAACGATTAAAATCGATATCACTCGACTCCGATAATGCCAAAATAATCGAACAGAATTTAGGTTTACCGATAGCGAAACAAATGAAAGACCAAATGAATGAGGCGTATAAGAATCAAGAAGTGAGTACATCGTGCGAGAGTATGGAGAGATACCCAAAAACACCGACAGCTGAACGACATATATTCAAATTTGATGCAGAGCATAACGAAAAACCTGAGCCAGAGGCTAAACCGGAAGTAAAACAGAAAAAGTGCCTTCGTCAAAGTTCTGACACGCAGTCTTTTCTCGATATGCCCAGGTTTTCTCCTAAAGAATTTGAAATAACGGTTACATCAGAGGAAGGCGACACTACAGCCGCTGAAACACAGACCAAAAGGAAAGGCAAGAATTTGAGAAACTTAACAATAGATTTGTCTAAACGAGACAGTGATTTAGAAAAAGAATTGCTCGAATTCGAAAAATTGTATACGGACGCCGAAGAAAAGAAAGTTAAAACGCCAACACTGAAAGTTAAGGCTACTTCATTAGACTCATCAGAGAGTGTAAACCTCTCATTGCCGCCCAAGAAGTCTCTGGAAGTTCCGCAGAACTCCATATCAGTTCCAAACACGCCGAAGCGTCAGTTGAAGAGAATTTTGGCTCAGAAAAGCGGAAAACATGACTTTGTTGTTGGGAAACTGGGTTATAATACCATTCAGAGTGGCGCAGACCAAAGACGGTTATACATGAAGGGACAGGATAGTGGGATATTTTTACGGGAAAACCACGCAAGTCTCATGCTGTACCAACCAGGAACATCTCGTATTGGTTCGAGGACAATGGGTTCATTCGACGAAAATATGGCGGATAATGCACCAGAAATAAATATCGTTGAAAGTAGACCTTTTCACATAGATCCAGCTCAAACACTTGGTTCCAATCTGCTTAACTACAAACAGAATCTAAGCGTATCCAGCACAAACTTGAAGACTCTTCCTGAAGGAGTTCCGTCTGATGATTTCGAACCTAGCGCAGAAGACGAGAAAGTTGTGAAAAAACTACATCGACGGAATTCCAATCAGAGTTTAATGCTAAGTACACATAGCTTACAAGAGTCCAATTGTTCGCTCAGCAGCGCTGGTACCTCCTGCCACAACCTCAATACAGTCAGAACTAGCATATCGAATTTCAGTCTGAATGACCACAGGCAGAAGAAACTGTCTCTGGAAAGGAGGGATTCAAACGTCAGTATAAACCCCATGGATCATATTACACCCACAACACGGGTCATATGTTCCTCGAACACGAATTTAACCGGAGACGTGTCAAAGAACTGCTTACTGCAGCGGCGCGGATCGAATAACAGCTTAACGTTAAACATACATTCTTCAAATAATTTAAGTCGGCATTCTAGTAACAGTTCCTTAAACAAAGATGCTAAAATCGGCCATAAAAAGGGTCTGTTGGAGCGTAGGAGCTCAAACACATCTCTCACCCTGAACATAAACTCTTCAAATCCTCAGCTGTCTACTAATAGAGGATTGAGTATATCAAACTACAACCTGAACGGATCGACCTGCAACCTAAGTAGATACAACAGTAACCACAGCATAGACAACGCGGAACCTCGGAAAGGTATCTTGGAAAGGCGTAGTTCGAACACGTCTCTCACTCTAAACATCCCTCAGGAACCTCGAGATCTGGAGATAGATGAGACGATGTTAGACGCGAACTTGAAAGATATTCCACACAGAGATAAACACAGAAAATCGTTAAGCACGGAAAATTTGATACCGAAATCCTATAAAAACAGGACACGCCTGCGGTCGACTGAAAAGGTTTTCGGTTCACACGATAATCTATGGTCAACGTCCTTCAGTGAGCAGGAGTATGGACAGAATTTGACATACGTCTGCGGCGATCAGGAAAATGAGATTATTTATGCGTTCGGCCGTCAAGAAGACCAGAATTTCCAAGCTGGTTTTGTTAGGAACATTACCACGAAGCCACTTAGTCCTCAGAGCACTTCCGAGGACTTTAGGTTATACTTAGCTAATATGCAACACTTACAGAATGCATCTAGCGTATTAACTCGTCAGCAGCTTAGGGACTTAAACGACGTTTTCCAAAATGGTTACTCCAAAGTTAAATGTCTCAGTACAAACGAAGGCCAACATTGCTGTACTGGCAGAGTTGACGACATCGCCAAGGAAAACCCTCAGATGGTGATCCCAGAGGTAGCACCACCACCATGTTCGGAATACCAAAAGATGCTATTGAGGAATCTCCATCAGGAGTTCTGGGATATGCCGACAAATTTTCAGGAAAAGCCCATAGTTTCTGGATCACATCCCAAGAACAGATACAAGACGATCTTACCAAACGAACATTCCAGGTTCATTCTACGAGCGGACGCTGGCAATACCGAGGGCTACATTAACGCCAACTATATCAAGGGCCACGAATACACTAAAAACAGCTACATCGCGACGCAGGGTCCGCTTCAGAACACCGTCTATGACTTCTGGCTCATGGTGCGCCAGAATAATATGGAACTTCAGGCCAGAGCGGAGACATTACTCAACAGGACAGAGGAAAGGTCAGAAGCTATACAGAAAATAGTGATGCTCACCAACTTTATCGAGAACAATAGACAGAAATGCGAGAAATACTTCCCCTTAGAGAAAGGCGAGGAGATCGCCATATCCAGTCCAATCTCGAGCGAAACTTGTTCAGAAGACTCGCCCAAAAACAGTTTTATCATAAAGAATGTGGGTATGTCTAAAAAATCTGGCTATACCGTCCGGAAGCTGGATGTGAGGTATAGTGGGGAAACCGAATCCTTAACAGTATACCACTACTGGTTCCACAACTGGGCTGATCACAAGTGCCCCAAAGACGTGAACGCTTTACTCAACCTAAGTCTGGACGTTTTACGAGAAGACATCAATGATTTCGAGGCTCGCGATGACGAGAAGGACGAACAGTGCAAGTGCGTCGACAGCCCCAAGGGCTCCAAGTTCGTGTTTCCGCCGATGGAGTCGGCGAGTGTCGCGTGTCCGGTCAAAGTGTGCGTCTCCACTCCCATGCAGTTCACGAACGAGAGCAACTCCCCGCCCACCATAGTCCACTGCTCGGCCGGCATAGGGCGCACCGGCTGCCTCATCGCCATACTGAACGGCATCAAGCAGCTGACGAGCGAGGAGAAGGTGGACGTGCTGGGTATCGTGTGTAACATGAGGCTCAACAGGGGCGGGATGGTGCAGAACTCTGAGCAGTACGAACTGATACATAAAGTGCTCTGCCTCTTTGAGCAGGCCTGCCTGCCACACTTATAG

Protein sequence:

>DPOGS203439-PA
MYVSIAKNLCYFLFTTVNSHEVILILITAEQRTSPTTCRCKPKIKYHSNYCYSVTLYSFNAWQFSRCEGVGMWGAWGAQAGWWCGALAAALLALLALCRRAQKRTPPRPPGTVTQVQIVYGGPARVVVAGPPPGASCATASLSAAPPPDPPTPADPPQPALPQILVVQDSTQNTVPQQSDPQPSSSQGPRPLEYHGIPKLPLPEQWLHKRPFDYKYSAIPRPLAQIVSSDLSVDLQRESRAKKFSATRSPSLEKDEKSPFVSSAKSEDMEVFGFDAESVRKLSEDREKPVEMAEPPPQSPQESDKEMSPINLRRFRSVSTRLNLCSVSESPHPEGHQERLEMQNSPRVIECSSAKEKSSGTKFDFSPKILADSMCSPRFFTPPEMVSPMFFAEPSPKSVYYDSVRSPKFFPETPRDVEVPQSPRLLGDHRNKTNGLTEKPTSPKVLSARPSPKVHSHNKENYFTFEQASATEESAARMSPRPRRYGGRNSIERERFTPPADKEVKKYRRHNSCDTSYKSVELNISKCDNILETDATTVDVIEKDVVDCCAKVDSLHVDAKLESDKHELKPISNTAQARRQRLKSISLDSDNAKIIEQNLGLPIAKQMKDQMNEAYKNQEVSTSCESMERYPKTPTAERHIFKFDAEHNEKPEPEAKPEVKQKKCLRQSSDTQSFLDMPRFSPKEFEITVTSEEGDTTAAETQTKRKGKNLRNLTIDLSKRDSDLEKELLEFEKLYTDAEEKKVKTPTLKVKATSLDSSESVNLSLPPKKSLEVPQNSISVPNTPKRQLKRILAQKSGKHDFVVGKLGYNTIQSGADQRRLYMKGQDSGIFLRENHASLMLYQPGTSRIGSRTMGSFDENMADNAPEINIVESRPFHIDPAQTLGSNLLNYKQNLSVSSTNLKTLPEGVPSDDFEPSAEDEKVVKKLHRRNSNQSLMLSTHSLQESNCSLSSAGTSCHNLNTVRTSISNFSLNDHRQKKLSLERRDSNVSINPMDHITPTTRVICSSNTNLTGDVSKNCLLQRRGSNNSLTLNIHSSNNLSRHSSNSSLNKDAKIGHKKGLLERRSSNTSLTLNINSSNPQLSTNRGLSISNYNLNGSTCNLSRYNSNHSIDNAEPRKGILERRSSNTSLTLNIPQEPRDLEIDETMLDANLKDIPHRDKHRKSLSTENLIPKSYKNRTRLRSTEKVFGSHDNLWSTSFSEQEYGQNLTYVCGDQENEIIYAFGRQEDQNFQAGFVRNITTKPLSPQSTSEDFRLYLANMQHLQNASSVLTRQQLRDLNDVFQNGYSKVKCLSTNEGQHCCTGRVDDIAKENPQMVIPEVAPPPCSEYQKMLLRNLHQEFWDMPTNFQEKPIVSGSHPKNRYKTILPNEHSRFILRADAGNTEGYINANYIKGHEYTKNSYIATQGPLQNTVYDFWLMVRQNNMELQARAETLLNRTEERSEAIQKIVMLTNFIENNRQKCEKYFPLEKGEEIAISSPISSETCSEDSPKNSFIIKNVGMSKKSGYTVRKLDVRYSGETESLTVYHYWFHNWADHKCPKDVNALLNLSLDVLREDINDFEARDDEKDEQCKCVDSPKGSKFVFPPMESASVACPVKVCVSTPMQFTNESNSPPTIVHCSAGIGRTGCLIAILNGIKQLTSEEKVDVLGIVCNMRLNRGGMVQNSEQYELIHKVLCLFEQACLPHL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: