MonarchBase - Protein-coding gene

DPOGS200478
Transcript	DPOGS200478-TA	3798 bp
Protein	DPOGS200478-PA	1265 aa
Genomic position	DPSCF300158 - 281627-339989
RNAseq coverage	303x (Rank: top 37%)

Annotation
*Heliconius*	HMEL006035	2e-146	60.86%
*Bombyx*	BGIBMGA010412-TA	5e-113	52.35%
*Drosophila*	baz-PB	6e-11	25.09%
EBI UniRef50	UniRef50_E0VDS8	9e-74	40.43%	Multiple pdz domain protein, putative n=1 Tax=Pediculus humanus corporis RepID=E0VDS8_PEDHC
NCBI RefSeq	XP_001606745.1	9e-86	36.19%	PREDICTED: hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|345481614	5e-85	36.06%	PREDICTED: hypothetical protein LOC100123134 [Nasonia vitripennis]
NCBI nr blastx	gi\|91077544	2e-115	36.42%	PREDICTED: similar to Tyrosine-protein phosphatase non-receptor type 13 (Protein-tyrosine phosphatase 1E) (PTP-E1) (hPTPE1) (PTP-BAS) (Protein-tyrosine phosphatase PTPL1) (Fas-associated protein-tyrosine phosphatase 1) (FAP-1) [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	9.8e-24	protein binding
KEGG pathway
InterPro domain	[586-711] IPR001478	9.8e-24	PDZ/DHR/GLGF
Orthology group	MCL24787		Lepidoptera specific

Nucleotide sequence:

>DPOGS200478-TA
ATGGCGGACAAAGAGGACACGAGTGATAGTGATGGCCCAATAATAGATGACAACGTTATCCGAATACAGCTTAAAAAACCTACACATAGGAAATGGGAGCTGCGAACCAGAAACCTTTCACCCGGTCTCAAGTTCCCAACTATACAGCTTTTTGATTCCGAAGGGAATCTATTAGTCGAAACAAACGATGAGAATATATCGATTACAAGCCTAGATCACGATGAGTCCCCTCTTAGAACAAGTCAGTCCTTAAGGGAGAAAGATTACAAGCACATAGTTAGGAAAAAAATTATAAGAAAGCACAACACTATATCAGGTGATAGAATATATACCCGCGTTTATCGCAATCCCGTGCACATAAAAAATAACGATATCTGTTGTAAAAACAACGACTGTTATGTAATCAAAGACGGTAGCTGTATAACAAACATTCCAAGTAAACTTATTGTAAACAACAACTTACATAATTTGCAAGTAAACAGCCTCGACACCACGCCCTTCCATTCAGAAGGACCGAGTGAAGCTAGCAGTTATAAAAGTTCCGACAATGAAACCTGCCACGATTTGCCGACTAATGACAAATTGTCTTCCAGTAACGAAATATTGGATGATATTGATTCTACTCAAAACTCGATAAATACATCGAGTATATCTTTAAACAATATCGATTGCAATAACGATGAGACCGATGTACAAAATAATGTTTGTTTGGGACTTCGGACATCGCAATCATTTGACTCCGCCAAGCTGCCGGTACACCAAAAGGGTTCGCATAATATACACCGCTCAAAATCAAATGCCATTTACAACATACCCCAAAATAAAATTTCCTTTCTTGACACATATTTAAAAAGCTTACCTGCCCGCGCAACTTCCAATCCGGATCAGTTTACTTCACACCTACGCCAAATAACGTTAGAAACTAATTCATGGAAACCGAAGCGAATCGAATCTCAACCATTTTGTGCCCAAAAACTGGAAATATATAAAGTAGACGATAATACTACGGAGAATGATTTTATGAATATATCGACGGACGTGCTCGCCGATTGTGAAATGAAAAAACGTTTAAAAATGTACAGACGAGGTTTATCTGAAATTGAGTCCCGATGTGGAACATCAAATATCTTACCGAGAAAAAGACGCCACACTGTGAGTGGTGGCATGCAAGTCACTCGTTGGTCCTCATCTTCTGAGAGTGTAGACGAAGCCGACGTCGTTCTCAACCGTTTGAAGAGACGGATACTTAAGAACAAGTTAAGAGAGAAACGTCGCAGTTTCGTCTCCAAATCATCTCTTGATAACGACGCATGCAAAGAGAGCGAAAGTGAATCTCAAGACGATTGGCGCGATGCGGGCGGCGGGGCCTTCGTGAGGTCCCGCCTTGCTATGGGCTCAAACATCAGCCAGCACTCCGCTAAGGGTCTGAAGGGCCGTCGGGCACGCTCCAGTGGTGACCTCTGCAATGGCGAAACGAAAAGCCAAACCGAGTCCTCGGTTTGCGGCTCGGTTGTCGGTGACGTTATGGGTTGGAACAGATCGCTTCCTAACCATTTGGACGGGAACAGACATTTAGCGGATTACAGCCGCGTCAATAATAACTACGGTGACTTCGGTACCTATAGGAGTCATCCCAAAGGCGGGAGAGGCTTACGTTATCGCGTGTCAAAATCTGGATCTGACGCAGAGCCAGTGTGGAAGCTCCAAGATCCTGGTTTTGACCAGGGCTACGGTTCAGAAAGATCTCCTGAAGAAGACGTGCAAGCCATCGTCCCGCCGATATCTATCGAACAGTATGAAGCCGAGCTACGAACTGTTTATCCCTTTATTACTGATGAAAACACCTTCACCGTTGTCGTAGAGAAGGATGGGCGCGGGTTGGGTATGTCAGTGTGCGGTGGCGGAGGTCTAGTCAGAATACGCAGACTGTACCCCCCTCAACCAGCCTGGAGGACTGGCCGATTGGCTCCCAAAGACCTACTACTCTCTGCAAATGGTGTACCACTTGCCGGACTTAGCACTTACGAGGCACTAGAAGTGCTGCGTACAGCATCAGCCCGAGTGGAACTTCGCGTCTGCCGGCCTCCAGCCGATATGCTCGAGAGCATAACACCCCCCGACCCTCCCACACCGCCCGTAAGGACTCCTCATCCCCCACACCTGCCACTGGACCCACTCAACTGCCATCCCTTACACGCCAGATTATCACAAACAACGAGCAGTGCTACAACATCGTCATCCGAAGGTCGAGGTCGCCGTGACGCCAGTCCTGATACTGAAAGAAGAGTCCAGGATCTACATCTGCCGGATTTGGACCAACATCTACCAGTTTATGATATACAATATGGGGAATTTGATATAGTGATGACAAAAGTGAATGGATCTTTGGGATTTACTCTACGAAAAGAAGATCACAGCGCGCTGGGGCATTACGTGAGAGCGTTAGTTCGAGAGCCAGCTTTGAGTGACGGAAGAATACAGCCAGGGGATAGAATTGTCGCTGTCAACAACACACCGATGTCAAACATGTCTCACTCGGAGGCTGTATCGTTCTTGCGTGCGTGCGGGTCAGAGGTGCGCCTGCGACTGTACCGCGACCACGCTGCGACCCCCCTCTCACCCGTTTCCCCCAAGGACATACTTACAGACTCCGACGCACCGCTGAACAGACCAAAACCTCCATTGAGAATAATGACAACTTATTTCATTGGGCTGAAGCAGTATCGATGCTATGTGACCTGGCACGAGCTTCTGACTGAGGTCTACGGGGTGATGGTTCGCGATCCCCTTGTCTCTCACCTCGCAAACATCGAAGGCTCACCAAAGACAACCACTACGAACAGCCCAGTTTTCCGCACAGATGTATCAAATTTTGCTACGCTAGAGACACACACAAAACGAGAGAGCTGCAAACGTTCAGACACCGAACGTACAGCTGTAGAAAGAGGGTTGGTCTTAGAACGATCTGCATCCACAACAACGGAGATGCCAGTAGATAATAAAACACGCTATGAAGAACCGAGGCGGCGTATAGCACTCGCCAGTCCCACAGCTCCGCCGACTTGTAGAAAACAAAAGCTAAGCCTGACAGGTGAGACTGATTCCACAGTACCCCCTCATGGCTACGAGCTAAATAATTTAGACAACGACCAATTGGACGCACCGAATTTGTACCAGGAGAATATAACACTACAGCGGTTCATTGAACCGGCATTTCCGGTTGATTCAGATGAGCCTGTGTCTATGCCAGCTGAACTGTCTAGTGATGAAAGATTTAAGCATTCAAGTCCTGCTTATCAGAGCGCTGTACTCCATACCACAACTACTGAAAGTACCTCCGATGGAAATAAAGATGACGGTAACGGCTTAAAAAAGTGGAAGGGAGTTGCCTTGTCACCTGACAATGACAGGAAGGCAAAGCCACCTACATCGGAAATTCCCCCTAAGCCTATGGAAGCTAAAGAAATTGAAACCGTCCAGAAAGAAAATGTGAAACCTGATCAACCGGTGGAAGCCACAAGCACAGAACCTACGATAGTGACAGTGGAACTGAACCGCGGCTGGAATAGTCGCCTGGGGTTCAGCGTCCAGAGCCATCCGGAATCGGGCCAGAGTTACATCTCCGCTGTTTACAACGACAGCGTCGCCGCCAGAGACGGGAGGCTGCGGCGCGGAGATGTTATATTACAGGTGAACGATGAGAACGTAACTTCAATGAAGACGCCTGAAGTCATCGATTTACTTCGAATATTGCGCGGATCGATCTGCATAACGGTACTACGGCCAGCTAATGTCTGA

Protein sequence:

>DPOGS200478-PA
MADKEDTSDSDGPIIDDNVIRIQLKKPTHRKWELRTRNLSPGLKFPTIQLFDSEGNLLVETNDENISITSLDHDESPLRTSQSLREKDYKHIVRKKIIRKHNTISGDRIYTRVYRNPVHIKNNDICCKNNDCYVIKDGSCITNIPSKLIVNNNLHNLQVNSLDTTPFHSEGPSEASSYKSSDNETCHDLPTNDKLSSSNEILDDIDSTQNSINTSSISLNNIDCNNDETDVQNNVCLGLRTSQSFDSAKLPVHQKGSHNIHRSKSNAIYNIPQNKISFLDTYLKSLPARATSNPDQFTSHLRQITLETNSWKPKRIESQPFCAQKLEIYKVDDNTTENDFMNISTDVLADCEMKKRLKMYRRGLSEIESRCGTSNILPRKRRHTVSGGMQVTRWSSSSESVDEADVVLNRLKRRILKNKLREKRRSFVSKSSLDNDACKESESESQDDWRDAGGGAFVRSRLAMGSNISQHSAKGLKGRRARSSGDLCNGETKSQTESSVCGSVVGDVMGWNRSLPNHLDGNRHLADYSRVNNNYGDFGTYRSHPKGGRGLRYRVSKSGSDAEPVWKLQDPGFDQGYGSERSPEEDVQAIVPPISIEQYEAELRTVYPFITDENTFTVVVEKDGRGLGMSVCGGGGLVRIRRLYPPQPAWRTGRLAPKDLLLSANGVPLAGLSTYEALEVLRTASARVELRVCRPPADMLESITPPDPPTPPVRTPHPPHLPLDPLNCHPLHARLSQTTSSATTSSSEGRGRRDASPDTERRVQDLHLPDLDQHLPVYDIQYGEFDIVMTKVNGSLGFTLRKEDHSALGHYVRALVREPALSDGRIQPGDRIVAVNNTPMSNMSHSEAVSFLRACGSEVRLRLYRDHAATPLSPVSPKDILTDSDAPLNRPKPPLRIMTTYFIGLKQYRCYVTWHELLTEVYGVMVRDPLVSHLANIEGSPKTTTTNSPVFRTDVSNFATLETHTKRESCKRSDTERTAVERGLVLERSASTTTEMPVDNKTRYEEPRRRIALASPTAPPTCRKQKLSLTGETDSTVPPHGYELNNLDNDQLDAPNLYQENITLQRFIEPAFPVDSDEPVSMPAELSSDERFKHSSPAYQSAVLHTTTTESTSDGNKDDGNGLKKWKGVALSPDNDRKAKPPTSEIPPKPMEAKEIETVQKENVKPDQPVEATSTEPTIVTVELNRGWNSRLGFSVQSHPESGQSYISAVYNDSVAARDGRLRRGDVILQVNDENVTSMKTPEVIDLLRILRGSICITVLRPANV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: