MonarchBase - Protein-coding gene

DPOGS202157
Transcript	DPOGS202157-TA	1476 bp
Protein	DPOGS202157-PA	491 aa
Genomic position	DPSCF300162 - 75619-81555
RNAseq coverage	426x (Rank: top 29%)

Annotation
*Heliconius*	HMEL003701	5e-111	64.50%
*Bombyx*	BGIBMGA003431-TA	6e-109	62.70%
*Drosophila*	WASp-PB	1e-62	41.88%
EBI UniRef50	UniRef50_E2BEB9	7e-75	44.74%	Wiskott-Aldrich syndrome protein n=8 Tax=Formicidae RepID=E2BEB9_HARSA
NCBI RefSeq	XP_002432217.1	3e-75	41.73%	Neural Wiskott-Aldrich syndrome protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|383855260	3e-83	39.86%	PREDICTED: uncharacterized protein LOC100882400 [Megachile rotundata]
NCBI nr blastx	gi\|156537952	5e-104	42.56%	PREDICTED: hypothetical protein LOC100124250 [Nasonia vitripennis]

Group
Gene Ontology	GO:0005515	4.4e-44	protein binding
	GO:0008154	3.3e-23	actin polymerization or depolymerization
	GO:0005083	3.3e-23	small GTPase regulator activity
	GO:0015629	3.3e-23	actin cytoskeleton
	GO:0006461	3.3e-23	protein complex assembly
KEGG pathway	phu:Phum_PHUM577310	1e-74
	K05747 (WAS)	maps->	Shigellosis
			Chemokine signaling pathway
			Pathogenic Escherichia coli infection
			Regulation of actin cytoskeleton
			Bacterial invasion of epithelial cells
			Fc gamma R-mediated phagocytosis
			Adherens junction
InterPro domain	[5-139] IPR011993	4.4e-44	Pleckstrin homology-type
	[22-127] IPR000697	1.3e-27	EVH1
	[208-312] IPR011026	3.3e-23	Wiscott-Aldrich syndrome, C-terminal
	[203-259] IPR000095	2.5e-11	PAK-box/P21-Rho-binding
Orthology group	MCL11619		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202157-TA
ATGCCAAAGGGAGAGAACAGGCCGAGCGTCCTGTTGACTCCGGAAGAGAACGATCTGGTGTTTAGCCTCATCGGAGCTAAATGTCAGAGTCTAGCGACAGCTGTAGTACAATTATTCACTACCGAGGGACCGGATCATTCAGAATGGAAGAAGAAAGACACGGGGGTGCTGTGCCTTATAAAAGATAATAGCAAACGTTCATACTTCTTCCGGATCTACTGCCTCTATCGGAGGTCGTTGATTTGGGAACATGAAGTCTATCTGCAGATTGAATACAAAAATCCCAGACCGTATTTACATACGTTTGAAGCCGAGGAATACATGACGGCATTTAATTTCGCAAATGAAATGGAGGCGACGGTGCTAAGGAATATTCTTTTAGAGAAAATTGAACTGCGTAAACAAAGACGGCAAGTTCGTAACAATCGTTCGATGATGGTCCCCCGTAATAACTCGACGGTTCATGAGTCTTCGTCGCGGTACAACGGCGCCCCTCCCCCGCCGCCGCTCACCACCACCACCGCCACCACCAATACTAAGACTAACACCCTCAATTCCTTGAAAGGCTCGGGGAGGAAACCGAAAGCGCGCAAACTGACCAAGGCTGACATCGGCATGCCGAAGGACTTCAAGCACGTGTCACACGTCGGATGGGACGCCAACAAAGGGTTCGACGTGGATCTGCCGGAGGAGAAGCTCCGCTGGTTCTTCGACAAGGCGGGCGTGTCGGAGACGCAGCTCAACGACCAGGAGACGAGGATGTTCATATACGACTTCATCATCAAGAACGGCGGAGCGGACGCGGTCAACGAGGACCTCACGGACGAACCGCCGCCGCCATACTCGGAGTCCCGGAGCCCCGCGCCGCCTGTCCCCGCCCGCGCCCCGCACCCCCCCGCGCCCCCGTCTCGTGCTCCGCCCCCGCCGCCGGCGCGGTCCGTACCCCCTCCGCCGCCGCCGCCAGCGACCCTCGCGCCGCGGAACCCTCCGCCGCCCAGACCGACACAACCCCCGGCCCCGGCGCCGCCGTCCATGCCTCCCCCTCCTCCCCCGCCGTCGCTGGCTCCGCCTCCGCCGCCGCCTCCCCCCGCACCGCCCGCGCCTCCCCCGCCGAGCTCCGAGGACAGGTCAGAGCTGCCCGCCGCCAACAGTGACCCGCGGGCCGCTCTCATGGCGAGCATACGGAGCGGCAACAAGAACTTGAGGCCCGTGGATTCCGTATCTAAGTCTTCGGCCAGCACGGACGACAGCAGGAACAACTTATTGAGCGAAATCCGTCAAGGGATCACATTGAAATCGGTGCGGCGGGAGAGTGTCACCGCGGGCGACGAGAAGACTACCAACAACGTAGAAAACGCGAGTGGCCTCGCCGGCGCGCTGGCCCGGGCGCTCAAGGAGCGGGCGAGGGCGATACACTCCTCGGACGACGAAGACGACACCGACAACACCACCAGCGACGGAGAGTGGGACTTCTAG

Protein sequence:

>DPOGS202157-PA
MPKGENRPSVLLTPEENDLVFSLIGAKCQSLATAVVQLFTTEGPDHSEWKKKDTGVLCLIKDNSKRSYFFRIYCLYRRSLIWEHEVYLQIEYKNPRPYLHTFEAEEYMTAFNFANEMEATVLRNILLEKIELRKQRRQVRNNRSMMVPRNNSTVHESSSRYNGAPPPPPLTTTTATTNTKTNTLNSLKGSGRKPKARKLTKADIGMPKDFKHVSHVGWDANKGFDVDLPEEKLRWFFDKAGVSETQLNDQETRMFIYDFIIKNGGADAVNEDLTDEPPPPYSESRSPAPPVPARAPHPPAPPSRAPPPPPARSVPPPPPPPATLAPRNPPPPRPTQPPAPAPPSMPPPPPPPSLAPPPPPPPPAPPAPPPPSSEDRSELPAANSDPRAALMASIRSGNKNLRPVDSVSKSSASTDDSRNNLLSEIRQGITLKSVRRESVTAGDEKTTNNVENASGLAGALARALKERARAIHSSDDEDDTDNTTSDGEWDF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: