MonarchBase - Protein-coding gene

DPOGS200145
Transcript	DPOGS200145-TA	1197 bp
Protein	DPOGS200145-PA	398 aa
Genomic position	DPSCF300128 - 284038-288028
RNAseq coverage	7021x (Rank: top 2%)

Annotation
*Heliconius*	HMEL005654	2e-164	99.63%
*Bombyx*	BGIBMGA002788-TA	2e-143	84.84%
*Drosophila*	Pax-PI	9e-152	63.18%
EBI UniRef50	UniRef50_E2C8K4	2e-158	63.84%	Paxillin n=6 Tax=Formicidae RepID=E2C8K4_HARSA
NCBI RefSeq	XP_002064422.1	1e-161	66.20%	GK23838 [Drosophila willistoni]
NCBI nr blastp	gi\|195432836	3e-160	66.20%	GK23838 [Drosophila willistoni]
NCBI nr blastx	gi\|383863879	1e-167	64.60%	PREDICTED: paxillin-like [Megachile rotundata]

Group
Gene Ontology	GO:0008270	2.9e-23	zinc ion binding
KEGG pathway	dwi:Dwil_GK23838	4e-161
	K05760 (PXN)	maps->	Chemokine signaling pathway
			Regulation of actin cytoskeleton
			Leukocyte transendothelial migration
			Bacterial invasion of epithelial cells
			Focal adhesion
			VEGF signaling pathway
InterPro domain	[140-205] IPR001781	2.9e-23	Zinc finger, LIM-type
Orthology group	MCL13321		Single-copy universal gene

Nucleotide sequence:

>DPOGS200145-TA
ATGAGACTATTTAATTTGATCTATGGAAGAATAATTCAATTAACTATGATTTGGTTATGTCCAACATGCCGTTCGTCTGTATCTCCGATCCCATCCGGTACTCTCCCGCGACCTGGCACCAAACAGGTGACGGTGACCGTTCAAGAGACGGTGGTCGAACCAGCCCAGGCACCACCACCACAGGCCACCACCGTGAGACACCATCACGCCTCCAGCGCTACTAAGGAGCTGGACGACTTGATGGCATCCCTCTCAGACTTTAAGGTAAGCGGCGGTGCAGGTCCAGGCGAACAAGGGACCCACGTGTACAGAGAGAGGAAAGCCTGGGAGGAACATTACCGCAGCCCGCAACCGGAGGCCGCTTCGCTGGAACACATGCTTGGCTCTCTTCGAGCAGACATGAGCCGCCAAGGAGTACAAACACCCCAGAAGGGATGCTGCAACGCCTGCGAGAAACCGATCGTCGGACAGGTCATCACAGCGCTGGGACGCACGTGGCATCCCGAGCACTTCACGTGTGCTCATTGTAACCAAGAGCTCGGCACCAGGAACTTCTTCGAGCGCGACGGCCACCCGTACTGCGAGCCCGACTACCACAACCTGTTCTCACCGAGATGCGCCTACTGCAACGGACCGATCCTGGACAAATGCGTGACGGCGCTGGAGAAGACCTGGCACACGGAGCACTTCTTCTGCGCTCAGTGCGGCCAGCAGTTCGGGGAAGAAGGATTCCACGAGAGGGACGGGAAACCGTACTGTAGGGCCGATTACTTCGACATGTTCGCGCCGAAGTGCGGCGGCTGCAACAAGCCGATCATGGAGAACTACATCTCCGCCCTGAACACACAGTGGCATCCTGACTGCTTCGTCTGCAAGGATTGTCAGATGGCTGTTAAGGGAAAAACCTTCTATGCGATGGAGGGTAAGCCGGAATGCCGCGAGCCTTTCCACGGCGGTTCATTCTTCGAGCACGAGGGCCAACCGTACTGCGAGACTCACTACCACGGGAAGCGAGGGTCTCTGTGCGCCGGGTGTCACAAGCCCATAGCCGGGAGATGTATCACGGCGATGTTCAGGAAGTTCCACCCGGAACACTTCGTCTGCGCGTTCTGCCTCCGCCAGCTCAACAAGGGCACCTTCAAAGAACAGAACGACAAACCCTACTGTCACGCCTGCTTCGATAAACTCTTCGGCTGA

Protein sequence:

>DPOGS200145-PA
MRLFNLIYGRIIQLTMIWLCPTCRSSVSPIPSGTLPRPGTKQVTVTVQETVVEPAQAPPPQATTVRHHHASSATKELDDLMASLSDFKVSGGAGPGEQGTHVYRERKAWEEHYRSPQPEAASLEHMLGSLRADMSRQGVQTPQKGCCNACEKPIVGQVITALGRTWHPEHFTCAHCNQELGTRNFFERDGHPYCEPDYHNLFSPRCAYCNGPILDKCVTALEKTWHTEHFFCAQCGQQFGEEGFHERDGKPYCRADYFDMFAPKCGGCNKPIMENYISALNTQWHPDCFVCKDCQMAVKGKTFYAMEGKPECREPFHGGSFFEHEGQPYCETHYHGKRGSLCAGCHKPIAGRCITAMFRKFHPEHFVCAFCLRQLNKGTFKEQNDKPYCHACFDKLFG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: