MonarchBase - Protein-coding gene

DPGLEAN20207 in OGS1.0

New model in OGS2.0	DPOGS214861
Genomic Position	scaffold809:- 40608-44914
	See gene structure
CDS Length	1530
Paired RNAseq reads	1918
Single RNAseq reads	4791
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA010072 (1e-73)
Best Drosophila hit	cortactin (5e-72)
Best Human hit	src substrate cortactin isoform b (2e-94)
Best NR hit (blastp)	PREDICTED: cortactin [Taeniopygia guttata] (3e-127)
Best NR hit (blastx)	PREDICTED: cortactin [Taeniopygia guttata] (4e-126)
GeneOntology terms	GO:0001726 ruffle GO:0005515 protein binding GO:0005737 cytoplasm GO:0005938 cell cortex GO:0006898 receptor-mediated endocytosis GO:0030027 lamellipodium
InterPro families	IPR015503 Cortactin IPR001452 Src homology-3 domain IPR003134 Hs1/Cortactin IPR000108 Neutrophil cytosol factor 2 p67phox
Orthology group	MCL17978

Nucleotide sequence:

ATGTGGAAAGCGGCCACTGATGTAGTGGCGCCCACACCGGCCGAGGCTGACGATTGGGAG
ACAGATCCCGACTTTGTGAATGATGTCACAGAACAGGAACAACGTTGGGGGCCAGGGGGA
AGACATGTAGAAGCTATTGATATGGCTAAACTCAGAGAGGAAGTTCTGGAAGCAGACAAG
CAAATTAAACAGAAGCAGTACGAGGAAGGGCCTAAACCCTCATATGGATATGGAGGGAAA
TTTGGTGTCCAACAAGACAGGATGGATAAATCAGCGGTCGGGCACGATTACGTCGGCAAA
ACAGAGAAGCATGTCTCGCAGAAAGATTACGCACAAGGTTTCGGCGGTAAGTTTGGCGTT
CAAACTGACCGTATGGACGCCAGCGCGGTGGGTCACGACTATGTGGGCGTCGTGTCCAAG
CACGCCTCGCAGACCGATCATAGTAGGGGCTTCGGGGGGAAGTACGGCGTGCAGACTGAC
AGAGTTGACAAGAGCGCGGCTGGTTGGGAACACAAGGAGCAGATAGAGAAGCATCCGTCG
CAGAAAGACTACTCGGTCGGCTTCGGAGGCAAGTTCGGTGTACAGGTCGACCGGCAGGAC
GCCAGCGCCGCCGACTGGGGACACAAGGAACCCACTGCGGCACACGAGTCGCAGACTGAT
CACTCCCGCGGTTTCGGTGGTAAGTTCGGGGTGCAGACGGACAGACAGGACGCGTCCGCC
GTCGGCTGGGATCACCAGGAGAAGACGGAGGCTCACGCTAGCCAAGTGGACCATAAGAAG
GGCTTCGGTGGTAAATTCGGTGTCCAAACTGACAGAGTGGATAAATGCGCCCAAGGTTTC
GACTCCGTGGAGAAGTCGGGCGGGTACAGTAGACCCAGGCCAGACATCGGCGGAGCCAAG
CCCAGCTCCATACGAGCCAAGTTTGAGAACATGGCCAAGGAAAAAGAACAGATCCTTCGA
GATCAATCCGTTCAGAAATTAAGACAGGAGAGGCAACAACTAGATCGTAGTTTGTCAGAA
AAAGAAAAACAACGTCTGGAGAAAGAAAAGGAGCAAAATCAAGAAGAGACGGCCAGCACG
AACGTGTTCAAGAAGACTGAAGGTGGTAACGCAGTGCCCGCGGCTGTGCAGGCTGTGCAG
GACGCGAGACAAGAGGTGGAGCAGGACGTTAGACAGGACTCTGTGCACGAGAAACAGGAA
GTGAAGCAGAGCAACCTGCCGGATGTGACTCTTGTGGGAGACGCCAAGGACGAAGACAAG
GAAGAGCATCCGCGGCAGCCCACGATAGTGGTGTCTCCTGTGGGCTGGGAGGGGGAGGGC
GAGGGCGAGGCGTGCGAGGCTGACGACGAGGACGGGTACACGGCCCGCGCGCTGTACGAC
TACCAGGCCGCGGCGCCCGACGAAATATCATTCGACCCCGACGACCTCATCACCAACATC
GTCATGATCGACGAGGGCTGGTGGCAGGGTCTGTGTAAGGGCGCATACGGCCTGTTCCCG
GCTAACTACGTACAGCTACAAGACAAATAA

Protein sequence:

MWKAATDVVAPTPAEADDWETDPDFVNDVTEQEQRWGPGGRHVEAIDMAKLREEVLEADK
QIKQKQYEEGPKPSYGYGGKFGVQQDRMDKSAVGHDYVGKTEKHVSQKDYAQGFGGKFGV
QTDRMDASAVGHDYVGVVSKHASQTDHSRGFGGKYGVQTDRVDKSAAGWEHKEQIEKHPS
QKDYSVGFGGKFGVQVDRQDASAADWGHKEPTAAHESQTDHSRGFGGKFGVQTDRQDASA
VGWDHQEKTEAHASQVDHKKGFGGKFGVQTDRVDKCAQGFDSVEKSGGYSRPRPDIGGAK
PSSIRAKFENMAKEKEQILRDQSVQKLRQERQQLDRSLSEKEKQRLEKEKEQNQEETAST
NVFKKTEGGNAVPAAVQAVQDARQEVEQDVRQDSVHEKQEVKQSNLPDVTLVGDAKDEDK
EEHPRQPTIVVSPVGWEGEGEGEACEADDEDGYTARALYDYQAAAPDEISFDPDDLITNI
VMIDEGWWQGLCKGAYGLFPANYVQLQDK