MonarchBase - Protein-coding gene

DPOGS208777
Transcript	DPOGS208777-TA	2517 bp
Protein	DPOGS208777-PA	838 aa
Genomic position	DPSCF300036 - 831581-841733
RNAseq coverage	131x (Rank: top 56%)

Annotation
*Heliconius*	HMEL015428	0.0	75.34%
*Bombyx*	BGIBMGA007636-TA	0.0	83.40%
*Drosophila*	vav-PC	5e-165	45.81%
EBI UniRef50	UniRef50_E2A8N9	0.0	50.48%	Protein vav n=6 Tax=Endopterygota RepID=E2A8N9_CAMFO
NCBI RefSeq	XP_396932.2	0.0	50.18%	PREDICTED: similar to vav CG7893-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|380030241	0.0	52.30%	PREDICTED: protein vav-like [Apis florea]
NCBI nr blastx	gi\|380030241	0.0	52.06%	PREDICTED: protein vav-like [Apis florea]

Group
Gene Ontology	GO:0005622	9.9e-54	intracellular
	GO:0035023	9.9e-54	regulation of Rho protein signal transduction
	GO:0005089	9.9e-54	Rho guanyl-nucleotide exchange factor activity
	GO:0005515	3.4e-30	protein binding
	GO:0035556	1.8e-09	intracellular signal transduction
KEGG pathway	ame:413488	0.0
	K05730 (VAV)	maps->	Regulation of actin cytoskeleton
			Fc epsilon RI signaling pathway
			Fc gamma R-mediated phagocytosis
			B cell receptor signaling pathway
			Chemokine signaling pathway
			Natural killer cell mediated cytotoxicity
			Leukocyte transendothelial migration
			T cell receptor signaling pathway
			Focal adhesion
InterPro domain	[236-457] IPR000219	9.9e-54	Dbl homology (DH) domain
	[6-134] IPR001715	3.4e-30	Calponin homology domain
	[467-598] IPR011993	4.9e-25	Pleckstrin homology-type
	[661-769] IPR000980	2e-21	SH2 motif
	[26-98] IPR022613	8.3e-14	Calmodulin-regulated spectrin-associated protein, CH domain
	[476-582] IPR001849	3e-12	Pleckstrin homology domain
	[766-832] IPR001452	8.7e-12	Src homology-3 domain
	[592-635] IPR002219	1.8e-09	Protein kinase C-like, phorbol ester/diacylglycerol binding
Orthology group	MCL10528		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208777-TA
ATGGCTGCCGGTGGAGAGGATCTTTGGCGCGAGTGCGCAACTTGGCTCACTCGATGTGGCTTGTTACGGCCTGATCATAAAGCAAATTGGGAGACGAGTACTATCCATGATCTTGCTTATACTTTACGAGATGGTGTGCTGCTTTGTAATTTGTTAAACACGCTGTACCCGGGATGTATCGACATGAAAGATGTTAATCAACGACCCCAGATGGCACAGTTCCTATGTATGAGAAACATTAAAGTCTTCCTGAGGACATGCCACGAAGTGTTTGAGCTTCGGGAGACGGATCTCTTTGATCCTTCGATGTTATTCGACCTCTCCGATTTTCACAGGGTGTTATGTACCTTGGCCAAGCTCAGTCAATGTCCTAAAGCCTTGGCTAGAAATGTTCAGCCGTTCTCAGCGAGACGGACTCAGTCGGAGGAGGACATCTACAAGGACCTTCAGTCGGTCGCGAACATGCCGTGCGAGACGCCCTCGTACGAGGTGGTGGAGGAGGTGGAGACGAGGGAGGTACCGTGGATACAGTTCACTATACCGAGCGTGGCCTGCGAGGATCGCGTCGAGGAGATATACGAAGACCTCTGCTATGTCAATGGCGGAACGGGCCGTGGGGTGGGGGAGTACGCCAGCTACTGCGCCCGCCTTCACGACGAGGAGATCTACCACGACCTGTGCGTGGTGACAGGGGCAAGGGGCGCGCCCGCCGACAAACACAACATCGCTTTCGCTACACTAGCGACGTCGTCGCACAGCTTAGAGAAGAGAGATTACGTTATACGGGAACTGGTCGACACTGAGTGTAACTATGTGGATGTGCTCAGTAAGATTATCAAATACTTCTTGAGGCCGCTGACGCCGTATCTGAAGCCCCAGGATATGCAAGTCATATTTTTCGGTGTCAAGGAGTTGCACGATATACACAACGGTCTACTCCGCCAGCTAAGGCTCGCGACCGACAATTGTGTACCTGGCAGCGGAGCGCCGCGACTAGCGGACGTGTTCCTGGCGTGGCGGGAGCGGCTCCTGCTGTATGGAGACTATTGCTCAAATCTCACAAACGCCCAGGACACGTTGAAAGCGCTCGATGCAAGGGATTCCACATTCAGTAAGCAGCTACTGAAATGTCAAAAGGAGCACAGTGACGGTCGTATCCAGCTGCGCGACATCCTGTCGGTTCCCATGCAGCGTGTGCTCAAGTATCATCTGCTGCTGGACAAGCTGGTGCACGAGACCCAGCCGAACCACGAGGAGTTCCGCGGCTTGGAGCGCGCCAAGGAAGCCATGGTGGACGTGGCTCAGTATATCAACGAGGTCAAGAGGGACAGCGAGGTGCTCGTGTTGCTGGCTAAGCTGCAGGAGAGTATAGTGGACTGGGACCGGTCGGGCGCGGAGGGCGGGTCGCTGGCAGCTTACGGCCGCCTGCTGCTGGACGGAGAGCTGAAGGTGAAGGCTCACGAGGACCAGAAGATGAGGATGAGATACGTGTTCGTGTTCGACAAGTACATGCTGCTGTGCAAGCCCGTCAAGGAGAACCAGTACTCGTACCGGAAGGGCATCAAGCTGGCCGAGTACCGTGTGGAGGAGGGCGGGCCGCGGCGCTCGCTGAGGGCGGACGCTCGCTGGACCGCGCACTTCTTCCTCGTCAGGCGGACCAAGGACGCCACCTACACGCTTTACGCCAAGACGGAGGACTGTCGCCGGAAATGGCTGAAGGCCATCAACGACGCCATAGAGAATCTGGAGCCGCCCGGCTGTCGGCGGACCAACCACAAGTTCGTTCTTCACACCTTCGAGAAGCCGGCCACGTGTCATCACTGCTCCAAGTTCCTCAAGGGCAGGATATTTCAGGGCTACCTGTGTTCCGTGTGTGGAGCGTGCGCCCACAAGGAGTGCATCGCTCTGTCGGGCCGCTGCGGGGGAGGGAGCGCCCCCGCGCCGCCTCTGCCACCACACGCACTACAACCGGACACCGCGCTGCACTACTACATGTGGTACGTGGGCGAGATGAGCCGGGAGACGGCCACGTCCCGCCTGGAGCGCCGTGTGGACGGCACCTTCCTGCTGCGGGTGAGGCCGCGCGCCGCGCTCCACGACACCCAGTACGCGCTCTCACTCAAAACCGACAACACGGTGAAACACATGCGAGTGTGTCTGAAGCCCATCGACTCGGTGCCTCACTACTACCTGTCCGAGTCCAGGTTCTTCAGGAGCGTGGTCGAGCTGATATCCTACTACGAGAAGACGAGCTTGTCGGAGAACTTTGTCGGATTAAACTCGAACTTGCGATGGCCCTTCCGCCGCGTGGTGGCGACTGTCATCCACGACTTCCGACCGCTAGAGGCATCCCAGTTGGCGCTCCGCCCCGGCGCGAAGGTGTTAGTGCTCAGCAAGGAAGGCGACGGCCGGGGCTGGTGGAAAGGCCGCACGCTGGATAAGGGTGACCACCGCTCGGGCTACTTCCCCAAGGAGTGCGTCCGCGAGGAGCCCGAGTGTATCGGAGCGTTAGACTGA

Protein sequence:

>DPOGS208777-PA
MAAGGEDLWRECATWLTRCGLLRPDHKANWETSTIHDLAYTLRDGVLLCNLLNTLYPGCIDMKDVNQRPQMAQFLCMRNIKVFLRTCHEVFELRETDLFDPSMLFDLSDFHRVLCTLAKLSQCPKALARNVQPFSARRTQSEEDIYKDLQSVANMPCETPSYEVVEEVETREVPWIQFTIPSVACEDRVEEIYEDLCYVNGGTGRGVGEYASYCARLHDEEIYHDLCVVTGARGAPADKHNIAFATLATSSHSLEKRDYVIRELVDTECNYVDVLSKIIKYFLRPLTPYLKPQDMQVIFFGVKELHDIHNGLLRQLRLATDNCVPGSGAPRLADVFLAWRERLLLYGDYCSNLTNAQDTLKALDARDSTFSKQLLKCQKEHSDGRIQLRDILSVPMQRVLKYHLLLDKLVHETQPNHEEFRGLERAKEAMVDVAQYINEVKRDSEVLVLLAKLQESIVDWDRSGAEGGSLAAYGRLLLDGELKVKAHEDQKMRMRYVFVFDKYMLLCKPVKENQYSYRKGIKLAEYRVEEGGPRRSLRADARWTAHFFLVRRTKDATYTLYAKTEDCRRKWLKAINDAIENLEPPGCRRTNHKFVLHTFEKPATCHHCSKFLKGRIFQGYLCSVCGACAHKECIALSGRCGGGSAPAPPLPPHALQPDTALHYYMWYVGEMSRETATSRLERRVDGTFLLRVRPRAALHDTQYALSLKTDNTVKHMRVCLKPIDSVPHYYLSESRFFRSVVELISYYEKTSLSENFVGLNSNLRWPFRRVVATVIHDFRPLEASQLALRPGAKVLVLSKEGDGRGWWKGRTLDKGDHRSGYFPKECVREEPECIGALD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: