MonarchBase - Protein-coding gene

DPOGS210142
Transcript	DPOGS210142-TA	1260 bp
Protein	DPOGS210142-PA	419 aa
Genomic position	DPSCF300261 + 75104-78825
RNAseq coverage	872x (Rank: top 15%)

Annotation
*Heliconius*	HMEL011606	0.0	84.96%
*Bombyx*	BGIBMGA003789-TA	0.0	82.69%
*Drosophila*	dock-PC	1e-161	73.11%
EBI UniRef50	UniRef50_Q9VPU1	2e-159	73.11%	Dreadlocks, isoform B n=22 Tax=Coelomata RepID=Q9VPU1_DROME
NCBI RefSeq	XP_969702.2	2e-173	72.16%	PREDICTED: similar to GA17645-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189237088	3e-172	72.16%	PREDICTED: similar to GA17645-PA [Tribolium castaneum]
NCBI nr blastx	gi\|383847515	3e-171	76.52%	PREDICTED: cytoplasmic protein NCK1-like isoform 1 [Megachile rotundata]

Group
Gene Ontology	GO:0005515	2.1e-29	protein binding
KEGG pathway	tca:658201	5e-173
	K07365 (NCK)	maps->	Pathogenic Escherichia coli infection
			T cell receptor signaling pathway
			ErbB signaling pathway
InterPro domain	[23-414] IPR017304	1.2e-229	Cytoplasmic, NCK
	[316-398] IPR000980	2.1e-29	SH2 motif
	[143-198] IPR001452	1e-21	Src homology-3 domain
	[80-99] IPR000108	4.1e-06	Neutrophil cytosol factor 2 p67phox
Orthology group	MCL13435		Single-copy universal gene

Nucleotide sequence:

>DPOGS210142-TA
ATGCTGGAGACGCGGTCTGTGCGTGCCGCTGAATCGGTGTGGGCGAATAAGCCGTTGCCGGCGCCGCACGCCATGGCCAGCTCCAGGCACGGAAAGAATACACAGGACGATGTCTGCTACGTGGTCGCCAAGTACGACTATGCGGCCCAAGGAGCACAGGAGCTGGACCTGCGGAAGAACGAGCGCTACCTCTTACTGGACGACTCCAAGCACTGGTGGCGCGTACAGAACGCGCGCAGTCAGTCGGGATACGTGCCCAGCAACTATGTCAAGAAGGAGAAGCCTTCGCTGTTCGATAGCATCAAGAAGAAGGTGAAGAAGGGTTCCGGCTCTAAGACCCTGCCGTCGAACAGTTCTCCAGTGCGTGGCGGGGGCGGCGGCGGGGAGTCCCCGGGCGCAAGGCGCGTGGAGCCCACGGAGGCGCTGGGCACGGCCGTCGTCAAGTACAACTATCAGGCGCAGCAACCCGACGAGCTCGCGCTCACCAAGGGGACACGCATACTCATACTGGAGAAGAGCAACGACGGCTGGTGGAGGGGGCAGTACCAGGGACACACCGGATGGTTTCCTTCAAACTACACGAGCGAGGAAGGAGACGAGGACACCGTCCACACTTACGCGATGGCTGAGAATGTACTCGATATTGTTGTGGCGCTGTACTCGTTCACGTCCAACAACGAGCAGGAGCTGTCGTTCGAGAAAGGTGACCGTCTGGAGATCATCGAGAGACCGCCCTCTGACCCCGAGTGGTACCGGGCTCGGGACAACCGCGGACAGATAGGGCTCGTGCCCAGAAACTACCTCCAGGAACTCGCAGACTACCTCACGCAGCCTTACAGCGAGGCGTCCGAGGGCGGGCCGTCCAGCGCGGTGGCTCGAGTGGGTGCGGGCGTGGCGGGCCCGGCGGGCGCAGGTGGCGGGGCTGTGGGCGGCGGGGCGGTCGGCCGCGCCTGGTACTTCGGCGCCATCACGCGCACTCACTGTGACGCGCTGCTCAACCAGCACGGGCACGACGGAGACTTCCTCATCAGAGACTCGGAGACCAACGTCGGCGACTACTCCGTGTCGCTGAAGGCGCCGGGTCGCAACAAACACTTCCGCGTGCAGGTGGAGGGCAACCTGTACTGTATCGGCCAGAGGAAGTTCACGACGCTGGACCAGCTCGTGGCGCACTACCAGCGAGCTCCCATCTACACCAACAAGCAGGGGGAGAAGCTCTACCTCGTGCGTCCTCTACCGCGCGCCAACCAGAACTGCTGA

Protein sequence:

>DPOGS210142-PA
MLETRSVRAAESVWANKPLPAPHAMASSRHGKNTQDDVCYVVAKYDYAAQGAQELDLRKNERYLLLDDSKHWWRVQNARSQSGYVPSNYVKKEKPSLFDSIKKKVKKGSGSKTLPSNSSPVRGGGGGGESPGARRVEPTEALGTAVVKYNYQAQQPDELALTKGTRILILEKSNDGWWRGQYQGHTGWFPSNYTSEEGDEDTVHTYAMAENVLDIVVALYSFTSNNEQELSFEKGDRLEIIERPPSDPEWYRARDNRGQIGLVPRNYLQELADYLTQPYSEASEGGPSSAVARVGAGVAGPAGAGGGAVGGGAVGRAWYFGAITRTHCDALLNQHGHDGDFLIRDSETNVGDYSVSLKAPGRNKHFRVQVEGNLYCIGQRKFTTLDQLVAHYQRAPIYTNKQGEKLYLVRPLPRANQNC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: