MonarchBase - Protein-coding gene

DPOGS208873
Transcript	DPOGS208873-TA	2616 bp
Protein	DPOGS208873-PA	871 aa
Genomic position	DPSCF300009 - 1478539-1498818
RNAseq coverage	142x (Rank: top 54%)

Annotation
*Heliconius*	HMEL016072	0.0	96.01%
*Bombyx*	BGIBMGA008105-TA	0.0	93.48%
*Drosophila*	SKIP-PE	2e-144	40.77%
EBI UniRef50	UniRef50_UPI00021A75ED	0.0	57.00%	UPI00021A75ED related cluster n=3 Tax=unknown RepID=UPI00021A75ED
NCBI RefSeq	XP_972950.2	0.0	60.07%	PREDICTED: similar to CG31163 CG31163-PD [Tribolium castaneum]
NCBI nr blastp	gi\|189234720	0.0	60.07%	PREDICTED: similar to CG31163 CG31163-PD [Tribolium castaneum]
NCBI nr blastx	gi\|189234720	0.0	60.20%	PREDICTED: similar to CG31163 CG31163-PD [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3.6e-16	protein binding
KEGG pathway	bmy:Bm1_39615	1e-08
	K04438 (CRK, CRKII)	maps->	Regulation of actin cytoskeleton
			MAPK signaling pathway
			Bacterial invasion of epithelial cells
			Fc gamma R-mediated phagocytosis
			Renal cell carcinoma
			Pathways in cancer
			Shigellosis
			Chemokine signaling pathway
			Neurotrophin signaling pathway
			Insulin signaling pathway
			Focal adhesion
			ErbB signaling pathway
			Chronic myeloid leukemia
InterPro domain	[652-719] IPR013761	8.3e-21	Sterile alpha motif-type
	[644-721] IPR010993	3.6e-16	Sterile alpha motif homology
	[567-643] IPR001452	2.3e-11	Src homology-3 domain
	[654-714] IPR021129	5.9e-11	Sterile alpha motif, type 1
	[650-717] IPR001660	5.9e-09	Sterile alpha motif domain
	[575-629] IPR011511	2.2e-07	Variant SH3
Orthology group	MCL15880		Insect specific

Nucleotide sequence:

>DPOGS208873-TA
ATGAAAGATGGAGACCGAGGCTATTTAGAAGGCCTGGCTTCGCGGTATGCCGATTTATTCTCAACACATTACGGAGATGTACTAGATCATCTGGAAGAACTTAGAAGACATGAATGGGATGAAATGTCTCCTCGGATGAGAGTCCTCGGCGGCACCGGGACACCTCAAACACCACCTTCAGCTAGTCCTGGTTCATTGGCCTTGAATAATTTGACCACATCCCACTCTCAACCTATTTACGTACCAGGAAAATATTCGCCGTCAAGCTGTCTCACAGACAAGGAAGAAGACGATATTTACGGATTCGGCTATGGCGTGTTTGGCAAGCAAATGTTGCAAAGACAGCAACAACAAAAACAACTTCTCCTTGCTCAACCCACGCAACCTTTGATGCACAATCAACAGCATAATTACCAGAGTTGTCTAAGTCCACGATCAGCTTACTTTTATGAGTTTCCGCCGAGTGATAACTGTCTGGGTACTGCTAAGAAGAAGGTTACGACATTTTCGAGATTGCTTCGCGGGTTGAAGTCACATAGAAAAGAGAAACATGGCTCCTGTTCGCCGAAACATTCCCACAGTCCACGACAAGGGTTGCCTCCTCAGAGGGTTGATACACCGGACAGCGTGCTTCAAAGTGGCTTGGGCTTAGGCCCTGGCCCTGATACAGCTTTGAGGTCTATGGTAGATCCAAGAGACTATGACCGCCTCCGCTTCTTTCAAATGAGTGCCGCCCAACCAAACACCTTCGAAGAAACGATACATAGGTTAAAAGTTCAGGAAGCAATGAAGAAAAAAGATAAATTGGCGAGAGAACAAGAAGAGATTTTAAGAGACATAAGACATGGTCTGATGAATATGGGGAGAGATGGTGTCCGCGGGCCGTTTGGAGACGACACATACATGTATGACGATGAAGCAAGAGGGCTTTCCGGAAGGGGGCACTGGTACGATGAGCCACCCTATGAAAGCGACCCTGAAGACTTTTTAATGGGTGGTGGCGGTCCTGCAGCCTCATTTCAAAATGGACGAGTTTGTTTTACATTAAATTTACGAAATGAGTCAAGAGGTGAAGGTGTGATTTCCCTACGAACTGCCGGCGATATAAGTTTAGCAAGAACCCCTAGAAGAGGATTAATAATTCCGCAAAGCGGCCCCTACCCAACCACTGTGATACCCTTACGAACAGCGAGAGATAGGGAAAGCGGGGATTATGCGGCATCCGACATCCAATCTATCGGCTCGAGGTTGTCCGGCATATCGCTAGAATCAAGTCGATCCGAACGGGACTGTAGAAGGGGTTATAGGCAAATGTCAGGCTATCGGATAGGAATCGACCCTTTATCGCCAGCGTCCTCAGACTACGAAGATCAAGAAAGTGAAACAGATTCACAGCATATAGCAACTGTACATAAGTCAGCAGAAGAATGTGACGGTGTATCAAATCTTGCTGGTAAAGTCAGAGGTCTTAGACAAGATGTTCAAAGAAAAATTTCAAGGTTACGTCAAGAAGGAGGACCTGTCATCTCTTCCGATAGGCGAACTAGTGGCGATCAAGCTTTTCCATGTTCTAATAGTTCTTTTGAAAGTCTTCCCAGCGGCTCAGGCAGTAGCACCCAGGCATTGGTTCGTGCCGGTAGTAATCATTCGTCTCTCTCGGCAGAAGAAAACATAGAATTAAGTCCAGCTGGGCGGAGTCTACTCGTACCGCAAATGCTGTGCCGCGCTCGAGCACTCGTCGATTATGTCCCCAACATTTATGAAAAGGACGCCTTAAGATATAAGAAAGGAGATATCATTGAAGTTATTAACATGAATGCGTCCGGCATTTGGCGAGGTGTTCTAAACAATAAAGTTGGAAACTTTAAGTTTGGAAATGTTGAAGTTCTATCCGAACGGGATACAATGAGGTCAAGAACTTCTAAATGGTGCAAAAGTCGAGAAAGACTTTGGGAGACAAGACCGCGTACAGTTGAAGAATTATTGAGGCGAATAGATTTACCTGAATATATGGTTGCGTTTTCAAGAAATGGTTATGAAGACATAGAACTTTTTAAGGAGATTGAACCTTCCGATTTGGATTATTTAGGTATAATGACCCCTGATCATCGAACACGCATCCTTGCCGCCGTACAACTGCTACACCAGCTAGAAAGTGGCGAAGGTGAAGGTGAGGGTGACGGAGGTGGTTCCAGTTCGGAAGGAGGTGACTCTCCGTTTGGTCGTCGTCAATTTCCAAGAGATTCTGGCTGTTACGAAGCTGGAGTTGGTGTAGGCGGTGTTAGAGTACGCACATCTCCTCTCGTTCATAGAACGGATGAACCCTCCCACAGGCCTCCTGAACCAGCTCCTCAAGCAAAACGTTCTATTCGTCGTCGACAACCGGATGACGCTGAATGTGACAGAATCGAAAAGTACCCCGGCACAATCGGAGAGAAAACTAACGTACGTAGCGGGGGTCTGCCGGGAGGCGCTAGAGATGGCACATGTGAGTCCGATCATAAATTGAATGTTGTCAAGTTTGTAGCCGGAGGAGAGCCTTGCGCTTCGGAAAAGAGTAGTGACTCGGGTGTGAGCAGCTCTTCTTTGAGCTCGGCGCATCCTCATCGTCCCTGA

Protein sequence:

>DPOGS208873-PA
MKDGDRGYLEGLASRYADLFSTHYGDVLDHLEELRRHEWDEMSPRMRVLGGTGTPQTPPSASPGSLALNNLTTSHSQPIYVPGKYSPSSCLTDKEEDDIYGFGYGVFGKQMLQRQQQQKQLLLAQPTQPLMHNQQHNYQSCLSPRSAYFYEFPPSDNCLGTAKKKVTTFSRLLRGLKSHRKEKHGSCSPKHSHSPRQGLPPQRVDTPDSVLQSGLGLGPGPDTALRSMVDPRDYDRLRFFQMSAAQPNTFEETIHRLKVQEAMKKKDKLAREQEEILRDIRHGLMNMGRDGVRGPFGDDTYMYDDEARGLSGRGHWYDEPPYESDPEDFLMGGGGPAASFQNGRVCFTLNLRNESRGEGVISLRTAGDISLARTPRRGLIIPQSGPYPTTVIPLRTARDRESGDYAASDIQSIGSRLSGISLESSRSERDCRRGYRQMSGYRIGIDPLSPASSDYEDQESETDSQHIATVHKSAEECDGVSNLAGKVRGLRQDVQRKISRLRQEGGPVISSDRRTSGDQAFPCSNSSFESLPSGSGSSTQALVRAGSNHSSLSAEENIELSPAGRSLLVPQMLCRARALVDYVPNIYEKDALRYKKGDIIEVINMNASGIWRGVLNNKVGNFKFGNVEVLSERDTMRSRTSKWCKSRERLWETRPRTVEELLRRIDLPEYMVAFSRNGYEDIELFKEIEPSDLDYLGIMTPDHRTRILAAVQLLHQLESGEGEGEGDGGGSSSEGGDSPFGRRQFPRDSGCYEAGVGVGGVRVRTSPLVHRTDEPSHRPPEPAPQAKRSIRRRQPDDAECDRIEKYPGTIGEKTNVRSGGLPGGARDGTCESDHKLNVVKFVAGGEPCASEKSSDSGVSSSSLSSAHPHRP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: