MonarchBase - Protein-coding gene

DPOGS201245
Transcript	DPOGS201245-TA	1782 bp
Protein	DPOGS201245-PA	593 aa
Genomic position	DPSCF300037 + 67437-76084
RNAseq coverage	1421x (Rank: top 9%)

Annotation
*Heliconius*	HMEL003211	2e-129	73.02%
*Bombyx*	BGIBMGA012467-TA	0.0	73.87%
*Drosophila*	CAP-PT	3e-95	45.98%
EBI UniRef50	UniRef50_C9DTM4	2e-170	74.48%	CAP isoform A n=3 Tax=Obtectomera RepID=C9DTM4_BOMMO
NCBI RefSeq	NP_001166801.1	4e-171	74.48%	c-Cbl-associated protein isoform A [Bombyx mori]
NCBI nr blastp	gi\|290563437	9e-170	74.48%	c-Cbl-associated protein isoform A [Bombyx mori]
NCBI nr blastx	gi\|290563437	1e-164	53.38%	c-Cbl-associated protein isoform A [Bombyx mori]

Group
Gene Ontology	GO:0005515	2.1e-21	protein binding
KEGG pathway	ptr:450628	3e-49
	K06086 (SORBS1, SH3D5, PONSIN, CAP)	maps->	Insulin signaling pathway
			Adherens junction
			PPAR signaling pathway
InterPro domain	[329-384] IPR001452	2.1e-21	Src homology-3 domain
	[400-451] IPR011511	3.1e-13	Variant SH3
	[344-363] IPR000108	1.6e-07	Neutrophil cytosol factor 2 p67phox
Orthology group	MCL11098		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201245-TA
ATGAATCAAAACCGCTTAAGCGAACCAGTTTTCGGTAAAAGTTCTGTGTCGGATTATTATTATGATGAAGAAATAAATTTTAGAGATCTTCGACTATCTGGCTCTATGTCCAGATCGTTAAGGGCATTGAACAATTATGTGAAGAAAAACATTTTTTACGATGAAAGTGAGGACCCAGAAAATGAACACGATAGTGATTATTATTCCAAAGAAACAAGCCCAAACGATTCGGTCTCTTTAGTGAAAAGTGATTCAGAAAGTGTTTTGAGCGAAGTGTCAAGTGTAAAAGATAAAATAAATAACATCCCTACTCATGCAACGGAGGACTCGCATTCCAAAACATCTAACGACCCCACAACTTTAACCGATGACTATAAATTCAATAAGCTTATTGAAAATGCTTCAAAAACTGAAACACCTCTTGTGATAGAAAATTCAAATGATATAAATAATAGCAAAGAACTTAAAGAGCCTCCCGTGCCTAGTACGCGCCATTCACTATCAACTCCTCTCATAGATGAATCTGAGGCAAAGGAAAAAGATGTTGACCTTGAAAAAGTTACGCTAAGGACAAAAAATATATCAAGAGATAATCGACACACCGTGCACGATGTATCGGAATGGGTAAATAGAACTGATATTTACCCGGATGTTTACGCGCCCCTGCCGTATAAATCTCCTAACCGCCGCTACATTGAGAGCGACGTGAACATCCATTACCGCTGTCCGGTGAGACACGACCCTCTGCCGCTAGTCCCAGAACGCGAGCTGGCGAGGCAGCAGGCCGATCATATGAAGCGGCTGTACAGGGAGCAGCGCAGGAACAAGTACCTACAGGAGAACTCCATACATCCGCTCGACATAGAAGCATTCGATGCCTCTATCAAGGAGCTACAAGATATGCAAAATAGGCGTCATCAAGACAACTTTATGCCTTCACAAAAAACTATAGTCCCACTAAATAGATACGACGAAGCAGAAAGAATAGTCGCTAAAGCGCTCTATACATTCAATGGTCAGACCTCGAGAGAATTGAGTTTCAGGAAAGGAGATATTATAAATGTTAGGCGACAAATAGATTCTAATTGGTACGAAGGAGAGGTGCACGGAAAAGTCGGATTATTCCCATACAATTACGTAGAATTAATGAAAGGGGATGGGATTCAAACTTTGAAGAAGACGGCGATAGTCGAGGGTCGAGCCAAAGCAAAGTTCGACTTCACCGCCCAGACCAACCTCGAGCTGCCGCTGAAGAAGGGCGAGGTCGTGGTGCTGACGAGACGGATCGATCATAACTGGTGGGAAGGAAGAACTGGCAATAAGACCGGCATCTTCCCTGACAGCTACGTCACAATACTACAAGAACCGAGTCAAAGTAGACAGGAGCCGGAAAAGCCAGTCGGTACTCCAGCGGCCCATGGTCTCATGAACGGTGACAGACCCACGTCACATCGCTACACTCCTCAACATAACAGTCCAGCTCTCTCTAACGCACCCCCCGCCACAGCGCCGCTACCGTCGCAAGGCTACATTCGCAAGTCTTCATCTACCCGCAGTGCTGACCTTAACAACACAGAGCCTCTTTACGTTGACACCAACGCTGAAGCTGTTCCTTACCGCGCCATGTACAAGTATCGTCCCCAAAACCCTGACGAGCTGGAGTTGTTGGAGGGGGAGACGGTGTACGTCCTCGAGAAGTGTGATGATGGATGGTATGTCGGCTCCAGCCAGAGAACCGGCCGGTTCGGTACCTTCCCCGGCAACTACGTAGAGCGTATATGA

Protein sequence:

>DPOGS201245-PA
MNQNRLSEPVFGKSSVSDYYYDEEINFRDLRLSGSMSRSLRALNNYVKKNIFYDESEDPENEHDSDYYSKETSPNDSVSLVKSDSESVLSEVSSVKDKINNIPTHATEDSHSKTSNDPTTLTDDYKFNKLIENASKTETPLVIENSNDINNSKELKEPPVPSTRHSLSTPLIDESEAKEKDVDLEKVTLRTKNISRDNRHTVHDVSEWVNRTDIYPDVYAPLPYKSPNRRYIESDVNIHYRCPVRHDPLPLVPERELARQQADHMKRLYREQRRNKYLQENSIHPLDIEAFDASIKELQDMQNRRHQDNFMPSQKTIVPLNRYDEAERIVAKALYTFNGQTSRELSFRKGDIINVRRQIDSNWYEGEVHGKVGLFPYNYVELMKGDGIQTLKKTAIVEGRAKAKFDFTAQTNLELPLKKGEVVVLTRRIDHNWWEGRTGNKTGIFPDSYVTILQEPSQSRQEPEKPVGTPAAHGLMNGDRPTSHRYTPQHNSPALSNAPPATAPLPSQGYIRKSSSTRSADLNNTEPLYVDTNAEAVPYRAMYKYRPQNPDELELLEGETVYVLEKCDDGWYVGSSQRTGRFGTFPGNYVERI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: