MonarchBase - Protein-coding gene

DPOGS209666
Transcript	DPOGS209666-TA	3084 bp
Protein	DPOGS209666-PA	1027 aa
Genomic position	DPSCF300134 - 340133-346938
RNAseq coverage	223x (Rank: top 45%)

Annotation
*Heliconius*	HMEL008455	0.0	84.50%
*Bombyx*	BGIBMGA000699-TA	0.0	77.49%
*Drosophila*	pico-PA	1e-101	42.46%
EBI UniRef50	UniRef50_D6WJS6	2e-176	52.23%	Putative uncharacterized protein n=3 Tax=Pancrustacea RepID=D6WJS6_TRICA
NCBI RefSeq	XP_001812179.1	3e-177	52.82%	PREDICTED: similar to growth factor receptor-bound protein [Tribolium castaneum]
NCBI nr blastp	gi\|189237977	5e-176	52.82%	PREDICTED: similar to growth factor receptor-bound protein [Tribolium castaneum]
NCBI nr blastx	gi\|270008044	0.0	49.43%	hypothetical protein TcasGA2_TC014797 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	9.5e-15	protein binding
	GO:0007165	6.4e-09	signal transduction
KEGG pathway
InterPro domain	[351-464] IPR011993	9.5e-15	Pleckstrin homology-type
	[352-464] IPR001849	2.1e-12	Pleckstrin homology domain
	[215-298] IPR000159	6.4e-09	Ras-association
Orthology group	MCL15622		Insect specific

Nucleotide sequence:

>DPOGS209666-TA
ATGATGGACGTGCAACTAAGCGAGCCGACCAAGTGGCACCGTGGAGGCTTCCTCTCCACTCTCAACAGAAGTTTCCGTCTGGCCACCAAATCAAAAAGCGCTAACAATTCACCAATTGAAAACAAATCTTTTGAACAAAGTTTAAAAATGACTGACACGGGTTTAAATTCATCAAGCGATGCTACAGCAGCGCTGAGGCCGCTGGAAATTGTGGCGCCCCGCATCGATTCCTACAGATTTTCTATGGCAAATCTAGAAGAAACACAAGACGCTGATTTAGACGCGATATTAGGGGAGTTGTGTGCGCTCGATTCCGAATACGATGAAGAAATTTCCCGAGTATCCACTGATTATTCTCAATCCAAAGAAAGAGAAGAGGGCGAGAGTTCTCAGCGACAAGAGAACAAGGAGGGCGATGGTGCACCAACCATCGCAAGAACTGATTCACCTGACAATGACTCTGCCTTTAGTGACACGGTATCGATGCTCTCTAGCGAGTCGTCAGCCTCGAGTAGTGCAAGTTCTAAATGTAAACCGATGAAACTCAGTCTGCATCCAAATCAAAAGGATGCAATTTTTCAACAGAAAGCAGATAAAATTAAACTGGCATTGGAACGTATGAGAGAGGCGAATGTAAAGAAGCTCTTTATTAAAGCTTTCTCTATGGACGGATCATCAAAGAGTCTCCTAGTCGACGAAAAGATGACGTGCGGCTACGTCACACGGTTACTGGCTGACAAAAATCATGTCACTATGGAACCTAAATGGGCCATAGTTGAACACTTACCAGATTTGCATATGGAACGAGTGTACGAAGATCACGAGATGTTGGTGGACAACCTCATGTTGTGGACGCGAGAATCCAAAAACAAAATACTGTTTGCCGAAAGGCCAGACAAGATATCGCTCTTCCAAACACCCGAGAAATTTCTCCTAACTGAAGATGAAAGAGGAATTAGTGAATACGACGAGCATTTACGTCAAGTGGTCATAGAAGAATTCTTCGGTCAAAGCGGAGCCTCTACAATTCCCTCCGTCTCCGGTCATCAAGTCCCAGCCATGGAAGGACCTCTCTATCTTAAAAGTGACGCTAAAAAGGGCTGGAAGAAATACTACTTCGTCCTGAGACCTTCCGGACTGTACTATTTACCGAAAGATAAAGTGAAGACCTTAAAGGAGCTGGTGTGTTTGGCGACTTTCGACACTAACGAAGTATATTTAGGAGTCAATTGGAAGAAAAAGTACAAGTCTCCAACTGACTTTTGCTTTGCTATCAAGCATCCACGGCTTCAACAGCCGAAGAGCGTCAAGTTTATTAAATTTCTATGCGCCGATGATCAAAGGACTCTCGAGAGATGGGTCACCGCCATGCGTATAGCGAAGCACGGCAAACAATTACTAGAAAATCACCGCACCCTCGTCGAAGAGCTGACCCAGGAAGATTTGGACCATTTGGCCCACGCCCGCTCATGCTCCATAACATCGATCCCTACAAAGACTAATGGCACGGCGCCAGGCCTGCCCGCGCCCGTTTCCAGCAACGTCAGTGTTGCCAACTCTGACATCAGCAGCGGCAGACATTCTCGAGCATCATCTTCAAGTTCAAGCGGTTGTCTCTCAGATGGCGGGACCGCCTCGGAAAGTGCGTTCGATTGCGAATTTCCTATGGGTACAATAAAACGAAAACCATCCATGAAGCCAAATATTCCTTTGACCTGGATGACGCGGCAACTTAAAGAAATGGTAGAAAATGAAGGTGACGCAGAAGTAGGTGATTCTGGAACGCTCACAAGACGACCGCGCACTCGAGACGATTCAACTCTTAAACGCCACCACTCAACTGCTACAGGATCTTCGGAGCCCACTATTTACAGTACCAGCAGCATTACATCTAGCAGTCCAGTGAGAGATCCGTCATCTCCAACCTATGGCCACTATGAAACTATTACTCACGAACCATATAGAGCAAGCGTAGACACGGCATCCTCGCTATACGGGTACACGATTTATGACAGTTCACAATCACAATCAGAACCTACTGTTGAGGATCTTCCTCTTCCACCACCTCCAACTGATATTCCAGATGGCATGTTTAGTTCAACTCTCAGCCTAGATTCATTGCCACCGCCGCCACCACCTGTGGCCTACCCTATAGAGGATTTGAATGGATCCCAGCTGAGTCTACCACCACCTCCGCCTGAACACACTATTGAAACTCACACTGGACGAGTTCAAGATATAGTTAGCCAGCTAACCGCTCAGCAAATAGAGCAAACATCGAGAGCCGGCCAGAGAAGCAGTTTGAGAAGCTCTGAGAGCAACCGATCATTCCCCCGACAACCCTCGCTCGATAGTGTCAATTCGGAAGCTTCGAAGACGTCTTCTTTACAATCCGACAAAAGTATTTACGCTCATACGCAACAAAATGTTGCATATGGTGCTTGTCTTGTAGAGCTACAGAACAAAAAAATAAGCAACGGCAGTCCAGCCATACAGAAGAAGACAATGGAACCTGTAAAAGAAAGAGCTGGTTCCATTAAGAAAGTTAACTTTGCAGATGACCTTCCAAGTAATACTGACAAGAAAGCCAAAAAAATTTCTTTTAATTTGACGGACGCTCCACTTTCACCAAGAAAGCCTCCTCCGCCGAAACGCAATGAGAGCACTCGTCTCTCGTCCCCTAAAAAGCTAGCTGATTCAAACAGCAATCCTCCAAAAGACTTTCTAAAAGATCTTCAAAGAGTTATGAGGAAGAAATGGCAGGTCGCTCAAAAATGCAAACTTGAACCGGCAACTACGCCACATGAGGTACTTGGTTTCAGAGAATACCCTTTGTCAGATGACTACAAAGAGACTAGCGTGTCCATGTGGGTGCAAGAACATTATGGAGGAGGTTCAGGCGTAGAGGATCCCTTCTACGAGAATGTGTTCGGAAGAGAAGCTCAGCCACGGCGAGAAGAGCCCAAACCAATAAAGAAGCGTCCACCGCCTGCCCCTCCTCGCCGTAGCGACTCGACGCACTTGAGCACACTCCCCGGCATCCCCCCGCCCTCGCATCCATCGCCCGTTCAACCGACCGCTTGA

Protein sequence:

>DPOGS209666-PA
MMDVQLSEPTKWHRGGFLSTLNRSFRLATKSKSANNSPIENKSFEQSLKMTDTGLNSSSDATAALRPLEIVAPRIDSYRFSMANLEETQDADLDAILGELCALDSEYDEEISRVSTDYSQSKEREEGESSQRQENKEGDGAPTIARTDSPDNDSAFSDTVSMLSSESSASSSASSKCKPMKLSLHPNQKDAIFQQKADKIKLALERMREANVKKLFIKAFSMDGSSKSLLVDEKMTCGYVTRLLADKNHVTMEPKWAIVEHLPDLHMERVYEDHEMLVDNLMLWTRESKNKILFAERPDKISLFQTPEKFLLTEDERGISEYDEHLRQVVIEEFFGQSGASTIPSVSGHQVPAMEGPLYLKSDAKKGWKKYYFVLRPSGLYYLPKDKVKTLKELVCLATFDTNEVYLGVNWKKKYKSPTDFCFAIKHPRLQQPKSVKFIKFLCADDQRTLERWVTAMRIAKHGKQLLENHRTLVEELTQEDLDHLAHARSCSITSIPTKTNGTAPGLPAPVSSNVSVANSDISSGRHSRASSSSSSGCLSDGGTASESAFDCEFPMGTIKRKPSMKPNIPLTWMTRQLKEMVENEGDAEVGDSGTLTRRPRTRDDSTLKRHHSTATGSSEPTIYSTSSITSSSPVRDPSSPTYGHYETITHEPYRASVDTASSLYGYTIYDSSQSQSEPTVEDLPLPPPPTDIPDGMFSSTLSLDSLPPPPPPVAYPIEDLNGSQLSLPPPPPEHTIETHTGRVQDIVSQLTAQQIEQTSRAGQRSSLRSSESNRSFPRQPSLDSVNSEASKTSSLQSDKSIYAHTQQNVAYGACLVELQNKKISNGSPAIQKKTMEPVKERAGSIKKVNFADDLPSNTDKKAKKISFNLTDAPLSPRKPPPPKRNESTRLSSPKKLADSNSNPPKDFLKDLQRVMRKKWQVAQKCKLEPATTPHEVLGFREYPLSDDYKETSVSMWVQEHYGGGSGVEDPFYENVFGREAQPRREEPKPIKKRPPPAPPRRSDSTHLSTLPGIPPPSHPSPVQPTA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: