MonarchBase - Protein-coding gene

DPOGS206145
Transcript	DPOGS206145-TA	1533 bp
Protein	DPOGS206145-PA	510 aa
Genomic position	DPSCF300028 + 1377367-1382477
RNAseq coverage	84x (Rank: top 64%)

Annotation
*Heliconius*	HMEL015058	4e-81	47.38%
*Bombyx*	BGIBMGA000514-TA	8e-23	50.91%
*Drosophila*	dos-PA	5e-28	51.45%
EBI UniRef50	UniRef50_E0V9D2	9e-40	60.34%	GRB2-associated-binding protein, putative n=1 Tax=Pediculus humanus corporis RepID=E0V9D2_PEDHC
NCBI RefSeq	XP_002422726.1	2e-40	60.34%	GRB2-associated-binding protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|380026273	3e-40	61.29%	PREDICTED: uncharacterized protein LOC100872582 [Apis florea]
NCBI nr blastx	gi\|270005903	6e-41	33.92%	hypothetical protein TcasGA2_TC008021 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	7.8e-25	protein binding
KEGG pathway	gga:422456	2e-23
	K09593 (GAB1)	maps->	Bacterial invasion of epithelial cells
			Neurotrophin signaling pathway
			ErbB signaling pathway
			Renal cell carcinoma
InterPro domain	[3-120] IPR011993	7.8e-25	Pleckstrin homology-type
	[5-123] IPR001849	1.4e-21	Pleckstrin homology domain
Orthology group	MCL26630		Lepidoptera specific

Nucleotide sequence:

>DPOGS206145-TA
ATGTCCAAAAATATTGTTTATGAAGGATGGCTTACTAAATCGCCACCATCAAAGCGCATTTGGAGAACTAAATGGCGCAGACGGTGGTTTGCCTTGCGACAGTCAGGTGAACTACCAGGACAATACTTTCTCGACTACTATTCCGATCGACACTGTAGGAGGTTGAAGGGGTCTATCGATTTGGATTGCTGTGATCAGGTTGATGCTGGATTGCATATGGAAAGGGATAATAACGGATCATTAAATCGCAAACTCCGTGGTTGTGTGTTCACAATCCAAACTAACATTCGCACTTATCACTTGGAGGCTGATTCTGAGGAAGAAATGGAAAAGTGGGTTGATGCTATATGCAGAGCGTGTGGCCTCAGAGCTACGGACGAATCAACAAATGCTGTCGGTCTATATCAGAATATAACGCTAAATGAGAGAGAAAATATTGGAACAAAGGTAATAAATGATTCCAATGTCACAGGGGGTGCGAGAAAAAGGACTCACACCACCACATTTAGGAACAATAAGCCTTCGTCTACACGAGGCAAGTCCAAAGTGAAGACAAACACGAAGCAAACGCCTATAGAAAGACATGATCAGGGTACAATGACGGTTATGGATGATTATCCCTCCGGCGAAGGCACTGGCCCATACATACCAATATCTGAATGCATAACTGGAGTTCGGACACAGGACACCCAAACAGCGTTTACCTTTGACCCCAAGAACATCGTTATCAGCTCGAATAAGAAAGTCGGTAGCTCAAGAAGCTATACCTATTTGACGCAACCACAAATAAGAGTAAATAATGTTGAACTATCAGAAAATGAATCAAATCTCAGTGAAGACGAATGCCGGTCCCTCAGCGCTAGTCAATTCAATATGGGGGATTGGACTGTTGCAAAGTCTTTTAAAAGGCTATCTGTGCATCCTCAAAGCCAAGAAGGCTTCAACGCTGATGGTCCCCCCGTACCACCTCGGCCGCCGAAGACCTTCGCCATGAGCAAGGATCTCACGCGAGCGAAGGATTCCTTCCAAGGACAAAAATTTCAGGAAACTGTTGATGTTCATGAGTGTTCTTCTCCTTTCCCCTGGGTTCGCTTGCCACGTCGCATGTCACAAGGTGCGCCGACATCACCAGGAAGATCCGTGATCAGCCACGCCAGAACTGATGATGAAGATGACGTTTCAATGGGCCATTCGCTGCAGTATTGCAACTTGTCGTCTCTGCCGCCGGCCGTAGATCGCGCTTTGAAGCCACGGCACTCGACTCACAGCATAGGCAATATAACCGCTGGACATAAAACAGCGTGCAGGGCTAGCGATGAGATCAAGTCGGAGACTTTGCAGTACTTGGATCTCGATCTACCCGCCCCCAGCTCGCAATCTACTTTCAAGGAATCAGCAAGGAAGACGTCTATAGTCCACGGTAAGTCGTTGTCATCCGACGAGTGCGCGTATAAAACGGTCGACTTCTTGAAGACCGAGGCGTTCAATATTACTCGCCAGGACGCTGAAGCGTCTAGAAGTATCCAGCAATGA

Protein sequence:

>DPOGS206145-PA
MSKNIVYEGWLTKSPPSKRIWRTKWRRRWFALRQSGELPGQYFLDYYSDRHCRRLKGSIDLDCCDQVDAGLHMERDNNGSLNRKLRGCVFTIQTNIRTYHLEADSEEEMEKWVDAICRACGLRATDESTNAVGLYQNITLNERENIGTKVINDSNVTGGARKRTHTTTFRNNKPSSTRGKSKVKTNTKQTPIERHDQGTMTVMDDYPSGEGTGPYIPISECITGVRTQDTQTAFTFDPKNIVISSNKKVGSSRSYTYLTQPQIRVNNVELSENESNLSEDECRSLSASQFNMGDWTVAKSFKRLSVHPQSQEGFNADGPPVPPRPPKTFAMSKDLTRAKDSFQGQKFQETVDVHECSSPFPWVRLPRRMSQGAPTSPGRSVISHARTDDEDDVSMGHSLQYCNLSSLPPAVDRALKPRHSTHSIGNITAGHKTACRASDEIKSETLQYLDLDLPAPSSQSTFKESARKTSIVHGKSLSSDECAYKTVDFLKTEAFNITRQDAEASRSIQQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: