MonarchBase - Protein-coding gene

DPOGS201490
Transcript	DPOGS201490-TA	1236 bp
Protein	DPOGS201490-PA	411 aa
Genomic position	DPSCF300006 + 374355-378893
RNAseq coverage	768x (Rank: top 17%)

Annotation
*Heliconius*	HMEL015959	4e-128	75.19%
*Bombyx*	BGIBMGA002678-TA	0.0	82.25%
*Drosophila*	Shc-PA	1e-91	46.08%
EBI UniRef50	UniRef50_E1ZX94	1e-112	48.25%	SHC-transforming protein 1 n=8 Tax=Formicidae RepID=E1ZX94_CAMFO
NCBI RefSeq	XP_001602298.1	2e-115	49.45%	PREDICTED: similar to shc transforming protein [Nasonia vitripennis]
NCBI nr blastp	gi\|170040326	5e-107	46.76%	shc transforming protein [Culex quinquefasciatus]
NCBI nr blastx	gi\|328722362	9e-103	50.71%	PREDICTED: SHC-transforming protein 1-like [Acyrthosiphon pisum]

Group
Gene Ontology	GO:0005515	2.5e-55	protein binding
	GO:0035556	6.8e-33	intracellular signal transduction
KEGG pathway	nvi:100118291	6e-115
	K06279 (SHC)	maps->	Bacterial invasion of epithelial cells
			Glioma
			Chemokine signaling pathway
			Natural killer cell mediated cytotoxicity
			Neurotrophin signaling pathway
			Insulin signaling pathway
			Focal adhesion
			ErbB signaling pathway
			Chronic myeloid leukemia
InterPro domain	[4-184] IPR011993	2.5e-55	Pleckstrin homology-type
	[29-185] IPR006020	5.4e-33	Phosphotyrosine interaction domain
	[24-39] IPR006019	6.8e-33	Phosphotyrosine interaction (PID/PI)
	[314-393] IPR000980	5.9e-21	SH2 motif
Orthology group	MCL14349		Single-copy universal gene

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS201490-TA
ATGGGTGACAACGGCCCCTTTGTCGCGAAACCGGCTCGAGGTTGGCTACATCCAGATTCCGTATTAGCCAGCGATGGAATAACTTATGCAGTCAGATATATTGGTTGCATGGAGGTCCTTACATCTATGAAAAAATTAGACTTTGAGACAAGATCTCAAGTAGCAAAGGAATGTATTGCGAGAGTATGTGCTGCAGCGGGACTAAGAACAGCCGATAAAAAGCGTAGAGTTTGTCAAGCAGCTGCAAATGCTTTAGCGGCTAGACCTAGAATGTCACATTCCGGCTCCAATGTAGCCTTAACAATCTCATCGAGAGCTATAATACTGGCCGCTCTGGAAGGTGGTGAAACTATTGCACGACATGACATGCCACGGGTGTCATTTGCATCCGGAGGTGATCAGGATTCATTGGATTTTGTGGCGTATGTGGCTAAGTCTGCCCCACCAGCGGAATGGAGAGCATGTTATGTATTAGAGTGCGGTGGGAGATTGGCTCAAGATGTCATCGCGACCGTCGGACAGGCGTTTGAACTTCGTTTTAAAGAATTCTTGACGAAACCTACATCCTTGAACATCAATGGCTCGCGTCCAGTGTGCGGTTCTTCAGGGGAGGGTTTGGAAGAGCGCGAGTATTACAACGACATGCCCGACAAGATGCCGCCGGAGCCTACCAGCCACAGACACCCGCCTCCGCCGCCGCTCGCCACACTCGCACCTATATCATCATGTGAGGAGAGTGTACGTCACTATGTCAACCAAACCCCTCCCCCGCGGACCCCACCTACGGCGCTGCTGCCTAATCATCATACTGATATATTCGACATGCAGCCGTTCACAGTAGCCGCGGCGTCGTCGGCGGCGTCCACTTCTCCGTCGTCAGTAGCAGAGGAGCCGCCGCCTGCTCTGTCCGCGGCCGCTCAGTGCGCGCTGCTGGCCCGCGAGCCCTGGTACCACGGCCCTATATCGAGAACCGCGGCTGAAAGGCTGGTCGTGGAGGACGGCGAGTTCCTCGTCCGTCAGTCGGCCGCGTGTCCCGGGCAGTTCGTGTTGACCGGGGCACGCCGCGGGGCGCACAAACATCTACTGCTGGTCGACCCTAACGGCGTTGTGAGAACTAAAGACCGCGTGTTCGACAGCGTGCCTCATCTCATCAAATATCACTGTACTAATGAACTGCCAATAGTATCAGCTGATTCAGCGCTGCTCCTACGACTTCCGGTGCAGCGACCTTCCTGA

Protein sequence:

>DPOGS201490-PA
MGDNGPFVAKPARGWLHPDSVLASDGITYAVRYIGCMEVLTSMKKLDFETRSQVAKECIARVCAAAGLRTADKKRRVCQAAANALAARPRMSHSGSNVALTISSRAIILAALEGGETIARHDMPRVSFASGGDQDSLDFVAYVAKSAPPAEWRACYVLECGGRLAQDVIATVGQAFELRFKEFLTKPTSLNINGSRPVCGSSGEGLEEREYYNDMPDKMPPEPTSHRHPPPPPLATLAPISSCEESVRHYVNQTPPPRTPPTALLPNHHTDIFDMQPFTVAAASSAASTSPSSVAEEPPPALSAAAQCALLAREPWYHGPISRTAAERLVVEDGEFLVRQSAACPGQFVLTGARRGAHKHLLLVDPNGVVRTKDRVFDSVPHLIKYHCTNELPIVSADSALLLRLPVQRPS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: