MonarchBase - Protein-coding gene

DPOGS211052
Transcript	DPOGS211052-TA	1227 bp
Protein	DPOGS211052-PA	408 aa
Genomic position	DPSCF300202 + 298027-301715
RNAseq coverage	845x (Rank: top 15%)

Annotation
*Heliconius*	HMEL004334	5e-118	69.07%
*Bombyx*	BGIBMGA003753-TA	2e-74	57.31%
*Drosophila*	Stam-PA	4e-100	47.00%
EBI UniRef50	UniRef50_E0W250	5e-102	49.51%	Signal transducing adapter molecule, putative n=3 Tax=Pediculus humanus corporis RepID=E0W250_PEDHC
NCBI RefSeq	XP_623539.1	8e-105	48.20%	PREDICTED: similar to Signal transducing adaptor molecule CG6521-PA [Apis mellifera]
NCBI nr blastp	gi\|383859688	2e-105	48.67%	PREDICTED: signal transducing adapter molecule 1-like [Megachile rotundata]
NCBI nr blastx	gi\|383859688	2e-101	47.74%	PREDICTED: signal transducing adapter molecule 1-like [Megachile rotundata]

Group
Gene Ontology	GO:0006886	8.5e-25	intracellular protein transport
	GO:0005515	7.5e-20	protein binding
KEGG pathway	ame:551140	2e-104
	K04705 (STAM)	maps->	Endocytosis
			Jak-STAT signaling pathway
InterPro domain	[5-140] IPR008942	6.1e-32	ENTH/VHS
	[10-141] IPR018205	1.4e-28	VHS subgroup
	[6-138] IPR002014	8.5e-25	VHS
	[202-257] IPR001452	7.5e-20	Src homology-3 domain
Orthology group	MCL12041		Single-copy universal gene

Nucleotide sequence:

>DPOGS211052-TA
ATGGGTATCTTTGGAACCTCGTCTCCATTTGATCAGGATGTAGAGAGAGCGACCAGCGAGAACAACACCAGCGAGGAGTGGGGCCTCATCCTGGAGATCTGTGACCGAGCGGGCTCCGGGCCCGCCGCGGCCCGGGACTGTCTGCCCCGGCACGACGCCGCCGAGCCACACGCCGACCCGCACGTGCAGGTGCACGCCGCTACTCTCCTGGACGCGTGCGTCGCTAACTGTGGCCGTGTTTTCCACCTCGAAGTGGCGTCGCGGGACTTCGAGGCCGAGTTCCGTCGCCTGCTGTCTCGCGCCCAGCCTCCTGTCGCCGGCCGTCTCCGCGCTCTGCTGCGCAAATGGGCCGAAGGAGAGTTCCGCGACGATCCCCAGCTGGATCTCATCCCCTCCCTCCACGCCAAGCTAAGCGCGGAGTCCGGCGAGCGCGTGTCGTCGGCCGCCGCGCCCGCAGCCGACGCTCAGACCGTCCTAACGGCGGCAGAAAGGCGTGAACAAGAGGAGCTGGCTCGCGCCATCGCATTGTCGCTGCGCGATTCAAGTGGGTCCGGGGGGGCCGCGGGGGCCGGGGCACGCCGGGGGCTCGCTATATCCGCGCCGATGAAGGTGCGCGCCCTATACGATTTCGAGGCGGCCGAAGATAACGAGCTTACTTTCCTAGCGGGAGAAATCGTTCACGTGACAGACTCCAGCGATCCTAATTGGTGGAAAGGTCACAACGAGCGAGGAGAGGGTCTCTTCCCCGCCAACTTCGTCACGTCCGACCTCACCGAGCCCGCGCCCGAATCCGAGAATCGATCGAACTCGGGCAAGACGGTTCAGTTCGCGGAGAGCGCGGGCGGGGCCGAGCAGCCCGCGCGTATCGACGAGGCCGTCGTGGACGAGGCCCTGGCGCTGCTGCACGAGGCTGACCCCGCCGCCGACGACGCCACCGGGCCTCGCCTGGCCCGCGCCGAGGCCGCCGCGCACGCCATGGGTGCTCTAGTGGACGCCGCACTGGAACGCGCGGACCGCCGCCACGCTCGCCTCACGCAGCTCAGCGCCGACCTCGTGGACGCACTCAACCTCTACCACGACCTGATGCGCGCGCCGCCCACCTTCCTCCCCCCTATGCACTACGCCCCCGGCCCGGCCGCGGCCACCCTGCCCCCTCCTCCCCCCGGCGCCCTGCTCCCCGGCCCGCTGCCGTCCCTCGCCCCCCACCACCCGCAGCCGCCGCGGTGA

Protein sequence:

>DPOGS211052-PA
MGIFGTSSPFDQDVERATSENNTSEEWGLILEICDRAGSGPAAARDCLPRHDAAEPHADPHVQVHAATLLDACVANCGRVFHLEVASRDFEAEFRRLLSRAQPPVAGRLRALLRKWAEGEFRDDPQLDLIPSLHAKLSAESGERVSSAAAPAADAQTVLTAAERREQEELARAIALSLRDSSGSGGAAGAGARRGLAISAPMKVRALYDFEAAEDNELTFLAGEIVHVTDSSDPNWWKGHNERGEGLFPANFVTSDLTEPAPESENRSNSGKTVQFAESAGGAEQPARIDEAVVDEALALLHEADPAADDATGPRLARAEAAAHAMGALVDAALERADRRHARLTQLSADLVDALNLYHDLMRAPPTFLPPMHYAPGPAAATLPPPPPGALLPGPLPSLAPHHPQPPR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: