MonarchBase - Protein-coding gene

DPOGS200350
Transcript	DPOGS200350-TA	1197 bp
Protein	DPOGS200350-PA	398 aa
Genomic position	DPSCF300026 + 557372-568780
RNAseq coverage	925x (Rank: top 14%)

Annotation
*Heliconius*	HMEL000036	2e-114	72.12%
*Bombyx*	BGIBMGA005643-TA	6e-96	61.40%
*Drosophila*	wash-PA	1e-19	27.08%
EBI UniRef50	UniRef50_D0AB84	5e-112	72.12%	Putative WAS protein family homologue 1 n=2 Tax=Nymphalidae RepID=D0AB84_9NEOP
NCBI RefSeq	XP_968173.1	1e-46	32.29%	PREDICTED: similar to open reading frame 19 [Tribolium castaneum]
NCBI nr blastp	gi\|261335946	2e-111	72.12%	putative WAS protein family homologue 1 [Heliconius melpomene]
NCBI nr blastx	gi\|261335946	1e-135	58.72%	putative WAS protein family homologue 1 [Heliconius melpomene]

Group
KEGG pathway
InterPro domain	[192-260] IPR021854	1.4e-17	WASH complex, subunit WASH
Orthology group	MCL10947		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200350-TA
ATGGAGGGTCTTTATAAAATTAATTTGATACCCAACGACCTTAGCGTCGAAGAAACCGTGTTACAAATAGCCGATACATTAGACAATCTGAATGGGATAGTTGACGATGTTTTTAAACGTATATCAAATAAAATTAAAATCAACGTTGAAAAGACGTCGAAACTTCAGGAGAGAATCAATGTATCCAGGACAAAAGTTGAAAAACTTGCCGGGACACAGAAGGCGATCAAAGTATTTTCAAGCGCTAAATACCCGTCGTCTATAACACACGAACATTACAAATCCATTTTCGAATCAAACGATTATAATTATGAACCCAAAAACGTTATACCAACCGGAAAATCCAACAGACAGACAAACGAAAAAGCCATCCAGGAGAAACTTCATTTCTTCCACGTGAAAGTCGCTGAACCTAAAAATAATAAAACCAGGAACGATTTCGATCTGAATACGGTTTTGAATTCAATAACATCAATCGGAGATCTCCTTATATACAAGAGCGACGAGAGCCCGTACTTTGGTAGTAAAACCAAAGGGCAGACTTACGTGCCCAAAGTAAACACGACCGTAGATAAGGGCTCGTTGGACGAAGCACCACCCTCTATTGTGAAAAAGAATCTGTTGAAGCGAGAAATCGACGAGTACATGTACGCTCCAGGAATGGGCTTGGTGCCAGAATTGGACATGCCCCTGGATCTTCCACATCTTCCCGGTATAGCCGGGGACGTTCAGTATTCGGTTACTGGGGATGGGTCTATAGCGCCATCAGCTGTAACATCACCCGTCGCCATCACAAACCCCATCCCCCGCCCCCGCCGCCACCACCCCCGCCGCCGATGGAGATCACACAAACGCCAAATAGCTAATTTTGGGTTCCTTGTCCACAGACGAGAGCAGCGTGAAGCTAGTGCTGCTGCCCCGCCTCCGCCCGTGGATGCCCACGCGAACCTGATGGCGGCCATCCGGCAGGCGGGCGGCGTCGGACGGGCGAAGCTGCGGCACGCTGACGACGTAACAACAGAAAAGGCGAGCAAACCTGTCGGTGGCGATCTGATGGCTGATCTTCACGCCAAGCTGTCGATGCGTCGTCGTGGCATATCGGGTGCTGAGGGTACCGTGCTTCATACGCTGGCGAGGGTTATACCGGAACCGGGGGAAACTACCGAGAGGTCCTCCAGCGACGACGAATGGGATTAA

Protein sequence:

>DPOGS200350-PA
MEGLYKINLIPNDLSVEETVLQIADTLDNLNGIVDDVFKRISNKIKINVEKTSKLQERINVSRTKVEKLAGTQKAIKVFSSAKYPSSITHEHYKSIFESNDYNYEPKNVIPTGKSNRQTNEKAIQEKLHFFHVKVAEPKNNKTRNDFDLNTVLNSITSIGDLLIYKSDESPYFGSKTKGQTYVPKVNTTVDKGSLDEAPPSIVKKNLLKREIDEYMYAPGMGLVPELDMPLDLPHLPGIAGDVQYSVTGDGSIAPSAVTSPVAITNPIPRPRRHHPRRRWRSHKRQIANFGFLVHRREQREASAAAPPPPVDAHANLMAAIRQAGGVGRAKLRHADDVTTEKASKPVGGDLMADLHAKLSMRRRGISGAEGTVLHTLARVIPEPGETTERSSSDDEWD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: