MonarchBase - Protein-coding gene

DPOGS209104
Transcript	DPOGS209104-TA	1242 bp
Protein	DPOGS209104-PA	413 aa
Genomic position	DPSCF300268 - 187477-190788
RNAseq coverage	1x (Rank: top 94%)

Annotation
*Heliconius*	HMEL014464	1e-131	60.92%
*Bombyx*	BGIBMGA002252-TA	2e-64	52.30%
*Drosophila*			%
EBI UniRef50	UniRef50_D6X048	3e-09	22.00%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6X048_TRICA
NCBI RefSeq	XP_968384.2	4e-10	22.00%	PREDICTED: similar to Huntington disease gene homolog [Tribolium castaneum]
NCBI nr blastp	gi\|189240623	8e-09	22.00%	PREDICTED: similar to Huntington disease gene homolog [Tribolium castaneum]
NCBI nr blastx	gi\|332029301	7e-09	21.35%	Huntingtin [Acromyrmex echinatior]

Group
KEGG pathway	tca:656784	1e-09
	K04533 (HD)	maps->	Huntington's disease
Orthology group	MCL12692		Patchy

Nucleotide sequence:

>DPOGS209104-TA
ATGTATGTTTGTCTCCAGGAGGTGTCCAGTGTTCACGAGAAGCTTCTCAAGTCGTTATCATCTGGGGCGGCTGCGGTCCGTCAGGCGGCGCTGAGGGGCTGGCTGTTACAGCTGGCGGGGAGAGGGCCGGGGGACGCCGCCGGGGCGCTCCGGGACAGTGTGAGGTGTGGAGGGGATAACAGGCTATCACCACACGAGCAGAGTCTCAACTGGTCGGTACTGTTCACACTAGTGGAGCTGGGTCACAGTGATCTAATGCATACAGCTGTTGACTTTGTATTGAATAAACCTAGACATTATTGTACGGATCTTGTTGTTAAGGGTATAACTTCCGTGCTGCGGCAACAAGTCCTGTCGAAGGACCTCAAGAAGTCTATCATAGAAAAACTGCTGGACAATATGAAGATGTACTCGGAGCACCACGCGGTTCAGATACTGATGGTGCATTTGTTCTCTGCGGACAGTAAGCTGATAAGTCCAAGATTCGAAACCGACGTGTCCAACATGGACCCGGACGTGCTGATGAACTCAATGGAACGCATAACGCTGCTGTACAAAGTCCTGAAGCAGTGTAAATATAGAGAGAACCAACAGATCTGTACCGCGACACTGAAATATTTCCTGCGAGAGACTCTACCGCCGGCCGCGACTCTGAGTAGAGTCGTGATAGAGTATTTGGAGTGCTGCAAGGAAACGGAAAGGCTAAATATGACTGCACTCAAAGAATTCAACAATAACATAGAATGTGCTATCATGAACGCTGATATTGTGTTCGAGGTATTCAACACCTCTATATCTCAAGATCAATTGCCAGTTCTAAGCGGTTGGATATTTGAAGCTCTCTGTCATTTACTCTCAGGGAAGATATCACATAAGCTGGTCCCGTACTGTTTGCTCACGTTATTGGTGTCCGCATCCGCCAACGCCAACATAAGGACGTTACATCCGCTAACATATTACATATTCAGACAGGGACTGCATAATAATTCCATGTACATGAGGAATAACACGGATGAAAATGATAAAAATGATGTTTTAACCCCGAGTAGGACTGATTCGGGCCAAAACTGGGGTATATTTGGTGATTTTACAAGAAATACGCCAATGTCGTTCACCGACAGACGTCTTCTATGCATAGTGGCTCTGCATTCAAATTTCAGCTCCAACCAACTGGAGAGGTTGAAGCAACTGTGCGAAGGGAACGAGTTTTTGGGAGATCTGATGAGATGTTTAACGGAATAA

Protein sequence:

>DPOGS209104-PA
MYVCLQEVSSVHEKLLKSLSSGAAAVRQAALRGWLLQLAGRGPGDAAGALRDSVRCGGDNRLSPHEQSLNWSVLFTLVELGHSDLMHTAVDFVLNKPRHYCTDLVVKGITSVLRQQVLSKDLKKSIIEKLLDNMKMYSEHHAVQILMVHLFSADSKLISPRFETDVSNMDPDVLMNSMERITLLYKVLKQCKYRENQQICTATLKYFLRETLPPAATLSRVVIEYLECCKETERLNMTALKEFNNNIECAIMNADIVFEVFNTSISQDQLPVLSGWIFEALCHLLSGKISHKLVPYCLLTLLVSASANANIRTLHPLTYYIFRQGLHNNSMYMRNNTDENDKNDVLTPSRTDSGQNWGIFGDFTRNTPMSFTDRRLLCIVALHSNFSSNQLERLKQLCEGNEFLGDLMRCLTE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: