MonarchBase - Protein-coding gene

DPOGS207840
Transcript	DPOGS207840-TA	4185 bp
Protein	DPOGS207840-PA	1394 aa
Genomic position	DPSCF300042 + 1102254-1115942
RNAseq coverage	635x (Rank: top 20%)

Annotation
*Heliconius*	HMEL015308	0.0	62.13%
*Bombyx*	BGIBMGA005521-TA	0.0	53.28%
*Drosophila*	Hip1-PA	2e-95	39.55%
EBI UniRef50	UniRef50_E0VES6	6e-140	47.03%	Huntingtin-interacting protein, putative n=10 Tax=Pancrustacea RepID=E0VES6_PEDHC
NCBI RefSeq	XP_001604846.1	1e-144	42.86%	PREDICTED: similar to huntingtin interacting protein 1 [Nasonia vitripennis]
NCBI nr blastp	gi\|345481802	1e-143	42.95%	PREDICTED: huntingtin-interacting protein 1 isoform 2 [Nasonia vitripennis]
NCBI nr blastx	gi\|345481802	1e-141	37.50%	PREDICTED: huntingtin-interacting protein 1 isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0003779	5.4e-63	actin binding
	GO:0005543	1.4e-62	phospholipid binding
KEGG pathway	tca:660136	2e-131
	K04559 (HIP1)	maps->	Huntington's disease
InterPro domain	[1187-1381] IPR002558	5.4e-63	I/LWEQ
	[58-319] IPR011417	1.4e-62	ANTH
	[54-176] IPR013809	6e-31	Epsin-like, N-terminal
	[59-171] IPR008942	1.1e-23	ENTH/VHS
Orthology group	MCL10862		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207840-TA
ATGGCAAATCCCGCTGAAAAACGCTTCTATCAACTGAACGCTACGGTTGTTGACATCGGCTTTGTTTACAAACGCCATTCTAATAATATGGCGCGCGAACAACGCAACGAAACGCCGTGTTCTAAATTTGAAATGAGTTTCATACGCTCACGCGTACATCGTATGAACACTTTAGCAATTCAAAAGGCTATAAATTCTATAGAGACGCCGGTTAAAGAGAAACATGTCCGCAGCACAATCATTGGGACGTTCCAGGAACAGAGCGCCGTCACATACTGGATGGTGGCCGTCCGTCTTCCTCTTCAGGACAACAGGATCGTGTCCTGGAAGTTCTGCCACGTCACACACAAGCTGCTCCGCGAGGGTCACCCCGCCTGCCTCGATGACTCGCAGCGGCACATTAACATGATTGAGAATTTGGGAAAGCTATGGGTTCACCTGCGCGAAGGTTACGGACGTCTAATAAGCTTGTATTGCAAGCTGTTGGTAACCAAATTGAAGTTCCATTCACGCAACCCTCGCTTCCCTGGCAACATGCAGCTCACGGTGGAAGAGTTGGACGCTATAGCCGAGAATGACGTCAACAATTACTTCCAGCTGTGCGTTGAACTTTTCGACTACATGGACGACATTCTTCAGCTGCAAGCAGCTGTGTTCGACAGCCTGGGCAATGCTAGAGCTAACTCTATGACAGCCAGCGGTCAGTGCCGGCTGGCGGCCCTCATCCCCTGCGCCCAGGACTCCTCGCACATATACGACTGTATCGTCAGGCAGATGTTCAGACTGCACGCCTCGCTACCGCCCGACGTGCTCGACGGCCACAGAGAGAGATTCAGGACACAATTCAAGAAGTTGAGTTCATTCTACAAGCACGCGAGCAGCTTACAGTACTACAGAAATCTTTTAACATTGCCAGTACTGCCTTCCAACCCGCCAAACTTTCTGCAACAGAGTGATTTCGGTACTTACGTCACGCCGGTGGTAACAATCCCTGACCTGCCCCCGGACGAGGTGGATGCTGTCGGGTCACTCATAGATACTTCTGACCCGGTCACTCAGGGCCAGATGCACAGCGAGGTGTCTGATACTCGCAGCACCAACTCGCCAGTTCCAGATCCCATTGTTGAGAGAGACCGACTCATAGAACACTTACAACATGAACTTAAAAGGATGAGATCTGAAGTGTCGCAGATAATACAAGAGAGGAACACAATGCTGGGGTCTATGAGAGAGCATTGTACACGGTTGGAGGCACAGATGCAAAATGTTAAGTCTGAATTGGACGATGAGAGAAATAAGGCTGAAAGTCTGGCGGCTGAGACACCGGAAATCAAAAAGAAATTAATGGACACCGAGGATAAGGCGAAGGTCATAGATGAGAAGTTTCAGAAATTAAAAGGCGCTTACACACAGCTGAGGGAAGAACACATAACGTTGATAAGACAGAAAGCCGAGGTCGACAAGCTCGCGTCCAAGCTGCGAGGCGAGGCCGCTCAGCACGAGGGCGCCACTAGCCTGTTACAGCAACAACTCAACGATCGAATGAAAGATGTCGAGCTTCTGCAACAGAAGGCATCGTCTAGTGAAGAAGTCGAAGCTTACAAAACCGAACTCACGAACCTCAGGACTGAGTTGGAACAGACCAGGCAGAAAGAAGTGGAACTACAAACACTGAGAACCAACTTCGAGGCTCTGGAGATTGAACACAACACAGTCAAAACTGTACAACAAGACAAACTGACAGCTCTCACTAACGATTTGAAAGAGACCAACGAGAGTTTAGAGAAGTTAAAGGCGGACTTCGAGGAGAAGGACAAAGAGCTGAGTAGAGTTAAAGAGGAATTGACAGCGGTGTTACAGAAGAGCGGTGACGAATATAAAACGGCGATTAAAGATAAAGAAGAGGCTTTGAAGCAGTTGGCCGAGATGAAAGCACAGTATCAAGAGGAAAGAGAGGAACGCATTATCCAAACTAACAATTTGCAAGCTGAATTAGAATATATCAAAGCAAAATTAACCGACACCCAGAATAATTTCGATTCCCAATGTCGCAAACTGAACGGAGAACTGAATTCGAAAAATGAGGAGCTGCAAGCTATACTGGATAAGAGAGATGCAGAAGCAAACGAGGCCATAGATAAACTCAGTTCGTTACAAAAACAGATAGAAACCTATCGAAACGATATCGAAACATCGAAGGCGACCATAGACAAACAGAATGAAGAAATAGACGAACTCAACAACAAAATAAACACACTCGAGGAAGATAAAGAGAATTCGATGATAGAGTTTGAAAATATGAATACGCTTAATAATATGTTAGACGAACAATTACAGCAGGAGACACACAAGAGAAACTTGCTTGACAAGGAAATATCAGAGAAAATAGTGGAAAATAAATCTAGACTACGTAGCAAAGATGATGATATAGAAACACTTAAAACCGACATAGAAAAGCTGTTCGTGGAAAGAGACGAAACATTACACGAGAGAAATAATTTACTATCAATAAATCAGGGACTACAAAAATCAATTAAGGAACTACAGAATAAGGAAAATGAATTAACAGCTGAGATTGAAAAGGCGAGAAGAGAAAACGTCACCGTAAGGAATACATTGCAAAGCGAAATAGATAATCTACGGTCCGCGTGTGTTACTATGGAAATAAGTAGAGATAATGTCGTGAGGGAACTGACGGATGAGTTTGGATTAAAAGAGGTCGAATTGAAGAGGGTCATTGCAGACAAAGACGCGGTGTTGGCCAGAGCTAACAAGGACCTGGAGACATTGAAAACTGAGGTTGCAAAGTTGACAGAGATCCAAACTGAAGAGAGGCAAGCGTTGACTAGATCTATGTCTGAGAGAGAGAAAAATATACAGTTGACCGAGGCTAGATTAGAGCACACGGAGAGCGAACGACTCACCGCGGAATGTGAATTACAGGACCTCTTGCAGCAAAACACTATCATGGAGGCCGATCTGATGTCCTTAAAGATACAGCTGGACGAGAAGGACCAGCTCATCAAGAAACAAGCTAGTAAGATATTGGCGTGTGCGACTGAAGCTGCGTTGGATATAACGAACGAGGCGATCTCGGCGTTTGAGAACTCAAACGCTCAAGATACTAACAAAAGAGCCGGCGAACACGCGGCTAAGGCTTTCGAAACAATCGCCAGGAAGCATAAGTTGGAGGGTAACGAGGAGCTGGTGTCGAGGAGCGTCCTCTCAGCGGCACACAACACGGCCAGGGTGTCGTACATCGTGTCTGACGTCACCAACACCACAACTGATATGGAATTAGCTGAAAAACTGAGCAACGACTGCCGGACGATGCTGGCGAACACGAAGCAATGTCTAGAGAATATATCGACGGGTGCCATAGACGTGACGCAGTGTCTGGCGACCGGAGCCAGCGTCACCAGGCTGTCGAGAGCCGCGGCCGATGACGTCACCGACACGAGGGGCGTGGACGACGAGCTCGCCGACATGGACAGGGCCATAGAAGTAGCGGCGAAACAGATTGAGGACATGTTGGCTGCAAGTCGAGCTGGTGACACGGGCGTCAAGTTGGAAGTGAATGGCAAGATCTTGGACGCGTGTACGACCCTCATGGCTGCCGTCAAAGTGTTGGTCCAGGACTCCAGGAAGCTTCAAAATGAACTCGGGGACCCGAAGACACGACAGAACATGTACCGCAGGAACCCTCAGTGGTCGGAGGGCCTGATATCCGCTTCCAAAGCTGTGGTCTTCGCGGCTAAGTTGCTTGTTTCATCCGCGGACGAGGCTGTGGGTGCGGCTGGTCGGGTTGAAGGTGTGTCAGCGGCGGCCCATGAGGTGGCGGGGAGCACGGCACAGCTGGTGGCCGCTTCGAGGGCGAAGGCTCCGCCCGCGACACCCGCGCTCGCGAGACTCACCGCCGCCTCCAGAGCTGTGGCCGCGGCAACCGGCGCTGTAGTGGCCGCGGTCAGAGGCGCCTCCGCATTAGTTAGAGATCAGGAAACCCTGGATACTTCGAATCTTTCACTAACTGCTACCCGGAGACTGGAGATGGAAAGCAAAGTACGTGCTCTGGAACTGGAGAGTGCTTTAGACGCTGAGAGGAACCGGCTGGCTGCTCTCAGGAAGAGACACTACAACCTCGCACAGATGCACGAGAACGGAACTATAACAAACGGAGATGAATGA

Protein sequence:

>DPOGS207840-PA
MANPAEKRFYQLNATVVDIGFVYKRHSNNMAREQRNETPCSKFEMSFIRSRVHRMNTLAIQKAINSIETPVKEKHVRSTIIGTFQEQSAVTYWMVAVRLPLQDNRIVSWKFCHVTHKLLREGHPACLDDSQRHINMIENLGKLWVHLREGYGRLISLYCKLLVTKLKFHSRNPRFPGNMQLTVEELDAIAENDVNNYFQLCVELFDYMDDILQLQAAVFDSLGNARANSMTASGQCRLAALIPCAQDSSHIYDCIVRQMFRLHASLPPDVLDGHRERFRTQFKKLSSFYKHASSLQYYRNLLTLPVLPSNPPNFLQQSDFGTYVTPVVTIPDLPPDEVDAVGSLIDTSDPVTQGQMHSEVSDTRSTNSPVPDPIVERDRLIEHLQHELKRMRSEVSQIIQERNTMLGSMREHCTRLEAQMQNVKSELDDERNKAESLAAETPEIKKKLMDTEDKAKVIDEKFQKLKGAYTQLREEHITLIRQKAEVDKLASKLRGEAAQHEGATSLLQQQLNDRMKDVELLQQKASSSEEVEAYKTELTNLRTELEQTRQKEVELQTLRTNFEALEIEHNTVKTVQQDKLTALTNDLKETNESLEKLKADFEEKDKELSRVKEELTAVLQKSGDEYKTAIKDKEEALKQLAEMKAQYQEEREERIIQTNNLQAELEYIKAKLTDTQNNFDSQCRKLNGELNSKNEELQAILDKRDAEANEAIDKLSSLQKQIETYRNDIETSKATIDKQNEEIDELNNKINTLEEDKENSMIEFENMNTLNNMLDEQLQQETHKRNLLDKEISEKIVENKSRLRSKDDDIETLKTDIEKLFVERDETLHERNNLLSINQGLQKSIKELQNKENELTAEIEKARRENVTVRNTLQSEIDNLRSACVTMEISRDNVVRELTDEFGLKEVELKRVIADKDAVLARANKDLETLKTEVAKLTEIQTEERQALTRSMSEREKNIQLTEARLEHTESERLTAECELQDLLQQNTIMEADLMSLKIQLDEKDQLIKKQASKILACATEAALDITNEAISAFENSNAQDTNKRAGEHAAKAFETIARKHKLEGNEELVSRSVLSAAHNTARVSYIVSDVTNTTTDMELAEKLSNDCRTMLANTKQCLENISTGAIDVTQCLATGASVTRLSRAAADDVTDTRGVDDELADMDRAIEVAAKQIEDMLAASRAGDTGVKLEVNGKILDACTTLMAAVKVLVQDSRKLQNELGDPKTRQNMYRRNPQWSEGLISASKAVVFAAKLLVSSADEAVGAAGRVEGVSAAAHEVAGSTAQLVAASRAKAPPATPALARLTAASRAVAAATGAVVAAVRGASALVRDQETLDTSNLSLTATRRLEMESKVRALELESALDAERNRLAALRKRHYNLAQMHENGTITNGDE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: