MonarchBase - Protein-coding gene

DPOGS203998
Transcript	DPOGS203998-TA	3141 bp
Protein	DPOGS203998-PA	1046 aa
Genomic position	DPSCF300005 + 1471103-1480308
RNAseq coverage	1x (Rank: top 93%)

Annotation
*Heliconius*	HMEL013863	78.34%
*Bombyx*	BGIBMGA002144-TA	80.72%
*Drosophila*	CG9492-PA	55.52%
EBI UniRef50	UniRef50_Q9VH97	55.52%	CG9492 n=24 Tax=cellular organisms RepID=Q9VH97_DROME
NCBI RefSeq	XP_002431951.1	60.33%	dynein heavy chain, cytosolic, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242023054	60.33%	dynein heavy chain, cytosolic, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242023054	60.33%	dynein heavy chain, cytosolic, putative [Pediculus humanus corporis]

Group
KEGG pathway	cre:CHLREDRAFT_137221	5e-38
	K10408 (DNAH)	maps->	Huntington's disease
InterPro domain	[251-814] IPR013594	5.7e-123	Dynein heavy chain, N-terminal domain-1
Orthology group	MCL24850		Lepidoptera specific

Nucleotide sequence:

>DPOGS203998-TA
ATGTTCGTGTGTGGTATTAAACCTGGTTCTAGTGAGGAGGAAGAAGAAGATGTAATGGATATTCTTCAGAAAAGACGCGAAGAATGCGAAAGAAAAGCAAGAAGGGGGGAAATGGACCCCAGGTTGGAGTTCACTTTCCAACTTCTTATCGATGGTACAGGCCTACCACGGCATGCCATCATGGATCACGTTTTCGAAGGAAATATGCTAGATGATATAAATCAATTGTTTCTTCCACACATGAGAAATAAGCTGCTGTGGTATTACCAAGATGTAGAAGAAGTGGAGCAACGACCTGTAGTAGAAGGAAATAAGTCTAGACAGCAGAGCCAAAGCAAAGTTCCACCTCCTCAAATAACAATGAAGAAAAAGCTGTTTTTGTCCGATGGGTGGGATGTTCGATTTACAGGAGTCTGTATATACATGTTTCGTATTAATGTAAGCAAGCAATTACCCGAGGAAGGCTTTCATAAAGATTTATTTTGTGGCATTCTTAACGCTGAAAAAGTGGGTTTGGTGACAGCAATAGAACGTGTGATGGAGTACGTGTATATGAGCGCCCTGGCACATCCTAGCAGTGATGGCGATGAAGACGAAACACGCTTCCCCATTGTCAAGAATCAACTTTTGCCTGGCTTACGGTCCTTTTTCTGTGAAGATGTCTGCAATCAAGTGAATCTATTCGACGATGGCAAAGCCCTAATGGCAAATCTGAAGGATCAAACCGAGTTGAAAGAAATGGTTAAGAACTCTAGCAAGCTTATACTTCTCGAGGAAAGAGTTAATGAGTGGATTAAAAAAATTATGGAGATATTAAGTGAAAGTGAGCAGCTTCGTCGTGAAGTGGATTCGAGTGGACCCCAAGATGAGCTAGAATATTGGAAGAAAAGAGGAGCACAATTTTCTCAACTTGTTTCTTATTTACAGGACAGTGAAGTGCAGCTTACTTTAACGTGTCTTCAGCTGGCTAATTCTAAAGTTATTAAACTTTGGCGAGAAACAGATCATAAGATTACATTCTGTTACAATGAAGCTAAAGACAATGCCAAGTTTATTCAGGCTATGGAGAAGTGTTGCCACTCTTTGTATTTGGACGATCCGGTTAAAATCAAGGACTCCATATTAAGTTTACTCCAAACTGTCAGATTAATTCACAGTGTATCACAATTCTATAACACTTCCGAAAGAATATCATCTCTGATGGTTAAGATAACGAACCAAATGATTGAAACTTGTAAACAATACATAACCTGCCGTTCCAAAGAAACTATTTGGTCTCAAGATCGTGATTCTGTGAGGGATAAACTTAAACATTGCATAAACCTCAATAAAACCTATAGAGACACTTATATCTTTGTTAAGAATCAAACATTTTTACCAAATACTGAACAGTTTAGTTTCTCTGAGAACTATGTATTCGGAAAATTTGATACGTTTTGCAAGAGGTTAAATAAAATTTTAACTATGTTCATACTGATGGATGATTATAATCATTTGTTTGAAAAACGGATGGAAGGACTACTCTTAGGCGAAGACCTCGAAGATGCAATGCACTCTTTCAATGAGGCAAAAAAGGCGGTAACGTCATGTCAATATGACTACCTAGATTACCGAAATAACGATTTCGATAAAGATTATCAGGCCTTTGAAGATAAAACTCATACCTTGCGTGAGTCTATTGGTCATACAATTGAAGTAAACTTTGCTAGTGTTTGGGAAACTCCACAGGGAATTAAGTTCCTCACAAGATTTGAGAAGGTCAGTCAAAAAATTCAAATAACAAAACTGAGTGAAAAATATGATAGAGTACTGAAATATAGCGAAAAAGAGGTTGATAAAATAATGAAAATGTTTAAGAGACAAAAGGATGATCCACCGTTGCCCAGAAATTATTCTCCTGTCGCGGGTCGTATAAAATGGGCCCGATGTCTCATGTACAACATGACTGAAACTGTAGAAAGCGTATGCTCGCACGCTGCACTGAACTCGCTACCGACAGCCGCGGATATGATGCGCAAATACGCTACTACACGCACTCTAATACATAACTACGAGGAAAATATGCGAGCTGTTTGGATGAACCAGAATCTCTGGGATGTAGACGACAGTTTGAATAATACAATACTTAAAATAGATGACTCTGGAAGGATCGTTGTCAATTTGGACCATACTATAAAATTACTAATAAGGGAATCGGATTGCTTAGTAAAAATGGGCTTAGAATTGCCTATCGTTTGCCACTCATTATATTCAAAGAAGAAATATTTTACACTAGTAAATGACTCATTACAATTCCTTTTGGAAGACTATATGCGTAGTGTTCGTCAAGTGAAACTAGAAGTAAGACCATTGTTGTTGCCGCAAGTTGTCCGTCTATCTTCACTACTTCTTCCTGGAATACGTTCTGTTTCTTGGACTTGTGAGGAATGGAAAGAATTTGTCGATCGTGCAAATTTTGCTATAAAAAGCTTTGATGTCCTCGTAACCAGAGTTCATGATATTTATAGCAACCGAATCATTTATATGCTGTCCGGTATGCAAGAGGTATCGTTATTAACTTTACCAGATGAAATGCCTTGGTCGGTTGAAGAATTTATTGAATGCGTCGAGACAGGATGCCGATCGGCTTGTGTAGAGCTAAATCGAAAAAGTTTGATGGTGGAAGAAGCAGTAGAAGAAGTATTAGATCTAGTGAAAAAAGCAGCTCAGCAAGTAAAACCTACCGAAATCAACCCAGACTTTGAATTTCTTATCGCTGACGATGATACTCAGTTGATGAGCGGTGCTGCGTCAACGATGAATGAGTCAACCGCCAGCGGTCAGCAGGACTGGTCAGCTGTCTGGGAGTGTTTCGAAAGCCCCCACAGACTACTCTCTGTCCCCGCTGGTGGACTTTCTAAAAGTATGCAGGAGATGGTAAAGAATGCAGTTAATGAAATGCGGCGTTACTATAGTCGTAAAGTTGTCGACGTACTTATAAAGGTCACAAGACGAGCTTTGGATTTGATCATCAAGCAATTCTCTTGCGACTCAGAAGTCATAGTTAAAAACAATCTCAATGAGCTAACCGCGTCAAAGTTTTTGAAGACGGAAGAGATTAAACCTTTTCTTATGACGTTCTATGTGATTTTAGATATTTAA

Protein sequence:

>DPOGS203998-PA
MFVCGIKPGSSEEEEEDVMDILQKRREECERKARRGEMDPRLEFTFQLLIDGTGLPRHAIMDHVFEGNMLDDINQLFLPHMRNKLLWYYQDVEEVEQRPVVEGNKSRQQSQSKVPPPQITMKKKLFLSDGWDVRFTGVCIYMFRINVSKQLPEEGFHKDLFCGILNAEKVGLVTAIERVMEYVYMSALAHPSSDGDEDETRFPIVKNQLLPGLRSFFCEDVCNQVNLFDDGKALMANLKDQTELKEMVKNSSKLILLEERVNEWIKKIMEILSESEQLRREVDSSGPQDELEYWKKRGAQFSQLVSYLQDSEVQLTLTCLQLANSKVIKLWRETDHKITFCYNEAKDNAKFIQAMEKCCHSLYLDDPVKIKDSILSLLQTVRLIHSVSQFYNTSERISSLMVKITNQMIETCKQYITCRSKETIWSQDRDSVRDKLKHCINLNKTYRDTYIFVKNQTFLPNTEQFSFSENYVFGKFDTFCKRLNKILTMFILMDDYNHLFEKRMEGLLLGEDLEDAMHSFNEAKKAVTSCQYDYLDYRNNDFDKDYQAFEDKTHTLRESIGHTIEVNFASVWETPQGIKFLTRFEKVSQKIQITKLSEKYDRVLKYSEKEVDKIMKMFKRQKDDPPLPRNYSPVAGRIKWARCLMYNMTETVESVCSHAALNSLPTAADMMRKYATTRTLIHNYEENMRAVWMNQNLWDVDDSLNNTILKIDDSGRIVVNLDHTIKLLIRESDCLVKMGLELPIVCHSLYSKKKYFTLVNDSLQFLLEDYMRSVRQVKLEVRPLLLPQVVRLSSLLLPGIRSVSWTCEEWKEFVDRANFAIKSFDVLVTRVHDIYSNRIIYMLSGMQEVSLLTLPDEMPWSVEEFIECVETGCRSACVELNRKSLMVEEAVEEVLDLVKKAAQQVKPTEINPDFEFLIADDDTQLMSGAASTMNESTASGQQDWSAVWECFESPHRLLSVPAGGLSKSMQEMVKNAVNEMRRYYSRKVVDVLIKVTRRALDLIIKQFSCDSEVIVKNNLNELTASKFLKTEEIKPFLMTFYVILDI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: