MonarchBase - Protein-coding gene

DPOGS211202
Transcript	DPOGS211202-TA	3342 bp
Protein	DPOGS211202-PA	1113 aa
Genomic position	DPSCF300007 + 860121-867032
RNAseq coverage	12x (Rank: top 83%)

Annotation
*Heliconius*	HMEL012455	85.16%
*Bombyx*	BGIBMGA001869-TA	79.91%
*Drosophila*	Dhc62B-PC	37.78%
EBI UniRef50	UniRef50_E0VN31	42.65%	Dynein beta chain, ciliary, putative n=13 Tax=Metazoa RepID=E0VN31_PEDHC
NCBI RefSeq	XP_002427535.1	42.65%	dynein beta chain, ciliary, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242013690	42.65%	dynein beta chain, ciliary, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242013690	42.65%	dynein beta chain, ciliary, putative [Pediculus humanus corporis]

Group
KEGG pathway	nve:NEMVE_v1g246369	2e-111
	K10408 (DNAH)	maps->	Huntington's disease
InterPro domain	[656-1092] IPR013602	3.2e-112	Dynein heavy chain, N-terminal domain-2
Orthology group	MCL10001		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211202-TA
ATGGAAGAGAGCGAATTGAGAAAACTGTTGCAGACCAAAAATGGTTGTAGAATTCCTGTCATGCTTCCGATACCGGATGTGCATAAAGTAGACAAATTGCCTTTTATGCCACTGCCGCCTTACAACAGAATTAAGGACAAGAAACAAAAATTTCGTCAATTACTGGAGGAAAAAGCTACAAAGAGAAAAGTGAACATCGCTAGATCTTCGTTTGAGTATAGTGAGTGTGATGCTTTAGAAATATCTCAAGAAAGACATATAGCTGTCCTACGTCAATGTGCGGAAAAAGTGCAACCACCTCCAATGTTAAAATCTTGGGAGAGAAAAATATTCAGTTTAATACCACCTAAATTAAGAAATGCCTATCCCACAATAGCGGAGGATCTTTTAAAAGAGAGTAAAAATGAATGGAACAGAAATCTCCATGACTTGGCCGTAAAAACTGTAATCCGTGATGTTCCTGGAGTACCTAGAAAAAGATATGAGGAGCCACACTTTAAATTTCATGGTGTTACACCGAATTATGAGAAAATGGTCAAGTTTAGAAAGAAGTTACAATCTGGTTCATTACTCCTACATCCATTTATAAGACTTGTCTTAGAATCATCCGAAAAGACGTTTCCAGAATTTATAATTAATTTGTCAAAATACAGAGCGAAGGGACCATTTCATTTGGATGATTTTCATACTAAAGTATTGGAAGAGATAAAAAAAGCTGATTACTTGGTATCCAGTACTTGGTATTCAATTTTAGCGAATTGGTTAAAAAATCCAAGATGCTTGAAAGGCATGAAACCTAAAAGAATACCCGATTTTGTATCATGTGCTACTAAAATTATATCGATGCAAATACAAGAACTCATGCGTCGATCTATTGATGCAATAATAACTTCGCTGGGGAACCCCGAGTGCGTTCCAATCATAAACATAGATTTAGATTTCAATGGCGAATTTATCTATGATCCATCTCTTGAAGAGGTTTTTAATGTTTTCCATAATATAGCCGATGCTATTGCACACATAGCACAAAGGCTAATGCCAATTGAACAATACCTAAAAATACCATATAACTATGATGCTCTGCCTGTTAAGTACAATGATTGGTTAAATAAAGATAGTCACGATAGATTACAGCAGCAGTTGAATATAGTATTTGAACCCCTCGTTCAATATTTAGTTGATCTAAGAGTAGCTTATAGTATGCTGTATGGGGCGCCAGCAAAAACACAGCTTTCTAAATTTATTAACCAGGCCAAGGAGTTTGAAGAGTCGCGAGACAAAATAAAATATTTTCAAGAAATAGATTCTGATATTACAGCTGTTCTGGAAAATGAATATTTTAATTGCGCTATTGTTTGTCAACGGAGAATGATAAACGGGTTGAAAGCTAGAGCTCTAGAATTCATAAATGACATAATTGCTGGCATTGTAAAAACTCATATGGGTGAAAATGATAGCATTTGCAAAGAATTTGAAATTATAGCAGCAAAAGCACTGAAAGAACCTGAAAATGCTGCGGAATTGATTGAACAAGGTGTTTACATTTTACATGCTAAGACCGTCTTGGTAGAGGTTTTAAAAGAGAGAATATTGAGACAAATAAACATAATCTCCAATTTGCTAGAAATGACTTCTCTTTCTCCGGAGCATGTGGCTTCTAATACTCGCACTGTAAATTGGCTCACCGATATTAAACCAATTTTTGAGAGAAATGCTACAGCATATGAAACATTTAAAGCTGAAATGGAGGAAAATCTTTTAACAAAAATTGCTTATTTAAACAAAGAGGTTTCAGAAATAACACCGTATTTAGAGCTTTTAGATAATATGGATGACATAGATCATACTCTTGAATACTTGGAACACCTGAGAAAGTTAGTGCATCGCCTGGATGATTGTGACAAATTAGTCAGTTGGATAAATAACGAGGAAGTAACATTTAAGTTTCCAGTTTCCCACTATTCTGATCTCGAAGAACTAAAAGATTTTATTAAACCTTTCCATAATCTAACGTATTTAGTTCATAAATGGAAACGAAGTTTTTACACTTGGATGGATGGTCCGTTCGAGTATTTAGATCATGAGAAAATTGAACAAGATCATGATTTTTACTACAAAGAATTTCTAAAATTGTCTAAAGCTTACAGAACTAAAATAAAACAACAAATATCGGAAGGCGTAGAAAAGAGATTTCAAGGTTTAGTCGACGATCCCGATATTAATAATTTACCAGCGCCAATGAAACTGTGTGCACAAGCTATAGCCGAAATAAAAAGCTGGCGCCCAAATGTTCAAATGGCACACATAATGTGTAACCCAGCATTAGTACAAAGACATTGGGATGAGATGTCAAATATAGCAGGATTCGATTTGACCCCAAACGCTGGAACATCTTTAAGGAAAATCATTGAATATAATCTTTGGGAAGATATTGATCAATATGAAATAATAAGCGTAGCGGCAACAAAGGAACTGGCTCTTATAACAAATTTAAATAAAATGATGGCTGAATGGACTGATATATGCTTTAAAACAAGTCCATACAAAGATACAGGAATTTACATATTATCTGGCTTAGATGATATACAAAGTGTTTTAGACGATCATATTGTAAAAACTATCGGCATGAGGGGCTCCGCGTTCGTAAAACCTTTTGAAGCTCAAGTTAGAAATTGGTATGAGAAAATAACACGTGTCAACGCTACAATTGACGAATGGGGCAAAGTACAGAGTCAATGGCTATACTTGTTACCTATATTTTCGTCTAAAGATATTGTTGCTCAAATGCAGGAAGAAGGAGTAATGTTCGTTGAGGTTAATAATATTTATCGTCGCTATATGGGTTCAGTAGACAAAGATCCTCACGTTTTAGAGATAGCTGGTGGAATGGGTGTTTTAGAATCATTTAAGATTGCGTCCGGTATGCTTGAAAAAATTAATGACGGTATAAACAACTATCTCGAAAGGAAACGCTTATATTTTCCACGTTTCTTCTTTTTGTCGAACGACGAAATGTTGGAAATCTTGTCAGAAACGAAGAATCCTCTCAAAGTTCAACCGCATCTCAAAAAATGTTTCGAAGGTATAAATCGACTTGTCTTTGATCCAGAGTTCAATATATCAGCAATGATTTCTATGGAAGGAGAACAAGTAGAATTTTTGGAAACTATTAGTGTCGCAGCAGCGAGGGGATCCGTTGAAAAGTGGCTAGTGCAAGTTGAAGATCAGATGTTAAAAGCTGTGAAATCTGAGACTGAATTATCTTATTATGACTACCCTAATTTAAGTCGTGTAGATTGGATATTGTCTTGGGAAGACGGTTATTCCGACATTAGAAACTGA

Protein sequence:

>DPOGS211202-PA
MEESELRKLLQTKNGCRIPVMLPIPDVHKVDKLPFMPLPPYNRIKDKKQKFRQLLEEKATKRKVNIARSSFEYSECDALEISQERHIAVLRQCAEKVQPPPMLKSWERKIFSLIPPKLRNAYPTIAEDLLKESKNEWNRNLHDLAVKTVIRDVPGVPRKRYEEPHFKFHGVTPNYEKMVKFRKKLQSGSLLLHPFIRLVLESSEKTFPEFIINLSKYRAKGPFHLDDFHTKVLEEIKKADYLVSSTWYSILANWLKNPRCLKGMKPKRIPDFVSCATKIISMQIQELMRRSIDAIITSLGNPECVPIINIDLDFNGEFIYDPSLEEVFNVFHNIADAIAHIAQRLMPIEQYLKIPYNYDALPVKYNDWLNKDSHDRLQQQLNIVFEPLVQYLVDLRVAYSMLYGAPAKTQLSKFINQAKEFEESRDKIKYFQEIDSDITAVLENEYFNCAIVCQRRMINGLKARALEFINDIIAGIVKTHMGENDSICKEFEIIAAKALKEPENAAELIEQGVYILHAKTVLVEVLKERILRQINIISNLLEMTSLSPEHVASNTRTVNWLTDIKPIFERNATAYETFKAEMEENLLTKIAYLNKEVSEITPYLELLDNMDDIDHTLEYLEHLRKLVHRLDDCDKLVSWINNEEVTFKFPVSHYSDLEELKDFIKPFHNLTYLVHKWKRSFYTWMDGPFEYLDHEKIEQDHDFYYKEFLKLSKAYRTKIKQQISEGVEKRFQGLVDDPDINNLPAPMKLCAQAIAEIKSWRPNVQMAHIMCNPALVQRHWDEMSNIAGFDLTPNAGTSLRKIIEYNLWEDIDQYEIISVAATKELALITNLNKMMAEWTDICFKTSPYKDTGIYILSGLDDIQSVLDDHIVKTIGMRGSAFVKPFEAQVRNWYEKITRVNATIDEWGKVQSQWLYLLPIFSSKDIVAQMQEEGVMFVEVNNIYRRYMGSVDKDPHVLEIAGGMGVLESFKIASGMLEKINDGINNYLERKRLYFPRFFFLSNDEMLEILSETKNPLKVQPHLKKCFEGINRLVFDPEFNISAMISMEGEQVEFLETISVAAARGSVEKWLVQVEDQMLKAVKSETELSYYDYPNLSRVDWILSWEDGYSDIRN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: