MonarchBase - Protein-coding gene

DPOGS211203
Transcript	DPOGS211203-TA	3273 bp
Protein	DPOGS211203-PA	1090 aa
Genomic position	DPSCF300007 + 867631-871243
RNAseq coverage	11x (Rank: top 84%)

Annotation
*Heliconius*	HMEL012455	92.61%
*Bombyx*	BGIBMGA001869-TA	90.04%
*Drosophila*	Dhc62B-PC	57.09%
EBI UniRef50	UniRef50_E0VN31	63.22%	Dynein beta chain, ciliary, putative n=13 Tax=Metazoa RepID=E0VN31_PEDHC
NCBI RefSeq	XP_002427535.1	63.22%	dynein beta chain, ciliary, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242013690	63.22%	dynein beta chain, ciliary, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242013690	63.22%	dynein beta chain, ciliary, putative [Pediculus humanus corporis]

Group
KEGG pathway	mdo:100026476	0.0
	K10408 (DNAH)	maps->	Huntington's disease
Orthology group	MCL10001		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211203-TA
ATGAACATATATGACATGGCTGCAGAAGGTCTACGGCCTACTCCAGCCAAATCTCATTATATTTTTAATCTACGAGACTTCTCAAGAGTTATTCAAGGATGTGCGTTGTTAAGAAGAGAATCTGCAGACAATAAAAAAACTTTTACTAGAGTATGGGTCCATGAAATTTTGCGTGTTTTTTATGATAGACTTGTTGATGAAATAGATCGTTCTTGGTTCTATAATCTTTTAAGGAAATCAACACAAGAGTTCATGAGGGACACATTTGAATCAGCATTAGACACATATCAAAATGATAAAGGTGAGGTAACTCAAGAAAATATTAAAAAAATGATGTTTGGTTGTTATTTAGACACGGACAGTGTCGAAGGGGAGAGAAGGTATGAAGAAATTCCTACGAAAGAAACATTTTTAAATGTTGCTATCGCTATGTTAACAGAGTATAATGCAATGCATAAGGCAAAAATGACAATTGTATTATTCGATTATGCCTTAGAACATTTATCAAAAATATGTAGATTGCTTTCTATGCCATCGGGTAACGCCTTATTGGTTGGAGTAGGAGGTTCTGGTCGCCAGTCACTCACTAGGTTGGCTAGTACTATTTTAGGTCAACAGGTATATCAACCTGAAATCACCAAGTCATATAGTGTTAAAGATTGGCATGATGATATTAAACTAGTTCTAAGAGAATCCGGTGGTCTTAATAAAGATACAACTTTTCTATTCACGGAAAATCAAATTAAAGAAGAAGTCTTTATTCAAAATTTAGACAGTTTGCTTAATTCCGGTGAAGTTCCTAATTTATACGGCTTAGATGAAATGCAAGAAATATTAGAATTAGTTCGCCTTGCAGCCCAAGGTGGTAATAGAAATTTAGATATTAGTCCATTGCAGATTATGTCATTTTTCGTTGGAAGATGTAAAGCTAAATTACATATTGTTTTGTGTTTCAGTCCTATAGGAAGTTCTTTTAGAACAAGATTAAGGCTGTATCCTTCTCTTGTAAACTGCTGCACTATTGATTGGTATGATAGTTGGCCTGAAGATGCACTAGAAATGGTGGCACATTACTATATGGTTAAAGTAAATGTTAGTGATAAAATTAAAGCAGCTGCAGTTATAGCGTGTAAACAATTTCACGTGGATGCGCGAAAGGTATCAATTGATTTCTTTAATCAATTTGGAAGAAAGACATATATTACATCAGCATCATATCTTAATTTGATCAAATCTTTTACAATATTAACAAATCGAAAACAAAGAGAGTTAAGAGCTGCAAAATTGCGTTATACGAATGGTTTAGATAAACTTAGTCAGGCAGCAGAAGCCGTGTCAATTATGCAACGTGACCTAAATATTTTGAAACCTCAATTAATTGTTATGGCTGCTAAGTCTACAAAGATGATGGAAGAAATCGCAGTAGAAACCGCCACTGCAGATAAAGCTGCAGCACAGGTGCGGGAAGATCAAAAAGTAGCAAATGTTCAAGCAGCAGCTGCGCAAGAGCTAAAAAAGGATTGTGAAGCGGATTTAGCTTTAGCTTTACCTATTTTAGAGGATGCGATTGCTGCATTGAATACTTTGAAACCCGCAGATATTACAATTGTAAAATCAATGAAAAATCCTCCAGCGACAGTAAAGTTAGTGATGGCAGCGGTATGTGTAATGAAGGGGATCCCACCTGATAAAATTCCAGATCCTGATAATCCGGGTAAGAAAATGTTAGATTATTGGGGTCCCAGTAAGAGAATATTAGGAGACATGAGCTTCTTGGATTCGTTGCGCAACTTTGACAAGGATAACATCCCAGTGGCAACAATGCAAAAAATAAGAAAAGAATATCTTTCCCATAAAGATTTTAAGCCACACATTATTGCCAAAGCTTCCACAGCTGCGGAAGGGTTGTGTAAGTGGATAATTGCAATGGATATGTATGATGCAGTAGCAAAAGTTGTTGCTCCGAAAAAAGCGAAGCTGGAAGCGGCTGAAAAAGAATTTGCGGAAACGATGGCGATATTAGAAGAAAAGAAAGCTACCGTAGCTAGATTAGAGGCTAGATTAGCTGAGTTAAATGAAGCCTTAGAAGAAGCAAATATTAAGAAAAAGGCTTTAGAAGATGAAGTTCAACTTTGTATTGATAAATTATATCGTGCTGAGAAGTTAATTGGTGGTCTTGGGGGAGAAAAAGTGAGATGGACAGCAGCAGCTGAAAATTTGCAAACTCTATTTGACAATTTAGCTGGAGATATTCTTGTTTCATCGGGTATCATAGCATATTTATCGCCTTATACTTTACCTATAAGAATAGAGATGATTTCCAAGTGGCGTGATTTAGTTATTGGTCTTGATATGCCACATTCTGAACATTTTGTGTTTAAAGACATTTTAGGTACTGACATTAAAATCCAAAATTGGTGTATAGCTGGTTTACCATGGGATTCGTTTTCTATAGATAATGGTGTTATACAAGATAGTTCTCTTCGTTGGTCTCTACTTGTCGATCCACAAGGACAAGCAAACAAATGGATAAAAACAATGGAAAAATCTAATGATTTGCAAGTCCTTAAGTTTACTGATGGTAATTATATGAAAGTAATAGAAACTTGTTTAGAATACGGAAAACCAGCATTGATTGATTGTATTTTAGAAGACGTTGAACCACCTTTGGATCCAGTTTTATTAAAGCATACTTATGTACAAGGTGGAAAAGAATTTATTGCTTTGGGTGAGAATGTAATTGAATATCATCCTAATTTTAGATTGTACATGACTACGAAACTCAGAAATCCTCATTATTTGCCTGAAGTGTTTAACAAAGTTACATTAATCAATTTTGCTCTTACAAAGGATGGACTGGAGGATCAATTGTTGGGTATTGTTGTGGCCAAAGAAAGACCTGATTTGCAAGAAAAGCGTGAAAAATTGATTGTGCAAGGTGCGGCTAATCGTGCTGCACTTAAACAAGTAGAAGATGACATATTACGAACTCTTCAAGAATCTAAGGGTGATATTCTAGAAGATGAATCTGCTATAGAAGTTTTAGATTCATCAAAACTATTAGCAATTGATATAACTAAAAAACAAGAAGCATCGGTAGAAACAGAAATTATTATAGAAAAATTTAGACTTGGATACAGGCCTATAGCATCACATTCTGCTATAAAGGTTGGGATGAAATATGCAGACTGGATGACCTACCAGCCTATAAGGAGATTAGAAATAGTTTTACAACCCATCAAAAGGGATGGAAAGAAGTCTATGACGATTTAG

Protein sequence:

>DPOGS211203-PA
MNIYDMAAEGLRPTPAKSHYIFNLRDFSRVIQGCALLRRESADNKKTFTRVWVHEILRVFYDRLVDEIDRSWFYNLLRKSTQEFMRDTFESALDTYQNDKGEVTQENIKKMMFGCYLDTDSVEGERRYEEIPTKETFLNVAIAMLTEYNAMHKAKMTIVLFDYALEHLSKICRLLSMPSGNALLVGVGGSGRQSLTRLASTILGQQVYQPEITKSYSVKDWHDDIKLVLRESGGLNKDTTFLFTENQIKEEVFIQNLDSLLNSGEVPNLYGLDEMQEILELVRLAAQGGNRNLDISPLQIMSFFVGRCKAKLHIVLCFSPIGSSFRTRLRLYPSLVNCCTIDWYDSWPEDALEMVAHYYMVKVNVSDKIKAAAVIACKQFHVDARKVSIDFFNQFGRKTYITSASYLNLIKSFTILTNRKQRELRAAKLRYTNGLDKLSQAAEAVSIMQRDLNILKPQLIVMAAKSTKMMEEIAVETATADKAAAQVREDQKVANVQAAAAQELKKDCEADLALALPILEDAIAALNTLKPADITIVKSMKNPPATVKLVMAAVCVMKGIPPDKIPDPDNPGKKMLDYWGPSKRILGDMSFLDSLRNFDKDNIPVATMQKIRKEYLSHKDFKPHIIAKASTAAEGLCKWIIAMDMYDAVAKVVAPKKAKLEAAEKEFAETMAILEEKKATVARLEARLAELNEALEEANIKKKALEDEVQLCIDKLYRAEKLIGGLGGEKVRWTAAAENLQTLFDNLAGDILVSSGIIAYLSPYTLPIRIEMISKWRDLVIGLDMPHSEHFVFKDILGTDIKIQNWCIAGLPWDSFSIDNGVIQDSSLRWSLLVDPQGQANKWIKTMEKSNDLQVLKFTDGNYMKVIETCLEYGKPALIDCILEDVEPPLDPVLLKHTYVQGGKEFIALGENVIEYHPNFRLYMTTKLRNPHYLPEVFNKVTLINFALTKDGLEDQLLGIVVAKERPDLQEKREKLIVQGAANRAALKQVEDDILRTLQESKGDILEDESAIEVLDSSKLLAIDITKKQEASVETEIIIEKFRLGYRPIASHSAIKVGMKYADWMTYQPIRRLEIVLQPIKRDGKKSMTI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: