MonarchBase - Protein-coding gene

DPOGS207366
Transcript	DPOGS207366-TA	3288 bp
Protein	DPOGS207366-PA	1095 aa
Genomic position	DPSCF300562 - 7796-25963
RNAseq coverage	78x (Rank: top 65%)

Annotation
*Heliconius*	HMEL013227	3e-121	61.83%
*Bombyx*	BGIBMGA003806-TA	0.0	70.49%
*Drosophila*	Gl-PA	0.0	45.72%
EBI UniRef50	UniRef50_B0W933	0.0	46.80%	150 kDa dynein-associated polypeptide n=5 Tax=Culicimorpha RepID=B0W933_CULQU
NCBI RefSeq	XP_001657515.1	0.0	47.55%	dynactin [Aedes aegypti]
NCBI nr blastp	gi\|157112397	0.0	47.55%	dynactin [Aedes aegypti]
NCBI nr blastx	gi\|157112397	0.0	47.55%	dynactin [Aedes aegypti]

Group
KEGG pathway	aag:AaeL_AAEL006145	0.0
	K04648 (DCTN1)	maps->	Huntington's disease
			Vasopressin-regulated water reabsorption
InterPro domain	[459-707] IPR022157	2.7e-44	Dynein associated protein
Orthology group	MCL11853		Single-copy universal gene

Nucleotide sequence:

>DPOGS207366-TA
ATGTATCCGTATGTGTGTTCTGGAAATCTAAAAAGGGTGCGGCGAAAGGCGTCACCGGCGCAGACGAAGACTGGAAGCCTGTCCATGTCGAGAACCTCCCTGGCCAGCAGCCGTCAGTCGTTGACGTCATTCGTGTCCCCGACGACCGAGAGAGGGACTTCCCCCGATCTCACAAAACGTGCTTCCTTTGTTGAGACTGGTTTCGTGGAGACTTTAACACCTCAATACACTCCGGGTCAGAGTTTGACCTCGCCATCAACAGCCTCTGAGGATAAACTGGCGAACATACAGGCGCAACAGGAGATTGTGAACCTAAAAGCTGAGGTGGAAGATTTGAAGGAGAAGCTGGAAACTCTGAAAGTCAGACGGGCCGAGGACAGGGAGAAGCTTCGAGAGCTGGAGAGAATGAGGTTACAGCTGGACCAGGCGAATGAGTTCAAGGCAAAGATCATGGAGTCACAGGCACAGCTGCAAAGGGACCTGCAGAGGGCCAAACAAGAGCTGCGTGAAGCTCAAGAAGCCCTGGACCAGCACAACGACGAGACAGCTGACCTGCAAGAGGCAGCTGAAATGGCGGCTCTTGATAAAGAAATGGCGGAGGAGAGGGCGGAGGCTTTACAGCTGGAGCTGGAACAGGCGAGGGAGAAGCTGGAAGAGGCGACGCTAGACCTGCAACTCATGAGGGCTGAGATGGAAGCTGGCGGGAATATACAACACCCGTATGCAGCGGGCGACAGTGGCGCCACCGGTTACGAGGTGAGGCAACTACAGCAACAGAACGTCCGTCTGAGGGACACGCTAGTCCGCCTCCGAGACCTCTCCGCCCACGATAAGCATGCAATGCAGAAAATGATGAAGGATTTGGAGCAATACAAATCGGAGATAGCTGAACTGTCGAGGACTAAGGAGAAGCTGTCAGCGAGGGTTGAGGAGTTGGAGGCTCAGGTCGCTGATCTCAGAGAACAGGTGGACGCCGCTCTAGGCGCTGAAGAGATGGTGGAACAGCTGGCTGAGAAGAAGATGGCTTTGGAAGATCAGGTGGAACAGCTGAAGCAGGACGTATCAGAGCTGGAGGCGCTGCAGGAGGTTCACGAACAGCTGGTGGAGTCCAACCGGGAGCTGGAAATGGATCTGCGCGAAGAGCTGGAAATGGCGCACGCTGCTACCCGGGAGGCGGCCCGTGAGCGTGAAGCGGCCTTGGAGACGATCATGGATAGAGATGCGACCATCATCAAGTTCAGGGAGCTGGTGCAGAAGATGACGGAACAGCAGAACGAGCTCAAGAGCCAGGTTGAGAATAAACAGGGTGACCACGAGCCGTCTCCGGAGGGCGAAGCGCCCGAGGCTGCGCCCCGCGAGCTCGGAGCCCTGGTGCTCCAATCCAGGGCTGCCACCCGCTCTGTAGACCTGCAGTTGAGGGCTCTCGAGCTGGAACAGGCTCGGGCCAGGGCTGATAGATTGGCAGCGTGTCTACCTGATCATTTCATGGCACCCAACGGTGATCACGACGCCATCATGTTCATTCTGCTTCTACAGCGGTTGGACACCAAGTCCGAGATCATACTCGGACAGATCAGGGAGAAGTTCCCACCTGTGAACGTCTGGGATAAGGAATCGGTTATGAGAACCCACACAGCTGTCCAGTACAGCTTCAGATGCCAGCTGGAATACCAGCTGCAAATGATACAGTGCATGACATCTATGTGGTCTGGTGCGCTGGAGCGCTGCAGTCCCGAACTACTACTGCGAGCTGCTTCAGCGCTGCCGGATGCTGCAGCACAGGAGAGAGCACTAGATGCTGCGACCAGTCTGTTGAAGAACAATGAATTAGATGAGAACAGCTCTTTAGATGGCATGGAGCGCTGTTGGTCCTATCTAAGCGCTATGTGGTCCGCTCTGAACATGTCGTCGGTGGAAGGCGCGTCTTGTACACGGGATGTGTTGCTACACTCGTGTTTCGCCCTGGACGCGCTCGCGAGGGCCCTAGCAGCTGATGGGGCGGCGCTACAGCATGTTATGCTGCCGTCCGATCATCAGCAAGAGCTGGGACAGCTGCATGAGGCCATCCAGTCCAGCTGCTCGTCCCTCCAGCAGCAGCTGAAGAGCGTGAGGCGCAGGCTCCAGCCTGGAGTCAAGCCCTCCACTCTGCCTATAGACGCTCAGCTGGTGGATCGTCTCCGAGGGTCCACAGCGGCGTCTCTGAGCAAGTGCGCCCGCGCCACCTCCCTCGCCGCCCGGGCTGCTAGCGCCTGCGCCGACACGGCCGGGGAGAGGGGCGAAGGCGCTCCGCTAGCACACGCAGCCATACAAGCGGAAGAGCAGGGCGTTGTCAAAACTGTGAAGAACGCGCTGTCACAGACGGCCAAGGACGTAGACGCGCTGGCGACCTTCGTGAGGGACCGCGAGTACGACCTGATGTCCAGCACCAACGGAGCTGATGATACGCCGACTCCGCCTATAGTGCTCCGAGCGCAGCTGGTGAAGAAACAGCTGGAAGAGACGAAGACCTTGACAATAAGGCTTGAGAATAAGGAGGCTGATATTAAAGAACTGAAGAAGGCGCTGAAGGCCAAGCAAGAAGAATTGTCTGAGATGCAAATAAGGCGGGAGCTGGGCGAGAGGAAACTGGTCGCTGCGGCGAGGGACGCCGAGCTGAAGTCGCAGCAGCTGCAGCGGCGGCTGGACGACGCGCAGAACCAGTTCAAGAGGGCGGTGGAACGAGAGCGTGCGGCGCGGGTAGCCGCCGTTGGTAGGGCGGAGCGCGCGGCGCTCAGGGCCCTCCGCCCCCTACACCACCCAGCGGCGCCGGAGCACGCCAAGAGGAGGGCGGCTGCTGCTGCCTTGGAGACGGAACTGTCCAAACTACAGGCGGAGTGGACTCTGTTCGTGGCCAGATCGGGTCTGGTGAAGTTCCCCTCGGAGCCCGGCCAGTACGCGCGGGCCTTAGAACAGCACAAGGAGAAACAGAGACGAGTGAGGAAACAGCTGGAGGATAAGCTGATCCGGCTGCAGGTGGAGGCTCGCTTGCTGTTGCTGACTCACCGTCCTTGGCGCGTCTCGCTCGCAGACCTCGCGTGCTTCCCAGCACCGGACCTGGCCGCGGCCCTGGACCCCAAGACGGTGGAGGTTGGCACCATCACGTACCCCGCGGGCGAGGGGCTCAGCGACGACACGATATACGTCACGCCCACCCAGCTGGCCAAGTTGCGCGAGATAGTCACCGAGCTCCAGTCGGACGAGGTTCAGCTCGACCTCAAGCCGCTGGACAGCACCGTGTGCGCAGCTTGA

Protein sequence:

>DPOGS207366-PA
MYPYVCSGNLKRVRRKASPAQTKTGSLSMSRTSLASSRQSLTSFVSPTTERGTSPDLTKRASFVETGFVETLTPQYTPGQSLTSPSTASEDKLANIQAQQEIVNLKAEVEDLKEKLETLKVRRAEDREKLRELERMRLQLDQANEFKAKIMESQAQLQRDLQRAKQELREAQEALDQHNDETADLQEAAEMAALDKEMAEERAEALQLELEQAREKLEEATLDLQLMRAEMEAGGNIQHPYAAGDSGATGYEVRQLQQQNVRLRDTLVRLRDLSAHDKHAMQKMMKDLEQYKSEIAELSRTKEKLSARVEELEAQVADLREQVDAALGAEEMVEQLAEKKMALEDQVEQLKQDVSELEALQEVHEQLVESNRELEMDLREELEMAHAATREAAREREAALETIMDRDATIIKFRELVQKMTEQQNELKSQVENKQGDHEPSPEGEAPEAAPRELGALVLQSRAATRSVDLQLRALELEQARARADRLAACLPDHFMAPNGDHDAIMFILLLQRLDTKSEIILGQIREKFPPVNVWDKESVMRTHTAVQYSFRCQLEYQLQMIQCMTSMWSGALERCSPELLLRAASALPDAAAQERALDAATSLLKNNELDENSSLDGMERCWSYLSAMWSALNMSSVEGASCTRDVLLHSCFALDALARALAADGAALQHVMLPSDHQQELGQLHEAIQSSCSSLQQQLKSVRRRLQPGVKPSTLPIDAQLVDRLRGSTAASLSKCARATSLAARAASACADTAGERGEGAPLAHAAIQAEEQGVVKTVKNALSQTAKDVDALATFVRDREYDLMSSTNGADDTPTPPIVLRAQLVKKQLEETKTLTIRLENKEADIKELKKALKAKQEELSEMQIRRELGERKLVAAARDAELKSQQLQRRLDDAQNQFKRAVERERAARVAAVGRAERAALRALRPLHHPAAPEHAKRRAAAAALETELSKLQAEWTLFVARSGLVKFPSEPGQYARALEQHKEKQRRVRKQLEDKLIRLQVEARLLLLTHRPWRVSLADLACFPAPDLAAALDPKTVEVGTITYPAGEGLSDDTIYVTPTQLAKLREIVTELQSDEVQLDLKPLDSTVCAA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: