MonarchBase - Protein-coding gene

DPOGS211500
Transcript	DPOGS211500-TA	3147 bp
Protein	DPOGS211500-PA	1048 aa
Genomic position	DPSCF300354 - 217972-235849
RNAseq coverage	89x (Rank: top 63%)

Annotation
*Heliconius*	HMEL013227	1e-121	61.83%
*Bombyx*	BGIBMGA003806-TA	0.0	69.66%
*Drosophila*	Gl-PA	0.0	44.06%
EBI UniRef50	UniRef50_B0W933	0.0	45.78%	150 kDa dynein-associated polypeptide n=5 Tax=Culicimorpha RepID=B0W933_CULQU
NCBI RefSeq	XP_001657515.1	0.0	47.80%	dynactin [Aedes aegypti]
NCBI nr blastp	gi\|157112397	0.0	47.80%	dynactin [Aedes aegypti]
NCBI nr blastx	gi\|157112397	0.0	47.70%	dynactin [Aedes aegypti]

Group
KEGG pathway	aag:AaeL_AAEL006145	0.0
	K04648 (DCTN1)	maps->	Huntington's disease
			Vasopressin-regulated water reabsorption
InterPro domain	[551-799] IPR022157	2.5e-44	Dynein associated protein
	[4-137] IPR000938	1.9e-26	Cytoskeleton-associated protein, Gly-rich domain
Orthology group	MCL11853		Single-copy universal gene

Nucleotide sequence:

>DPOGS211500-TA
ATGTCGGATAAGAATCTGACGCTGGGTCAGCGTGTGATGGTGATAGGGAAGGAAGTAAAAGGGTCCATTGCATACGTCGGCAACCCAACATTCGCGTCCGGGAAATGGATTGGTATCATTTTGGATGAGCCCAAAGGCAAAAATAATGGTACACTGCGCGGACATGCATACTTCAGCTGCGAAGAGAAGTACGGCGTGTTTGTGAGACAGACCCAGATACAACTCTTGGATTCAGAAGACAACCCCATGGACACCTCCATGACGGCTTCCACCGAGGAAACCAAACCGACCAGACGTCTCAGCAGGGTGCGGCGAAAGGCGTCACCGGCGCAGACGAAGACTGGAAGCCTGTCCATGTCGAGTTCCAGAACCTCCCTGGCCAGCAGCCGTCAGTCGTTGACGTCATTCGTGTCACCGACGACCGAGAGAGGGACTTCCCCCGATCTCACAAAACGTGCTTCCTTTGTTGAGACTGGTTTCGTGGAGACTTTAACACCTCAATACACTCCGGGTCAGAGTTTGACCTCGCCATCAACAGCCTCTGAGGATAAACTGGCGAACATACAGGCGCAACAGGAGATTGTGAACCTAAAAGCTGAGGTGGAAGATTTGAAGGAGAAGCTGGAAACTCTGAAAGTCAGACGGGCCGAGGACAGGGAGAAGCTTCGAGAGCTGGAGAGAATGAGGTTACAGCTGGACCAGGCGAATGAGTTCAAGGCAAAGATCATGGAGTCACAGGCACAGCTGCAAAGGGACCTGCAGAGGGCCAAACAAGAGCTGCGTGAAGCCCAAGAAGCCCTGGACCAGCACAACGACGAGACAGCTGACCTGCAAGAGGCAGCTGAAATGGCGGCTCTTGATAAAGAAATGGCGGAGGAGAGGGCGGAGGCTCTACAGCTGGAGCTGGAACAGGCGAGGGAGAAGCTGGAAGAGGCGACGCTAGACCTGCAACTCATGAGGGCTGAGATGGAAGCTGGCGGGAATATACAACACCCGTATGCAGCGGGCGACAGTGGCGCCACCGGTTACGAGGTGAGGCAACTACAGCAACAGAACGTCCGTCTGAGGGACACGCTGGTCCGCCTCCGAGACCTCTCCGCCCACGATAAGCATGCAATGCAGAAAATGATGAAGGATTTGGAGCAATACAAGTCGGAGATAGCTGAACTGTCGAGGACTAAGGAGAAGCTGTCAGCGAGGGTTGAGGAGTTGGAGGCTCAGGTCGCTGATCTCAGAGAACAGGTGGACGCCGCTCTAGGCGCTGAAGAGATGGTGGAACAGCTGGCTGAGAAGAAGATGGCTTTGGAAGATCAGGTGGAACAGCTGAAGCAGGACGTATCAGAGCTGGAGGCGCTGCAGGAGGTTCACGAACAGCTGGTGGAGTCCAACCGGGAGCTGGAAATGGATCTGCGCGAAGAGCTGGAAATGGCGCACGCTGCTACCCGGGAGGCGGCCCGTGAGCGTGAAGCGGCCTTGGAGACGATCATGGATAGAGATGCGACCATCATCAAGTTCAGGGAGCTGGTGCAGAAGATGACGGAACAGCAGAACGAGCTCAAGAGCCAGGTTGAGAACAAACAGGGTGACCACGAGCCGTCTCCGGAGGGCGAAGCGCCAGAGGCTGCGCCCCGCGAGCTCGGAGCCCTGGTGCTCCAATCCAGGGCTGCCACCCGCTCTGTAGACCTGCAGTTGAGGGCTCTCGAGCTGGAACAGGCTCGGGCCAGGGCTGATAGATTGGCGGCGTGTCTACCTGATCATTTCATGGCACCCAACGGTGATCACGACGCCATCATGTTCATTCTGCTTCTACAGCGGTTGGACACCAAGTCCGAGATCATACTCGGACAGATCAGGGAGAAGTTCCCACCTGTGAACGTCTGGGATAAGGAATCGGTTATGAGAACCCACACAGCTGTCCAGTACAGCTTCAGATGCCAGCTGGAATACCAGCTGCAAATGATACAGTGCATGACATCTATGTGGTCTGGTGCGCTGGAGCGCTGCAGTCCTGAACTACTACTTCGAGCTGCTTCAGCGCTGCCGGATGCTGCAGCACAGGAGAGAGCACTAGATGCTGCGACCAGCCTGCTAAAGAACAATGAATTAGATGAGAACAGCTCTTTAGATGGCATGGAGCGGTGTTGGTCCTATCTAAGCGCTATGTGGTCCGCTCTGAACATGTCGTCGGTGGAAGGCGCGTCTTGTACTAGGGATGTGTTGCTACACTCGTGTTTCGCCCTGGACGCGCTCGCGAGAGCCCTAGCAGCTGATGGGGCGGCGTTACAGCATGTTATGCTGCCGTCCGATCATCAGCAAGAGCTGGGACAGCTGCATGAGGCCATCCAGTCCAGCTGCTCGTCCCTCCAGCAGCAGCTGAAGAGCGTGAGGCGCAGGCTCCAGCCTGGAGTCAAGCCCTCCACTCTGCCTATAGACGCTCAGCTGGTGGATCGTCTCCGGGGGTCCACAGCGGCGTCTCTGAGCAAGTGCGCCCGCGCCACCTCCCTCGCCGCCCGGGCTGCTAGCGCCTGCGCCGACACGGCCGGGGAGAGGGGCGAAGGCGCTCCGCTAGCACACGCAGCCATACAAGCGGTGTGGCTGGCGGCCTTCGATAAGATATACCAGCAGGAAGAGCAGGGCGTTGTCAAAACTGTGAAGAACGCGCTGTCACAGACGGCCAAGGACGTAGACGCGCTGGCGACCTTCGTGAGGGACCGCGAGTACGACCTGATGTCCAGCACCAACGGAGCTGATGATACGCCGACTCCGCCTATAGTGCTCCGAGCGCAGCTGGTGAAGAAACAGCTGGAAGAGACGAAGACCTTGACAATAAGGCTTGAGAATAAGGAGGCTGATATTAAAGAACTGAAGAAGGCGCTGAAGGCCAAGCAAGAAGAATTGTCTGAGATGCAAATAAGGCGGGAGCTGGGCGAGAGGAAACTGGTCGCTGCGGCGAGGGACGCCGAGCTGAAGTCGCAGCAGCTGCAGCGGCGGCTGGACGACGCGCAGAACCAGTTCAAGAGGAAAGAGAAGGAGTTCGAGGAGACTATGGACCACCTGCAGCAGGACATAGACCTGCTGGCCAGCGAACGAGGAGCTCTCAGGGACAAGCTGAAGCTATACGCTAAGAGGTCACATCACGGTCAGTAA

Protein sequence:

>DPOGS211500-PA
MSDKNLTLGQRVMVIGKEVKGSIAYVGNPTFASGKWIGIILDEPKGKNNGTLRGHAYFSCEEKYGVFVRQTQIQLLDSEDNPMDTSMTASTEETKPTRRLSRVRRKASPAQTKTGSLSMSSSRTSLASSRQSLTSFVSPTTERGTSPDLTKRASFVETGFVETLTPQYTPGQSLTSPSTASEDKLANIQAQQEIVNLKAEVEDLKEKLETLKVRRAEDREKLRELERMRLQLDQANEFKAKIMESQAQLQRDLQRAKQELREAQEALDQHNDETADLQEAAEMAALDKEMAEERAEALQLELEQAREKLEEATLDLQLMRAEMEAGGNIQHPYAAGDSGATGYEVRQLQQQNVRLRDTLVRLRDLSAHDKHAMQKMMKDLEQYKSEIAELSRTKEKLSARVEELEAQVADLREQVDAALGAEEMVEQLAEKKMALEDQVEQLKQDVSELEALQEVHEQLVESNRELEMDLREELEMAHAATREAAREREAALETIMDRDATIIKFRELVQKMTEQQNELKSQVENKQGDHEPSPEGEAPEAAPRELGALVLQSRAATRSVDLQLRALELEQARARADRLAACLPDHFMAPNGDHDAIMFILLLQRLDTKSEIILGQIREKFPPVNVWDKESVMRTHTAVQYSFRCQLEYQLQMIQCMTSMWSGALERCSPELLLRAASALPDAAAQERALDAATSLLKNNELDENSSLDGMERCWSYLSAMWSALNMSSVEGASCTRDVLLHSCFALDALARALAADGAALQHVMLPSDHQQELGQLHEAIQSSCSSLQQQLKSVRRRLQPGVKPSTLPIDAQLVDRLRGSTAASLSKCARATSLAARAASACADTAGERGEGAPLAHAAIQAVWLAAFDKIYQQEEQGVVKTVKNALSQTAKDVDALATFVRDREYDLMSSTNGADDTPTPPIVLRAQLVKKQLEETKTLTIRLENKEADIKELKKALKAKQEELSEMQIRRELGERKLVAAARDAELKSQQLQRRLDDAQNQFKRKEKEFEETMDHLQQDIDLLASERGALRDKLKLYAKRSHHGQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: