MonarchBase - Protein-coding gene

DPOGS200140
Transcript	DPOGS200140-TA	2550 bp
Protein	DPOGS200140-PA	849 aa
Genomic position	DPSCF300128 - 366549-376530
RNAseq coverage	13x (Rank: top 82%)

Annotation
*Heliconius*	HMEL007556	84.40%
*Bombyx*	BGIBMGA002785-TA	91.92%
*Drosophila*	DCX-EMAP-PC	71.46%
EBI UniRef50	UniRef50_Q9VUI3	71.46%	Echinoderm microtubule-associated protein-like CG42247 n=30 Tax=Neoptera RepID=EMAL_DROME
NCBI RefSeq	XP_969211.2	79.28%	PREDICTED: similar to IP09257p [Tribolium castaneum]
NCBI nr blastp	gi\|189241016	79.28%	PREDICTED: similar to IP09257p [Tribolium castaneum]
NCBI nr blastx	gi\|189241016	79.28%	PREDICTED: similar to IP09257p [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.8e-32	protein binding
	GO:0035556	3.5e-10	intracellular signal transduction
KEGG pathway	pbe:PB000833.01.0	5e-10
	K10599 (PRPF19, PRP19)	maps->	Ubiquitin mediated proteolysis
			Spliceosome
InterPro domain	[243-687] IPR011047	2.9e-41	Quinonprotein alcohol dehydrogenase-like
	[566-846] IPR015943	1.8e-32	WD40/YVTN repeat-like-containing domain
	[217-289] IPR005108	1.4e-28	HELP
	[618-845] IPR011046	3.9e-26	WD40 repeat-like-containing domain
	[68-132] IPR003533	3.5e-10	Doublecortin domain
Orthology group	MCL14563		Insect specific

Nucleotide sequence:

>DPOGS200140-TA
ATGGTCGACAGTGACGAAGAACCCTTCACGGTCATAGCACTCCCAGTTAACACTCCAGAACCACCAGCAGCGAGTTACGGTAAGAAGAACGGCATGTGGTACGGCGGCACAGCCACGGGAACCAGCGGATGGTCGCGGGCTGGTACTCGCAAACAGTCGGTGGCCGAGTCTGATGCACCCCCGCCCGGAGGTGGCAAGCCTGCCAGTGGCAGAGTGATTCGGATCATCAACAACATGGACCATTCTATACAGTGTCGTGTTTTGTTAAACTTACGTACAACCCAACCATTCGAAGAGGTTTTAGAGGATTTAGGGCAGGTTTTAAAAATGAGCGGAGCAAAGAGGATGTACACAATTACGGGACAAGAGGTAAGGAGCTTTTCTCAGTTGCGTAACGAATTCGCTGATGTAGAGACGTTTTATTTGGGAGCAGCGATGGTACCTCCAGCACTCAGTCCAGGAATAAGCGCACCTCTACCAATTGAGTCGCCCATTAGAAGATCCAGGTCTAGGGGGAACGTATCTGCTGTATCAGTGTCTGAGGAAGGGCGCGGTCGGCGCGCTCGCAGCAAAAGTCGCCCGCGCGTACTATACGCTCCCGAAGGAGAGATAATAAGAAACTCAGATTACACCCTCCTCGAGGTTCTGAAAGAAGAGCCTATCCGTGTAACAATACGCGGTTTACGACGCACCTTCTACCCTCCAATACACCACGCGCCCATAGACAACAGTCCTCCAGATAAAAAGATGCAACTGGAATGGGTATACGGTTATCGAGGCTCGGACTCACGTCGCAACCTGTGGGTGCTGCCCACCGGCGAGCTGCTATATTACGTCGCAGCGGTTGCCATCATGTATGATAGAGACGAACACGCTCAGAGGCACTACACGGGACACACCGAGGATATACAGTGTATGGAGCTGCACCCGTCCCGCGAGCTGGTGGCGAGTGGTCAGCGCGCGGGCCGGGGGCGCCGGGCGCAGGCCCACGTCCGCATCTGGAGCACCGACACGCTTCAGACCCTGCACGTGTTTGGGATGGCCGAGTTCGAGGTCGGCGTCTCCGCGGTCGCCTTCTCGCAACTGAACGGAGGTAGTTACGTATTAGCCGTCGACGCCGGTCGTGAAAGTATTCTGTCCGTGTGGCAGTGGCAATGGGGACATCTTCTAGGCAAAGTTGCGACTCTTCAAGAGGAGCTGACAGGCGCGGCGTTCCATCCTCTCGATGACAACCTGCTGATCACACACGGTAAGGGACACCTCGCCTTCTGGAACAGGAGGAAAGACGGATTCTTCGAACGAACGGATATTATTAAACCGCCGGCTCGCACACAAGTGACAGCCTTACAGTTCGAACAAGACGGTGACGTAGTGACGGCGGATAGTGATGGGTTCATAACCATATATAGCGTCGATAGTGATGGTGCTTACTTTGTACGAATGGAGTTTGAGGGTCACATAAAAGGAATTTCCTCGTTAGTAATGCTCTCAGAAGGTACTCTTATATCTGGCGGTGAGAAAGATAGAAAAATAGCCGCTTGGGATTCCTTACAAAATTATAAGAGAATAACTGAAACAAAGCTACCCGAATCAGCTGGTGGAGTCCGAACAATTTATCCCCAGAGACCTGGAAGGAACGATGGCAACCTGTACATAGGAACAACGAAAAATAACATTCTAGAAGGATCGCTACAGAGGAGATTCAATCAAGTTTTGTTCGGTCACCACAAACAGTTGATGGGCGTCGCGGTGCATCCTGATGATGAAATGTTTGCCACTGCCGGCCACGACAAGAACATAGCGCTCTGGAAGGGGCATAAGCTAGTGTTCGCGACACAGGTTGGATATGAATGTGTATCTCTGGCGTGGCATTCCGGCGGGGGGGCGTTGGCGGCCGGCAGTACCGAGGGTCACCTGGTGATACTGAACGCTGATGCTGGAGCCCACGTCGCCACCATCAGGGTCTGTGGATCGCCTCTCAGCTGTTTGCAGTACAACACTGCTGGAGACATATTAGCCATTGGATCCCAAAATGGCAGCATATATTTATTCCGTGTGTCACGTGATGGTTTTTCTTATAAGAAATCGAATAAGATCCGAGGAGCTCAGCCTCTCGTGATGCTGGATTGGAGTCTCGATGGAAACTACTTACAGACAGTCACCGCTGACTATGATTTATCATTTTGGGACATCAAAGCTCTGTCACCTGAGAAGAGTCCGATAGCTATGAAAGACGTCAAGTGGGCTACATTTAATTCGACAGTCGGCTTTCTTGTTTCAGGGATGTGGAACAACCGTTTTTATCCTATGACGTCACTGATAACAGCCGCGAGTCGCTCTGCGGCTCACGATCTACTTATAAGCGGAGATTCAGAAGGCCATCTCCGTCTTTTCAGATATCCCTGTGCGAGTCCAAAGGCCGAGTACAATGAGATAAAGGTGTATTCTGGTGCGATCCACTCCGCTCGGTTCTTGTTCAACGACCGCTGCCTGGTGACCTCTGGCGGCTCTGACGCGGCGCTCATGTTGTGGGAACTAGTGGACGACTAG

Protein sequence:

>DPOGS200140-PA
MVDSDEEPFTVIALPVNTPEPPAASYGKKNGMWYGGTATGTSGWSRAGTRKQSVAESDAPPPGGGKPASGRVIRIINNMDHSIQCRVLLNLRTTQPFEEVLEDLGQVLKMSGAKRMYTITGQEVRSFSQLRNEFADVETFYLGAAMVPPALSPGISAPLPIESPIRRSRSRGNVSAVSVSEEGRGRRARSKSRPRVLYAPEGEIIRNSDYTLLEVLKEEPIRVTIRGLRRTFYPPIHHAPIDNSPPDKKMQLEWVYGYRGSDSRRNLWVLPTGELLYYVAAVAIMYDRDEHAQRHYTGHTEDIQCMELHPSRELVASGQRAGRGRRAQAHVRIWSTDTLQTLHVFGMAEFEVGVSAVAFSQLNGGSYVLAVDAGRESILSVWQWQWGHLLGKVATLQEELTGAAFHPLDDNLLITHGKGHLAFWNRRKDGFFERTDIIKPPARTQVTALQFEQDGDVVTADSDGFITIYSVDSDGAYFVRMEFEGHIKGISSLVMLSEGTLISGGEKDRKIAAWDSLQNYKRITETKLPESAGGVRTIYPQRPGRNDGNLYIGTTKNNILEGSLQRRFNQVLFGHHKQLMGVAVHPDDEMFATAGHDKNIALWKGHKLVFATQVGYECVSLAWHSGGGALAAGSTEGHLVILNADAGAHVATIRVCGSPLSCLQYNTAGDILAIGSQNGSIYLFRVSRDGFSYKKSNKIRGAQPLVMLDWSLDGNYLQTVTADYDLSFWDIKALSPEKSPIAMKDVKWATFNSTVGFLVSGMWNNRFYPMTSLITAASRSAAHDLLISGDSEGHLRLFRYPCASPKAEYNEIKVYSGAIHSARFLFNDRCLVTSGGSDAALMLWELVDD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: