MonarchBase - Protein-coding gene

DPOGS204851
Transcript	DPOGS204851-TA	2172 bp
Protein	DPOGS204851-PA	723 aa
Genomic position	DPSCF300227 + 11759-22124
RNAseq coverage	38x (Rank: top 73%)

Annotation
*Heliconius*	HMEL002403	0.0	76.89%
*Bombyx*	BGIBMGA011750-TA	1e-19	52.63%
*Drosophila*	osm-1-PA	2e-146	40.24%
EBI UniRef50	UniRef50_Q9W040	3e-144	40.24%	Intraflagellar transport protein osm-1 n=17 Tax=Diptera RepID=OSM1_DROME
NCBI RefSeq	XP_001842122.1	2e-146	40.22%	osm-1 [Culex quinquefasciatus]
NCBI nr blastp	gi\|170028478	3e-145	40.22%	osm-1 [Culex quinquefasciatus]
NCBI nr blastx	gi\|198466543	1e-142	41.22%	GA12544 [Drosophila pseudoobscura pseudoobscura]

Group
Gene Ontology	GO:0005515	7.7e-26	protein binding
KEGG pathway
InterPro domain	[15-301] IPR011046	7.7e-26	WD40 repeat-like-containing domain
	[15-287] IPR015943	6.6e-22	WD40/YVTN repeat-like-containing domain
Orthology group	MCL11167		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204851-TA
ATGCGACTGAAATTTTCTAAAACGCTTTTGGATGCTCAGGAATCGGATATCCCAGTAGCCGACATATGTTGGTCACCAAATAATGTAAAATTAGCTGTTGGCACTTCTGAACGGGTGGTACTTTTATTTGACCGCGATGGGATGCGTCGGGATAAGTTTAGCACCAAGCCAGCTGATGCAGCAGCAGGAAAGAAATCATATGTTATCACCGGTTTAGCATTCAGCGACAATTCGGAATTGCTAGGGGTAGCTCAAAGCGATAACATGGTTTTTGTATACCGAATCGGTGCTGACTGGAGCGGCAAAAAAGTAATCTGTAATAAATTTCCTCTCACCGGGTCGCCTTTACGTTTACTTCCAGCTGAAACTGGATTCTTTACAGGAACTAGTGATGGAAAGATAAGATCTTTGGATTGTAAAACAAATAAAAGCTCCAGTTTGTGGTCCGCGGGATCATGTTGCGTGTCTCTGGCACGTGGATCTGAGGCGATGTTGGCATCTGGACACATTGATGGAACTATTTATTTAAATGGCAGATTAATATTACGCTACACTCTACCGCCGACAGCCATGGTCTTGGTATCTTCCTACCTGATAGTCGGAGCTTGTGATGGTAGAATAACAATGTATGAGGCTCAGAGAGGAGCGCTAGTAAGAAGTTTAGAACCAACATTACCTCCTGATAGAAGAGATATCATATCAGCTTCTCTTAGTCCTTCTGGTCAGACGATAGCATTCGGTGTATTTGATGGTTGCCTAATCGGTGAAATAAAGGAATCTGGAAGTATGGAATTATCCACGTTAAATATATCGAATTTGTATGCTGCGCGATCTTTAGCATGGAGTGGAGATGGAACCAAGTTGGCAGTAGCATCGCAAACTGGTGCCGTTTTGGTCTTTGAAGCCGTCCTTAGACGTTGGGTGTGGCGGGACCTTATAGAGGTGCAGCACGTCAGCACACGTCAGCTGCTGCTGCGACGTCGTGGTGCTGATACTGCTGCGCTCACTGTTACCGCTAAACTAGCCCCCGATATATTTAATGTTAGATTTATTGGTAACGATTGGTACGCTGTCTGTCGTACAAGTAATAGTCTGATCCTGTGCGACATAGCTCGTGGTCTGACTAGCGAAATTCCATGGTCCGGTGGAGGGGAGCGTATATATGCAGCTGTGGGTGGAGCCTGTCTGTTGCAGCGTGCTGGCGAACTTGTGTCGTGGAGTACGGCCTTGATAGGGTACTACAAACTGTTTCCGGATGTGCGTACTGAGCGTGTGAATCCTCACGTGCTTAGTGTCCGTATCAATGAGGGCCGGAAGACGGAGGAAGAACGCAAACACTTCGCCTATTTGCTGGATAGACAGACGATTGCTGTCATTGATCTCGTTACTGGAGTTCAGTTAGGGCAATGGTGGCACGAAGCTCGGGTGGATTGGTTGGAGCTGAATGAGAGCGGACATCTGCTTCTGTTCCGCGATACTAGGCGACGTCTAGCACTTCTCCGTATTGATACCGGTGATAAGGAAATTATCGCGAGCGGAGTTAGTTTCGTGCAATGGATAGAAAACAGTGACGCTGTTGTAGCCCAAACCCCAACTCATTTGCTCATTTGGTACAGTGTATGGGAGCCTCAATGTGTTGAAATGTCTGAGTGTGGAGGCGGCTCGGCCGTATCGGTGTCAGAGCGACGAGTCGTACTGGAAGGTGGTCAGATTCAGGCCATCGTTTTGGATGAACATCGACTAGCTTTCAATTCGGCGTTACGTAGCGGGGACTTACAAGATTGTGCTCAGTACTTGGATGCTGTGTCACGGTCTGCGGACGTCGGGACGCTGTGGTGCCAACTGGCTGAGCAAGCTTTGACTGCTTACGATGTTGAGTTGGCGACGAAGTGCTATAGAGCTGTGGGTGATGAGGCTAGAACTTTTTATCTAGAGAAAACTGTCGAGTTAGCTTCAGCCAAAGGGAACGGGAATATCGATGAAGGTTTAAGGAGTCCCGAGGTTCGTGCACGTCTATCAATCTTTGTGGGAGATTTAACCACCGCCGAAGAATATTATGTACGCGGAGCCGCTCAGTCAGAACTGGCCATTAATATGTATAAGCAGTTCAATAGATGGCCGGACGCTATCGCCCTCGCTGAAAAGGTCGATAGACAGGCGGTGACGGCGTAG

Protein sequence:

>DPOGS204851-PA
MRLKFSKTLLDAQESDIPVADICWSPNNVKLAVGTSERVVLLFDRDGMRRDKFSTKPADAAAGKKSYVITGLAFSDNSELLGVAQSDNMVFVYRIGADWSGKKVICNKFPLTGSPLRLLPAETGFFTGTSDGKIRSLDCKTNKSSSLWSAGSCCVSLARGSEAMLASGHIDGTIYLNGRLILRYTLPPTAMVLVSSYLIVGACDGRITMYEAQRGALVRSLEPTLPPDRRDIISASLSPSGQTIAFGVFDGCLIGEIKESGSMELSTLNISNLYAARSLAWSGDGTKLAVASQTGAVLVFEAVLRRWVWRDLIEVQHVSTRQLLLRRRGADTAALTVTAKLAPDIFNVRFIGNDWYAVCRTSNSLILCDIARGLTSEIPWSGGGERIYAAVGGACLLQRAGELVSWSTALIGYYKLFPDVRTERVNPHVLSVRINEGRKTEEERKHFAYLLDRQTIAVIDLVTGVQLGQWWHEARVDWLELNESGHLLLFRDTRRRLALLRIDTGDKEIIASGVSFVQWIENSDAVVAQTPTHLLIWYSVWEPQCVEMSECGGGSAVSVSERRVVLEGGQIQAIVLDEHRLAFNSALRSGDLQDCAQYLDAVSRSADVGTLWCQLAEQALTAYDVELATKCYRAVGDEARTFYLEKTVELASAKGNGNIDEGLRSPEVRARLSIFVGDLTTAEEYYVRGAAQSELAINMYKQFNRWPDAIALAEKVDRQAVTA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: