MonarchBase - Protein-coding gene

DPOGS203950
Transcript	DPOGS203950-TA	3537 bp
Protein	DPOGS203950-PA	1178 aa
Genomic position	DPSCF300005 + 122188-149683
RNAseq coverage	113x (Rank: top 59%)

Annotation
*Heliconius*	HMEL012085	77.05%
*Bombyx*	BGIBMGA000478-TA	55.75%
*Drosophila*	Oseg1-PA	41.25%
EBI UniRef50	UniRef50_Q6NYH1	40.76%	Intraflagellar transport protein 122 homolog n=5 Tax=Coelomata RepID=IF122_DANRE
NCBI RefSeq	XP_972704.1	44.01%	PREDICTED: similar to intraflagellar transport 122 homolog [Tribolium castaneum]
NCBI nr blastp	gi\|91078312	44.01%	PREDICTED: similar to intraflagellar transport 122 homolog [Tribolium castaneum]
NCBI nr blastx	gi\|91078312	43.97%	PREDICTED: similar to intraflagellar transport 122 homolog [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	4.8e-38	protein binding
KEGG pathway	amr:AM1_2944	3e-10
	K02033 (ABC.PE.P)	maps->	ABC transporters
InterPro domain	[19-282] IPR011046	4.8e-38	WD40 repeat-like-containing domain
	[20-283] IPR015943	2.6e-34	WD40/YVTN repeat-like-containing domain
	[49-88] IPR001680	1.4e-07	WD40 repeat
	[51-87] IPR019781	3.8e-06	WD40 repeat, subgroup
Orthology group	MCL11468		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203950-TA
ATGAGAACTGTTCCGAAGTGGGTAAATAAAATTCATGAAGCTGATAAAATTGAGTTTTCGAGTGTACACGCAATATGCTTCAGTCCAGATGGCACTCAATTAGTAGTAGGTGCTGGAGAAAAGGTCATGGTTTATGACCCAAGAGATGGTTCACTGTTACAACTTCTGCAGGCCCATAAAGGAATGGTTCATACTGTAGCTTATTGCAGTGATGGCAAAAAGTTTGCTAGTGGTAGTGCAGACAAAAATGTAATCATATGGACATCTAAAATGGAAGGTGTTCTTAAATATTCACACAGTGAAGCAATCCAATGTGTAGCATATAATCCGGTCACTTATCACTTAGCTTCATGCGCACTCTCTGATTTTGCATTCTGGTCAGCCGATGTCAAAGCTGTTCAGAAATATCGAGTGGCAGGTCGGATTACTAGTTGTGCTTGGGCAGCAACAGGTCAATACCTAGCTATTGGACTTGCTAGTGGCATAGTTTCAATTCGCAATAAGGTTGGTGATGAAATTACCAGAATAACAAGAGATGCTGCAGTGTGGGCTGTAGCATTCTATAAGAACACATTATTGGTTACAGACTGGAATGATACCCTATCATTTTATGATATGATGGGACAACCTCTTTTGAAAGAAAGAAATATAGAAATTTCGGCTGTTTCAATGACAATTTTGGGTGCCTTGATATTAGTTGGTGGCTTGGGGGGTTGGGCCATACTTACCTCAGAAGGAGTATCAATATTAAATACATCACTGGACTGGGTATGGTCTATTGCACCATCACCAATTACAAACACTATGGCAGTTGCATGTCAAGACGGAACTCTGTGGTGTTACCAAGTTGTCTTCAACACAGTTCATGGGCTATTTCGAGAGAGATATGCTTATAGAGAAAATATGACAGATGTTATTATACAGCACCTAACAACGGGCAATAAGGTTCGGATTAAATGTCATGATAGAGTGCAAAAGATTGCTATTTACAAACATCGTTTGGCGGTTCAACTCCCCGAAAGGGTAGTGGTTTATGAACAAGGTGATCCTGAGGGCATGTTATATCGCGTCAAGGAGAAGTTGGTTCAGAAATCTGAATGTTCGTTGTTGGTAGCCACCAGCGAATCCCTGTTACTATGTCAGGACACAAAACTGGTAATGATCGGTTTGAAGATACCAAAATCATGGACCGTCCCATCACCGATACGTTACGTCAAAGTTACTAGTTTATACTTTGAAGAAGTATTACTCTTAGGATTGCTTAATGGACAGATATGGCAAGTGGAGCCTAACAAAGGTACGGCTAGGATGGTTGTGCAGACTGCGGGTAGTGTCCGTTGTTTGGACGTGAGCGCCTCACGTGGCCGGCTAGCTGTCGTGGATGAGAACTCAGTCTGCCGCGTGTACAGCCTCCCAGCTGGGGATCTCCAATATACGGAGGAGAACGTGTCGTCAGCTTCGTGGAATTCATGGTGCGAGGAACTTCTCTGTCTCTCTGGTAACGGCTTGTTGTCAATCAAGGCGGGACAATTTCCACCAGCAACACAACCACTGGCCGGCTCCGTTGTCGGCTTCCAGGGTGGTCGTGTTTTTTGTCTGCAAGCCAATTTGATGCAGACTATCAATGTTCCTCTATCTCACGCTGTCCATCAGTACGTACAACAAAAGATGTTCAACGAAGCGTATGCAGTCGCTTGTATGGGAGTGACAGCATTGGACTGGGAGCGTCTTGGAACCGCTGCCTTAGAAGAGCTCTCCTTCGAAGTGGCTCGCAAGGCCTTCCAGAGGAGCGAGAATATTGTTTTATTATCGCTCATTGATCACTTACAGGAACGCTTGGAGAGCGGTGAGAAGAGGCAGGTTATAATAGGCGAGGTGTTGGCTTACCGCGGACGATACAACGAGGCGGCGAGGGCGTTCCAAACAGCTGCGAGGAATGACAAGGCACTGGCGCTCTATCTAGACCTTCGCATGTTTAATAAGGCACAAGAATATGTAGGCGAGGGCGAGGGTGTGACCAAACTAGCACGTCAAAGGGCGGAGTGGGCTCGAAGAGTCAATGAACCCAGAGCAGCGGCGGAGATGTACCTCGCGGCAGGAGATGTGCGCAGTGCTGCCACCATACTAGCAGAGAGCGGCCGACGGGATATGCTAATAGAACTAGCTCGCAAAATGGACAAAGGTTCCAGTGAATCTTTACGTCATCTGGCAGAGGCGCTCGTAACTGCTGGTGAATACCCCACAGCTGGAGATGTCTATCACCGACTAGGAGATTACAAGAAAATGGCTCAGTTAGCTGTGACAGCTGGCGATTGGGTACGTGCGTTCTCTTTGGCACGCGAGCACGAGGAATGCAGGCGTGATGTTTATCTGCCTCATGCGCACCGTATGGCCAGAGAGAACAAATTTGTTGAAGCCCAAAAAGCATATCATATGGCGGGTGAAACAGAAACAGCTATGCGTGTTTTCAGTATTCTTGTAAATAATGCTGTGGCAGAGGAAAGATTCAATGATGCCGGATACTTACATTACTTGCTAGCAACACAGTGCTTAGAATCAGCAACTGCAGCACAGAACAGGGATAGAGCTACATTGCTGCATCAGTACGCTCACAACGAGCGTCTGTCCCGTGTGTATAACGCATACGACTCGGTACATCATTGTGTTCACGAGCCCTTTTCGTTGTCTCAACCGGACGTCCTATTGAACGCCGCCAGGTACGTCCTCGCGCTCTTGGAGGAACCCCCGCCCGGACTCTCCATGTTTTGTTTGTACTTATGCTTGGCGAAACAAGCTAAAGTGCTCAATGCAAACACGCTGGCTCGTCAGATGCTCAATAAGATACACGGTCTCCAAGTGCCACCCAAGTTTCAGGAAGGAGTCGAGTTACTAATGCTGAACAGCGGAGCTAGTAGCTCGTCTGAATCAGAAGACATTTTGCCATTATGTTGGCGGTGTCGTAGCCACGTGCCAGCGCTGGCTACCACTTGTCCAAGATGCAGACATGTGTTGGCCCATTCGCTGGCAACTCACGAGGTGCTGCCGCTAGTTCAGTTCGAGCCGGCTGAAGGAATCACGTTTGAAGAGGCGATGGATCTTATAGAACGCACTCCGATACCGGAGATTGAAGGAGCTAATGAAGGCGCTGACATACTTAAGATAGATAACGACATAGACTACGCTGATCCGTTCCTTGATAAGGTCGATGAGGAGGACAAAGGCGTAGTAGTTTGCAGTCGTTTAGCTCTACTGAGATTGAATCCAGCCAGTCTAGTGATAGTGAACCGTCCCCCTCTTAAACCAGTCTTTTACCGTAACATGTTGCCCGAACTGCCAGTCACCACCTGCCCAGCCTGCTATAATCTATTCTACATGGAAGATTACGAGGTCCAAATCATCTCCAAGGGGCACTGTCCCTTTTGTAGACACAGTGCTGAAGTTGCATCAAATGAAGACGGTATAAACGACTCGATATTTAACGATTCGGGAACGTCTAGCCCTAACAGTGCCAGCAATGAGCAGTCATCATGGCACTAG

Protein sequence:

>DPOGS203950-PA
MRTVPKWVNKIHEADKIEFSSVHAICFSPDGTQLVVGAGEKVMVYDPRDGSLLQLLQAHKGMVHTVAYCSDGKKFASGSADKNVIIWTSKMEGVLKYSHSEAIQCVAYNPVTYHLASCALSDFAFWSADVKAVQKYRVAGRITSCAWAATGQYLAIGLASGIVSIRNKVGDEITRITRDAAVWAVAFYKNTLLVTDWNDTLSFYDMMGQPLLKERNIEISAVSMTILGALILVGGLGGWAILTSEGVSILNTSLDWVWSIAPSPITNTMAVACQDGTLWCYQVVFNTVHGLFRERYAYRENMTDVIIQHLTTGNKVRIKCHDRVQKIAIYKHRLAVQLPERVVVYEQGDPEGMLYRVKEKLVQKSECSLLVATSESLLLCQDTKLVMIGLKIPKSWTVPSPIRYVKVTSLYFEEVLLLGLLNGQIWQVEPNKGTARMVVQTAGSVRCLDVSASRGRLAVVDENSVCRVYSLPAGDLQYTEENVSSASWNSWCEELLCLSGNGLLSIKAGQFPPATQPLAGSVVGFQGGRVFCLQANLMQTINVPLSHAVHQYVQQKMFNEAYAVACMGVTALDWERLGTAALEELSFEVARKAFQRSENIVLLSLIDHLQERLESGEKRQVIIGEVLAYRGRYNEAARAFQTAARNDKALALYLDLRMFNKAQEYVGEGEGVTKLARQRAEWARRVNEPRAAAEMYLAAGDVRSAATILAESGRRDMLIELARKMDKGSSESLRHLAEALVTAGEYPTAGDVYHRLGDYKKMAQLAVTAGDWVRAFSLAREHEECRRDVYLPHAHRMARENKFVEAQKAYHMAGETETAMRVFSILVNNAVAEERFNDAGYLHYLLATQCLESATAAQNRDRATLLHQYAHNERLSRVYNAYDSVHHCVHEPFSLSQPDVLLNAARYVLALLEEPPPGLSMFCLYLCLAKQAKVLNANTLARQMLNKIHGLQVPPKFQEGVELLMLNSGASSSSESEDILPLCWRCRSHVPALATTCPRCRHVLAHSLATHEVLPLVQFEPAEGITFEEAMDLIERTPIPEIEGANEGADILKIDNDIDYADPFLDKVDEEDKGVVVCSRLALLRLNPASLVIVNRPPLKPVFYRNMLPELPVTTCPACYNLFYMEDYEVQIISKGHCPFCRHSAEVASNEDGINDSIFNDSGTSSPNSASNEQSSWH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: