MonarchBase - Protein-coding gene

DPOGS210562
Transcript	DPOGS210562-TA	1536 bp
Protein	DPOGS210562-PA	511 aa
Genomic position	DPSCF300304 + 187215-189910
RNAseq coverage	628x (Rank: top 20%)

Annotation
*Heliconius*	HMEL009555	93.21%
*Bombyx*	BGIBMGA013454-TA	90.82%
*Drosophila*	CG5451-PA	75.78%
EBI UniRef50	UniRef50_Q9VE18	75.78%	CG5451 n=47 Tax=Eukaryota RepID=Q9VE18_DROME
NCBI RefSeq	XP_393446.1	78.71%	PREDICTED: similar to CG5451-PA isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|383851711	78.52%	PREDICTED: WD40 repeat-containing protein SMU1-like [Megachile rotundata]
NCBI nr blastx	gi\|383851711	78.52%	PREDICTED: WD40 repeat-containing protein SMU1-like [Megachile rotundata]

Group
Gene Ontology	GO:0005515	1.2e-69	protein binding
KEGG pathway
InterPro domain	[167-511] IPR015943	1.2e-69	WD40/YVTN repeat-like-containing domain
	[210-510] IPR011046	1.3e-69	WD40 repeat-like-containing domain
	[338-376] IPR019781	3.3e-10	WD40 repeat, subgroup
	[337-376] IPR001680	5.3e-09	WD40 repeat
	[40-92] IPR006595	3.1e-07	CTLH, C-terminal LisH motif
	[6-38] IPR006594	1.7e-06	LisH dimerisation motif
Orthology group	MCL14191		Single-copy universal gene

Nucleotide sequence:

>DPOGS210562-TA
ATGTCTATCGAAATTGAATCTGCAGATGTTATCCGTCTGATACAACAATACTTGAAGGAGTCTAACCTCACAAAAACTTTGCAAACGTTACAGGAGGAGACAGGGGTTTCATTGAACACAGTTGATAGTGTTGATGGATTTTGTGCCGACATAAATAATGGTCACTGGGATACCGTGTTAAAAGCAACAGCATCATTAAAGCTGCCTGATAAGAAACTTATGGATTTATATGAACAAGTGGTCTTGGAACTCATTGAGTTACGTGAGCTGGGTGCCGCTCGAACATTGTTGCGCCAAACCCAGCCCTGCTTGCTCATGAAGCAACAGGAGACGGATAGATACATGCATCTTGAAAATATGTTGGCTCGATCATATTTCGATCCTCGGGAAGCATACGGAGCTGGTGGCAAGGAGTGGCGACGCTCGGCGCTGGCCGCAGCACTGGCGGGTGAGGTCTCCGTGGTTCCATCTTCACGTCTCCTAGCGCTGCTGGGTCAGGCGCTGAAGTGGCAGCAGCATCAGGGTCTACTGCCGCCAGGAACCACCATTGATTTGTTCAGAGGCAAAGCTGCTATTAGGGACGAAGAAGATGACCAATACCCGACACAAGTGTCAAAGATTATAAAATTTGGCCAAAAATCTCATGTTGAGTGTGCAAAGTTTTCCCCCGACGGCCAGTACTTGGTGACGGGGTCCGTGGACGGGCTGGTGGAAGTGTGGAACTTCACGACGGGCAAGATCCGCAAGGATCTGCGGTACCAGGCGCTCGAAGAGTACATGAGCATGGAGGAAGCCGTGCTCAGCCTGGCCTTCGCGAGAGACTCCGACACGCTGGCGGCCGGAGCCAACGATGGCCGCGTCAAGGTGTGGAGGGTCGCCAGCGGACAGGTGCAGCGCAAGTTGGAGCGAGCCCACGCCAAGGGAGTCACGTGTCTGCAGTTCGCCAGAGACAATACTCAGATACTGTCCGCCTCCTTCGACCGAACCATCAGGATCCACGGATTGAAGTCGGGAAAGATTTTAAAAGAATTTCGAGGTCATACGTCGTTCGTGAACGAGGCTGTGTTCACCCCGGATGGACACAGCGTGCTAAGCGCTTCCTCCGACGGCACGGTCAAGGTGTGGTCGGTGCGCTCCGGGGAGTGTACGGCGACGTTGAAGCCGCTGGGGTCTGGGGAGCCGCCCGTCAACTCGCTGCTGCTGATGCCCAAGAACCCGGATCACTTCGTGGTGTGTAACAGGACCAACACCGTGGTCATCATGAACATGCAGGGACAGATCGTGCGCTCCTTCACCAGCGGCCGGCGCGAGGAGGAAGGCGGTGCCCTGGTGTGCGCGGCGCTCGGAGCGCGTGGCCGCCTCGTGTACTGCGCCGCCGAGGACCTCGTGCTGTACGCCTTCTGCGCCGCCAGCGGCAAACTCGAGAGGACCATCAATATCCACGAGAAGGCGGTCATCGGTATGACGCACCACCCTCACCAGAACCTGCTGGCCACCTACAGCGAGGACGGACTCCTGAAGTTGTGGAAGCCGTGA

Protein sequence:

>DPOGS210562-PA
MSIEIESADVIRLIQQYLKESNLTKTLQTLQEETGVSLNTVDSVDGFCADINNGHWDTVLKATASLKLPDKKLMDLYEQVVLELIELRELGAARTLLRQTQPCLLMKQQETDRYMHLENMLARSYFDPREAYGAGGKEWRRSALAAALAGEVSVVPSSRLLALLGQALKWQQHQGLLPPGTTIDLFRGKAAIRDEEDDQYPTQVSKIIKFGQKSHVECAKFSPDGQYLVTGSVDGLVEVWNFTTGKIRKDLRYQALEEYMSMEEAVLSLAFARDSDTLAAGANDGRVKVWRVASGQVQRKLERAHAKGVTCLQFARDNTQILSASFDRTIRIHGLKSGKILKEFRGHTSFVNEAVFTPDGHSVLSASSDGTVKVWSVRSGECTATLKPLGSGEPPVNSLLLMPKNPDHFVVCNRTNTVVIMNMQGQIVRSFTSGRREEEGGALVCAALGARGRLVYCAAEDLVLYAFCAASGKLERTINIHEKAVIGMTHHPHQNLLATYSEDGLLKLWKP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: