MonarchBase - Protein-coding gene

DPOGS207390
Transcript	DPOGS207390-TA	4770 bp
Protein	DPOGS207390-PA	1589 aa
Genomic position	DPSCF300267 + 106500-116316
RNAseq coverage	251x (Rank: top 42%)

Annotation
*Heliconius*	HMEL012245	84.65%
*Bombyx*	BGIBMGA008884-TA	78.95%
*Drosophila*	CG1109-PA	65.17%
EBI UniRef50	UniRef50_F4WM59	62.72%	WD repeat-containing protein 33 n=8 Tax=Formicidae RepID=F4WM59_ACREC
NCBI RefSeq	XP_969187.1	77.24%	PREDICTED: similar to wd-repeat protein [Tribolium castaneum]
NCBI nr blastp	gi\|91081997	77.24%	PREDICTED: similar to wd-repeat protein [Tribolium castaneum]
NCBI nr blastx	gi\|91081997	58.98%	PREDICTED: similar to wd-repeat protein [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	1.1e-95	membrane
	GO:0007166	1.1e-95	cell surface receptor linked signaling pathway
	GO:0005515	1e-88	protein binding
KEGG pathway	aag:AaeL_AAEL006669	0.0
	K06226 (SMO)	maps->	Basal cell carcinoma
			Pathways in cancer
			Hedgehog signaling pathway
InterPro domain	[1062-1393] IPR000539	1.1e-95	Frizzled protein
	[131-426] IPR015943	1e-88	WD40/YVTN repeat-like-containing domain
	[119-419] IPR011046	1.4e-78	WD40 repeat-like-containing domain
	[908-1025] IPR020067	1.6e-21	Frizzled domain
	[291-328] IPR019781	1.3e-08	WD40 repeat, subgroup
	[289-328] IPR001680	2.1e-08	WD40 repeat
Orthology group	MCL12511		Single-copy universal gene

Nucleotide sequence:

>DPOGS207390-TA
ATGGATTTTGGGACCCCTCCTCCAAACATGGGAATGCCTCCACCCGGCATGGGAGGACCTATGGGTCCACCAGGTCGAAACAATATTCGCCATAATTTTAGGCCTTTCAATTATCAAATGCGATTTCCACCACAGGGTCCTTTGAACATGACTCAAGATGATTTTGATGGTAAACGTTTACGTAAATCAGTTATGCGTAAGACTGTAGACTATAATTCAGCTATTATAAAAGCTTTAGAATGTCGCGTTTGGCAGAGGGATTGGCGGGATAGGCATGCGTTACAACCGGATGCTATGTACACACCTGATCTATTACCACCACCTTCATACCCAGACAATCCAATAAATGCTGTAACCACACGATTTGTTAAGACTGCAACAAATAAAATGAGATGTCCAATATTCGCTGTTGCCTGGACACCTGAAGGTCGGAGATTAATAACTGGAGCTTCATCGGGTGAATTTACTTTATGGAATGGTCTTACATTTAATTTTGAAACAATTTTGCAAGCACATGACTCTCCAGTCAGATCTATGGTTTGGTCTCATGGAGAGGGCTGGATGGTAACAGGAGACCATTCCGGCTTCATAAAATATTGGCAAAGCAACATGAACAATGTTAAAATGTACCAAGCCCATAAAGAAGCTGTTAGAGGTATAAGTTTTAGCCCCAGTGATGCTAAGTTGGTAACTTGTTCTGATGATGGTACATTGCGCATATTTGATTTCTATAGATGTCAAGAAGAGAGAATATTAAGAGGCCACGGAGCTGACGTAAAATGTGTACAGTGGCATCCTACAAAAGCACTTATTGTGTCAGGAAGTAAAGATAATCAGCAACCAATAAAATTGTGGGATCCTAAATCTGGTACGGCATTGTGTACTCTTCATGCACATAAATCAACAGTTATGGATTTGAAATGGAATGATAATGGAAACTGGTTAATAACTGCATCTCGTGATCATTTGTTAAAGCTCTTTGATATTCGCAAGTTAGGCACAGAAGTACAAGTGTTTAGAGGTCATAAGAAAGAAGCATCAAGTGTTGTATGGCACCCAACACACGAAGGACTGTTTTGTTCTGGTGGCTCCGATGGATCTATTTTATTCTGGAATGTAGGTACTGATAAAGAAGTAGGATGTATAGAAGGCGCCCATGAATCAATTGTTTGGACTATGGCTTGGCATCCACTCGGTCATATATTGTGTTCAGGATCAAATGACCACACCTCAAAATTTTGGACGCGCAATCGACCTGGAGATCAAATGAGAGACAAGTATAATCTCAATACCCTACCACCAGGTGTACAAGACGATAATGACCTTGAAGAGCCAGCAGCAATCCCTGGAATGGGTCCTGAAGATAAGGTTGATATATTCTCATCTGACACCGATAAGGTGATTCCTGGATTAGATTTAGATACTACATTAATTCCAATGGAGTTTGAGAAGAAAGTTAAGAAGGTGCCTTATAGCAAACCTATTCCAAGGAATTTCCAAGCCCAGTGGAATCATGGCCCAGCTGTAGACGATGCAGCTGCCGAGGCATTTACACAGGCCCTAGTTGAATCTGTTCCAGGAGCTGTTCCACTGCAGCAGATCAATCCTTCTGCCATCTTTATTTATGGTAAACTAATACCAGTAGAACCTGGCTCAAAATTAGAAAAAGCTATAACAGAAGGTCATGTTGCACTAAAGAGATACATAGCTACTGGCGAAATTGAAGAATTGGATGAAATGATGGCCCATCTGGAGGAGGACGCAGACGACGACAACTTCCCTCCATTTGAATATCCAACTCAAGAGAATAATGAAAATGAAGGTGAGAAAAGCGAAAATGAAAATGCGGAAAAAGAAAACTATGAACAAGAAGAATATTTTAACAATGAGATGGAAACTAGTGAACAGAATCCAGAAGATTATAATAATTATGATAATGGACCCGATATGTCAATGATGCCTCCCATGGTTCCTATGGGTAATATGCCACCAATGGGTTTGTTAAGACCTCCAATGAATATGGGACCTATGAGACCGCCTTTAGGGCCGCCACCACTTCATGCCATGCACATGCCACCACCACACATGGGAGGCATGCCACCAATGGGTGGAATGCCTCCTATGGGCCCCATGGGAAATATGCCTCCGATGGGCAATATGAACCAATTACCGCCTTTCTCAGACAACGGCTACAATAAAGGACACTTTGAGGGTGGTTATGAAAGTAACCAGTCGTTTTCACAAGAGAATAGTGAATATAATGAAGAAGAATCATTCGACCAAAATTATGAGGAGGAGAATTATAATGAGGAAGAGGACGGTGATGATAGCTATGGAAGAAATCAGAGGTGGATTGGTGGTTTTAGAGGCAGGGGTCAAGAGAGAAACAATAGAGGTCGAGGTCACGACCGTGGGAGAGGTCAGGATCGAGGTCGCGGTAGAGGTATGAATGGTTTCGGTAGGAATATGCGCAGAGGAGCTAATAGGATGTTCCGCTCGGGGTGGTTGTGGGGTATGCTGGTTGTATCGAGCTGTTGGGCGAGCCAGTACGATAACGGCGGCGAGAAGAACTCGCTAGGCGCGACTGGAACCAGCGAAAACACGACCGTCAGACTCGAAGCCATAGAGGGAACTCTGTATTACAGAGTGATTAAGGCAGAAAAAAGTCCTCAATGGTTCCCAGAACGGGAGTTGAAGCTAGACAGCTGCGTCAGGAGAGCCCAGTGCGAACCTTTGACCAAAACCACGTGCTTGGGAGTTAGGTTACCATACAATAGGACAAGCGTCCGCCTGACCTTCTACGACAGTCAGTACAAAATACAAAACCAACTGGAGCTATACAGGGAGTTGATAAACGTTCCTAAATGCTGGGCGGTTATACAGCCACTGCTCTGTGCTACGTTCATGCCCAATTGCGAGAGTATTAACGGGCAGGACATGGTGCACCTGCCATCGTACGAGATGTGCAAAATAACTATGGAGCCGTGTGCGATCCTGTATAACACCTCATACTTTCCGTCCTTTCTGAAATGCAACGCCACATTGTTCCCGCCGAAATGCGAGAACGCTGCCAGGGAGATGAAATTCAACACGACCGGTAAATGTCTGCCGCCGCTTATACACACGGACAAACGACATCACTTTTACGAAGGTATATCGGGCTGTGGCGTACCTTGCCGCGATCCCCTGTACACGGAGGACGAGCACGCGCAGATCCACCGTCTGATCGCATGGGGTGCGGGTTCATGTCTAGCTCTCAACCTGCTCACCGTGGCCACCTTCCTTATAGACTGGCGCAGCGCTAATAAGTACCCCGCGCTCGTCATTTTCTACATCAACGTGTGCTTCGCGGTAGCGTCCATGGGTTGGCTGGTACAATTCGGAGTGGGTTCGAGGGATGATATAGTTTGCTCGAAAGATGGCACTAGACGCCAAGGAGAGCCTTCAGCTGAAGAGAATCTGTCTTGTGTTGTTGTCTTTGTATTGGTTTATTATTTCATGATGGCGGCATGCGTTTGGTTCGTGATATTCACGTACGCGTGGCACATGAGCTTCAAAGCGTTGGGTAAAATTCAAGATCGTATAGACAAGAAGGCGGCATATTTTCACCTGGTGGCGTGGTCCCTACCACTGATACTCACCATCACGACCATGGCGTTCGGTGAGATCGACGGTAACAGCGTAACCGGCATCTGCTTCGTGGGTTACGTCAACCATCCGATGAGAGCGGCCTGGTTGTTGGCACCACTGTCAGTAGTATTGTTACTCGGCGGTTATTTCCTACTGAGAGGTGTGTTCTCCTTGATAGCGGTCCGCGTGTCCAGTAAGGACGTGATCTCTCCGCGCGCCTCCAACAAGATCCGTCAGACTATCACCCGCTGTTCGTTGACCGCTGCCCTGGTGGCCGTGTTCATCTGCGTCACGTTCGCGTGTCACGTGTACGAGTTCAGAAACGCCGAGGCTTGGAAGGAAGCGTTCAAGAATAACATCATCTGTCGCCTAGAGTCGTGGCGTGATCCGTCACTGGCTGGCCGCGAGTGTTCGCAAGGCGCTCGTCCGTCTGTGTCGGTGTTACAACTACGCCTACTGTGCTGCTTCGCGTCGGGAGCGCTAATGGCCTCGTGGACTTGGACGCCCAGCACCATGATGTTGAATGGCTCGATGATAACGACGAAATGTGGTTGCTCTGTAGAAGCCGATATGACGCGGCGTGCTCATAAACACGAGCTGATAGCGCGCGCGTACAGGCGGCGCAACGAGTTCATTACTAGAGGTAGACTTTCCATATCGCTCGGAGGTTCCAGGCAAGATCCCGTGGGCTTCTGTTTGGACAATTCGCCCGCTGATTACCCGGAAGACGCCAAACATGAGAGCGGCGAGTTGTCGTCGTCGTGGGCAGCGAACTTGCCGCGTTTCGTCCGACGTCGCGACGCCCTAGTGCTGCCTCAACACGCGCACCACTCGCACGACATGTCCTCTACTCCGGACCGCAGGAACTCACAAGACTCACAAATAAGCATCAGCCTCCGCCACGTGTCCGTCGAATCGCGCCGTAACTCGCTCGACAGTCAACTTTCGGTGAAAATAGCTGAAATGAAGACTAAGGTCGGAAGGCGGCGGACAAAACACAGTAAAGCCAAACGTAAACGAGCTTCAGTGCGTAAAGAAAGTACTCCCTCGATTGAGAGTCAGATAAGTCGGTACTGGTTACAAGCGGTCGCAGCTAACGCGGACCCCTCGCGCGAGGAGGTCAAATTTAGTTTCGACTGA

Protein sequence:

>DPOGS207390-PA
MDFGTPPPNMGMPPPGMGGPMGPPGRNNIRHNFRPFNYQMRFPPQGPLNMTQDDFDGKRLRKSVMRKTVDYNSAIIKALECRVWQRDWRDRHALQPDAMYTPDLLPPPSYPDNPINAVTTRFVKTATNKMRCPIFAVAWTPEGRRLITGASSGEFTLWNGLTFNFETILQAHDSPVRSMVWSHGEGWMVTGDHSGFIKYWQSNMNNVKMYQAHKEAVRGISFSPSDAKLVTCSDDGTLRIFDFYRCQEERILRGHGADVKCVQWHPTKALIVSGSKDNQQPIKLWDPKSGTALCTLHAHKSTVMDLKWNDNGNWLITASRDHLLKLFDIRKLGTEVQVFRGHKKEASSVVWHPTHEGLFCSGGSDGSILFWNVGTDKEVGCIEGAHESIVWTMAWHPLGHILCSGSNDHTSKFWTRNRPGDQMRDKYNLNTLPPGVQDDNDLEEPAAIPGMGPEDKVDIFSSDTDKVIPGLDLDTTLIPMEFEKKVKKVPYSKPIPRNFQAQWNHGPAVDDAAAEAFTQALVESVPGAVPLQQINPSAIFIYGKLIPVEPGSKLEKAITEGHVALKRYIATGEIEELDEMMAHLEEDADDDNFPPFEYPTQENNENEGEKSENENAEKENYEQEEYFNNEMETSEQNPEDYNNYDNGPDMSMMPPMVPMGNMPPMGLLRPPMNMGPMRPPLGPPPLHAMHMPPPHMGGMPPMGGMPPMGPMGNMPPMGNMNQLPPFSDNGYNKGHFEGGYESNQSFSQENSEYNEEESFDQNYEEENYNEEEDGDDSYGRNQRWIGGFRGRGQERNNRGRGHDRGRGQDRGRGRGMNGFGRNMRRGANRMFRSGWLWGMLVVSSCWASQYDNGGEKNSLGATGTSENTTVRLEAIEGTLYYRVIKAEKSPQWFPERELKLDSCVRRAQCEPLTKTTCLGVRLPYNRTSVRLTFYDSQYKIQNQLELYRELINVPKCWAVIQPLLCATFMPNCESINGQDMVHLPSYEMCKITMEPCAILYNTSYFPSFLKCNATLFPPKCENAAREMKFNTTGKCLPPLIHTDKRHHFYEGISGCGVPCRDPLYTEDEHAQIHRLIAWGAGSCLALNLLTVATFLIDWRSANKYPALVIFYINVCFAVASMGWLVQFGVGSRDDIVCSKDGTRRQGEPSAEENLSCVVVFVLVYYFMMAACVWFVIFTYAWHMSFKALGKIQDRIDKKAAYFHLVAWSLPLILTITTMAFGEIDGNSVTGICFVGYVNHPMRAAWLLAPLSVVLLLGGYFLLRGVFSLIAVRVSSKDVISPRASNKIRQTITRCSLTAALVAVFICVTFACHVYEFRNAEAWKEAFKNNIICRLESWRDPSLAGRECSQGARPSVSVLQLRLLCCFASGALMASWTWTPSTMMLNGSMITTKCGCSVEADMTRRAHKHELIARAYRRRNEFITRGRLSISLGGSRQDPVGFCLDNSPADYPEDAKHESGELSSSWAANLPRFVRRRDALVLPQHAHHSHDMSSTPDRRNSQDSQISISLRHVSVESRRNSLDSQLSVKIAEMKTKVGRRRTKHSKAKRKRASVRKESTPSIESQISRYWLQAVAANADPSREEVKFSFD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: