MonarchBase - Protein-coding gene

DPOGS212420
Transcript	DPOGS212420-TA	3099 bp
Protein	DPOGS212420-PA	1032 aa
Genomic position	DPSCF300258 - 24160-29779
RNAseq coverage	86x (Rank: top 63%)

Annotation
*Heliconius*	HMEL005865	3e-165	54.84%
*Bombyx*	BGIBMGA002819-TA	0.0	58.43%
*Drosophila*			%
EBI UniRef50	UniRef50_UPI0000E493B2	2e-117	29.63%	UPI0000E493B2 related cluster n=1 Tax=unknown RepID=UPI0000E493B2
NCBI RefSeq	XP_967922.1	1e-148	33.50%	PREDICTED: similar to WD repeat domain 66 [Tribolium castaneum]
NCBI nr blastp	gi\|91089785	2e-147	33.50%	PREDICTED: similar to WD repeat domain 66 [Tribolium castaneum]
NCBI nr blastx	gi\|91089785	1e-147	33.50%	PREDICTED: similar to WD repeat domain 66 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	2.8e-16	protein binding
	GO:0005509	1.3e-07	calcium ion binding
KEGG pathway
InterPro domain	[93-490] IPR011046	2.8e-16	WD40 repeat-like-containing domain
	[750-795] IPR015943	4.6e-15	WD40/YVTN repeat-like-containing domain
	[857-954] IPR011992	1.3e-07	EF-hand-like domain
Orthology group	MCL12862		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS212420-TA
ATGAACGGAACATCTTCGAAGTTACAATCTCAGTCCACCGTCCGATCGTTCGGTGCTAGCGAGTCGGACTTAAGAAGGCTTTACACTCTGTCTCTATCCCAGATAAGGAATCGTTGCGAGCGTGGAGAAAATAGTAACTACAAACCTTCACCCTTCAATATACGTTGGGTTCATGGCTACAATCCCAGAGTTGGGGTCATCAACCTTGTCAAGGATGACTCTCCTACCCTCGCTTTCTACGCGGCAGGGTATTGCGGCGTGATTTACGATTGGATGGAAAATACTATGATGATACTCCAGGGTCATAAACATACAATTATTTGTATAGACTCAGACGCGAAAGGGGATTGGCTTGTTACTGCCGATTCGGGACCGGAGAACGTGGTTATTGTGTGGGATAGAAAAGATTGTTTTCCTCAAAGGACTATTTTCAATCCTCACGGAAATGTAAAATTGGCTGACGTGGTCATCAGCTCGGATGCTAAGTACCTTCTAACCCTGGGTTATCATGAAAAGGCTACTATTAACTGGTGGATATGGTCGATTGGTTCAGATGTCCCTCACGCTTCATTAGAAGTAGACATTCCAAAAGGGGGAGTGGTGGATATGGGATTTAATCCTTACAAAAGTGAGCAGTTTCTTTTAATGACGAAACATGACATTTGGCTCTTTGTCTCAAGTAAAATATTTGTCTTCGAGAGAGGACTTATAAAAGAAACCGATGATTACGAACTTAAAATAAAAATACCCAACAAGAAAATTAATCCCGATAACGGTTTGCTGACCGCTTTCACGTTTGTGGAAGAAACCTCTCAGATACTCGTGGCCACAAGCCGGGGATCCGTTCTCGTTTATGGATACACGATAGAGTTCACGGACAACGTGGATTCATCTTCCTTTGAAAACTTAAGATTCATTAAGGTGCTTAAAGTACAGACGAAGAGAATTAACGTCATCCAAAACATAGATGGAGTTGTGGTGACGGGCAACAACGCGGGTGAGATTCACTTCTATGACAACCAGGTGAAATTGCTGTATTGGATCCACGGCTTCACTGTCGACTCTGTCAAACAATTGAGTTTCAACATATCCCGAAGAAGCTACCAGATACTAGACCCAAAATGCAGAAAAGTCTGCCAATGCTGGGATGATGTCCAAACTGAATTCGATGAAACGACAGGCCAACCGTGTCATAAAATTATGAAAAAAGATGTCCCATTAGATGCGACTACCGGAAACAAGCCGTTCATCATCAGAGATTTCATTGTTTGTACAAACAATGAGGGAGTATATTTTGTTGATTTTCTAACAGAGAAGCTGACCACAGTTTTAGATAATAATGTTTCACACGCCTTATCCTTGTCTGTGAATCCGGAAAAAACGTTTGTTTGCATCGGATATGGAAACGGTGTTATTGAGTTATTCAATTACGTGTCCCACAAATTGTTCGTGAGGGTCGATTTGAGAGAACATTTTAAAACAACTATCCCGCCCAAGGACGACTCCCTCAAAGATGAACAAGAAGTCACTAAGCCAGAGATTTCAGTTACATGTTTGAAATATTCGCCATCAGGATTACACCTAGCCTGCGGTCTAGATAATGGCGAACTAATATTCCTAGACCCCACCACCATCAGCATTAAATCTAAAACCCCCCATAAAGACACCAGCTTCGCGATCACTCAGATTAACTACAGCTGTGATTCTCGGACTTTGGCCTTGGCTGACTCTGGCAGAACTGTACTAGTTTATAAATATGATTGCTCAAACTTTTTATGGACATTCATTGGGAAGCACAGAGCACATTATAAGGACGTAACTTCCGTTTTTTTCCTTCCAAAGAAAAACGTGAATGGGGAATACAAGTTGTTATCCCTTGGAATGGATCGAATCATGGTTGAGTACGACATTGGCGAAAGTTCTGAAGAGTACCTCGAGGTTTTGAGTTTAGACAGAGTGGATCAGACTGCCATACCTCTATTTGGTATCCCATGGCCAAATCCCCCGGATATTGATCCAGAAATACATCGGACCGATCTACCCCTGATTCTTATTGCTAATGATGAGTTCAAATACAAAATTGTTAACTATGGGACAACTATGACGTTATCTACCATACTGGGTCCAAGATACGAGAGCCCCGTGTGCCGTATGCAATTAGTTACAATCACTAAGGACGATAGACAGATGCAATACCTTCTCTACGCTACCAAAAATGTGGTTGGCCTGCAGAAGATGCCGTTAGACGGCAATCCTTGGAAGCACACAGCTCTGCTGGGACATCCTACTCACATTATCGACATGTGCTTCCGAGAAGATAGCGGAACGTTGTTTACGCTCGGAGCAAAGGATAACTGTGTCTATCAATGGGCTGCTAATTACAGGTCAGTGGAGACGACCACGAAGCTAGGTGGCGGTTATCTGGACCCTTACTACTGCCTGATGGAAGGCGGTAGACCAGGCTGGCTGTTCCAAGAGATTCGTGATCTATTTTACTATATACAGATTCTTTGTCAAGGAACCTTCTCACCTGCCATGCGACGCGTTAAGGATTTTATTCCAATTGATTCGCTGTCTGATCTGATGCGGGCTTTAGGATATTTCCCGTCAGAGTACGAGGTAGAAAACTTAATAATAGAAGCGAAATATAAGGTTTTTCTCAAAAAACCAATGACTGAGATTGATTTCGACGACTTTGTCAAATTATATATAAATCATCGGCCAGCTCTTGGGGATAATTTCAAGAGAATTAAAAACGCTTTCCGTCGTTTTGCTGACGCGGATAACAGCAATCTTACCATAAGTCGCGACGAGTTTATCCGAATATTATGTACAAATGGTGAAAGCTTCAGTAACCAGTTGTTGTGGTACCTCTTGTCAATATTATATGGACACAGTTTTGAAGATAGAACAGCCATGATGCCCGATGACTTTTCCTTTTTACCCGAGGAGATAACATTGGAAGAGCTAGCAATGAACGTAATAGGAATACAAGACCTGGAAGTTCTATCCGAGCAGTACTCCATGAAGGAATCCTTTGGATCTCAACAAACCGGAGACACTTCTACAGAGTCTGCAATTAGTAGCAGATTATTTTAA

Protein sequence:

>DPOGS212420-PA
MNGTSSKLQSQSTVRSFGASESDLRRLYTLSLSQIRNRCERGENSNYKPSPFNIRWVHGYNPRVGVINLVKDDSPTLAFYAAGYCGVIYDWMENTMMILQGHKHTIICIDSDAKGDWLVTADSGPENVVIVWDRKDCFPQRTIFNPHGNVKLADVVISSDAKYLLTLGYHEKATINWWIWSIGSDVPHASLEVDIPKGGVVDMGFNPYKSEQFLLMTKHDIWLFVSSKIFVFERGLIKETDDYELKIKIPNKKINPDNGLLTAFTFVEETSQILVATSRGSVLVYGYTIEFTDNVDSSSFENLRFIKVLKVQTKRINVIQNIDGVVVTGNNAGEIHFYDNQVKLLYWIHGFTVDSVKQLSFNISRRSYQILDPKCRKVCQCWDDVQTEFDETTGQPCHKIMKKDVPLDATTGNKPFIIRDFIVCTNNEGVYFVDFLTEKLTTVLDNNVSHALSLSVNPEKTFVCIGYGNGVIELFNYVSHKLFVRVDLREHFKTTIPPKDDSLKDEQEVTKPEISVTCLKYSPSGLHLACGLDNGELIFLDPTTISIKSKTPHKDTSFAITQINYSCDSRTLALADSGRTVLVYKYDCSNFLWTFIGKHRAHYKDVTSVFFLPKKNVNGEYKLLSLGMDRIMVEYDIGESSEEYLEVLSLDRVDQTAIPLFGIPWPNPPDIDPEIHRTDLPLILIANDEFKYKIVNYGTTMTLSTILGPRYESPVCRMQLVTITKDDRQMQYLLYATKNVVGLQKMPLDGNPWKHTALLGHPTHIIDMCFREDSGTLFTLGAKDNCVYQWAANYRSVETTTKLGGGYLDPYYCLMEGGRPGWLFQEIRDLFYYIQILCQGTFSPAMRRVKDFIPIDSLSDLMRALGYFPSEYEVENLIIEAKYKVFLKKPMTEIDFDDFVKLYINHRPALGDNFKRIKNAFRRFADADNSNLTISRDEFIRILCTNGESFSNQLLWYLLSILYGHSFEDRTAMMPDDFSFLPEEITLEELAMNVIGIQDLEVLSEQYSMKESFGSQQTGDTSTESAISSRLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: