MonarchBase - Protein-coding gene

DPOGS205696
Transcript	DPOGS205696-TA	3153 bp
Protein	DPOGS205696-PA	1050 aa
Genomic position	DPSCF300250 - 56559-63379
RNAseq coverage	295x (Rank: top 38%)

Annotation
*Heliconius*	HMEL014804	1e-126	53.09%
*Bombyx*	BGIBMGA009832-TA	7e-111	53.93%
*Drosophila*	mio-PA	4e-44	26.89%
EBI UniRef50	UniRef50_D6X050	6e-81	33.75%	Missing oocyte-like protein n=1 Tax=Tribolium castaneum RepID=D6X050_TRICA
NCBI RefSeq	XP_001603665.1	9e-85	36.64%	PREDICTED: similar to LOC100049152 protein [Nasonia vitripennis]
NCBI nr blastp	gi\|345487300	6e-88	36.90%	PREDICTED: WD repeat-containing protein mio-B-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345487300	1e-148	36.85%	PREDICTED: WD repeat-containing protein mio-B-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0005515	1.7e-11	protein binding
KEGG pathway
InterPro domain	[59-347] IPR011046	1.7e-11	WD40 repeat-like-containing domain
	[248-339] IPR015943	7.7e-08	WD40/YVTN repeat-like-containing domain
Orthology group	MCL11224		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205696-TA
ATGGCAGGAAGTAAATTGGATGTCCTCTGGTCTCCCATTCACCATGATAAATTTATCGTATGGGGTCAAGACTTAACCTTATACGAAGTGTCTAATCTTCAAGATATCCCCAAAAACACTGCATATACCCAACTGTGTCCAACAAGAGGAGCCACAGTAGTAGCATCACAGAGTGCAAGCGGAGTGCGTTGTGTGGACATCAGTGCTGTTGTTGAACACCCCGACCCACTGCTGGCTCTAGGACATGGAAGTGGACGAGTGTTGCTCACAAGTTTCAAACAGGCATATGATTCACTTGGCCTTGTGGGTAAAGAATTCGTGCCCCGCTACCCCCGACAATGTAACTCGGTTTCATGGAACAGGTCGGAGGGTCACTTGCTGGTGGTGGGAATGGACAAACATCGCAGCGACAGCGCCGTGCTGCTATGGGACGTCCAAGCCGGCGCCGGAGATGACTTCACTGGTAAGAGCGGTCCGTTGAGCGCGGCCGGCGCGGGCGAGGCGGCGGGCTGCGTGTCGTGGTGCGGGTTCGCTCCCCGGACAGTGCTGGCGTCCATGACCTCCAAACACATTAAGATATTCGACATGAGAGAGAATCCGGGCAAGGCAACCAGCTCGGTGTCAACCCGTCAGTGGGCGGGTGCCACGTGTGCCGGCTGGCTGGTGGCGGCGAGGGGTGAAGGTGGGGAGGCGGCGATATGTGTGAGGGACGCGCGCATGCTGACCAGGTCGTTGGCCCTGCTGCCGCTACAGAGACCCGCCAGGAAAATACACTGGAGCCCCACCAGGCAAAATCTGCTGATATCCCTCCAGAGAGATTCCACGACCTTGCGACTCCACGACATCCAGCACATGCACGACCCCCGGCGGCAGTCTCTCGACGTACGATCGACTCGAGTCGCTGCATTGCCTTATCCAGTCGAGCGTGACGTCACGGTCAGCGGCGTGCCGGTGGCTTCGTTCGCCTGTCACCCTGCACACCGCGCGAGGCTTCTCACGCTCACTACTACAGGCTGTGTGGCGGAGTACATGGTGATGGAACGCGTGTGCGTGTCGTGGGGCGCGAGCGGCGCGCTGGCCTGGGGCGGCACTTCGCTGCGGGTGCTGCGGCCCGCGCACCTGCCGGCCTCCACGCCCGACCTCGACATCTCGTACAAGGCGCGCGCGAGGGCTCTCAACGACTACGGTCTCAAGCCCGACCTGTGGCAGAACGCGGAGCTGGCGGAAGACGAGGCGCTGAGCTCGTTGTGGCACTTCCTCGCTCTCAGCAAGTCACTCGTAGAGGACGGCTGCATCCGCAACAGCGGCTGGAAGCATCCCGGCGTGCGATCGGTGCTGCGATCCCCGGGGGAAGGATACCGCTCGGAAGCCGTGTCCGCTCTCCTGCCCGACCTGCCCTCGCGCAAAGTCACCATCTACCGGAGTGCCGAGCGCACGAGGGCGCTACAGCTGTGCGGCTGGGGTTGGGGCTGGGAGAACGCCGCGGCCGGCGTGGAGCGCGCGGAGGCCGAGGGCACGCCGTGCCGCGCCGCCGCCCTCGCCGCCTTTCACCTGCGCGTACGGGCGGCGCTCGACGTGCTGTCCCGTGCGCGCGCCCCGGCTTTGGCCCGAGGAGCGCCTTTGGCGGGACGCTCTAGCCGCCGCTGCGCCCGCCCTGCCCGATCCTTATCTGCGGGCGCTGCTACACTTCGTCGCCGCTGCGGCGCCTCCGCCCCAGCAGCCGCCCGCCCCGCACCATCAACCGGACTACTCGGACGTCCTCGTGAGTACACTGCCCAGGGACACGTTCATGACGGCTCGAACGATCCGACGATGACCTCGTTTTCCACAGAACGAGACGGGCATGCGGCTGGAGGACCGCGTTGCATTCGCATGCATCTTCCTCCCGGATGGGAAGCTGCACGAGTACCTGGCGAACACCTGGGGCTCGCTCCGCGCGGAGGGCTCTCTGTCGGCCCTGCTGTTGTCCGGAGCGGGGGCGGAGGGCGCGGGTGCTCTGCAGAGATGGTTGGAGCGCACGGGCGACGTGCAGAGCGCGGCGCTGGTGGCGGCCCGCGCCTGTCCACCGGAGCTAGTCCGGGAGGGGCGCGCGGCCTCGTGGCTGGCGGAGTACCGCGCGCTCCTGGACGCCTGGCGCCTGTGGTGGCCGCGCTGCCTTTTGGATACGTGGCTGGCGGCGGCGGGGGCGGGCGCGGAGGCGGGCGCGGGGGCTTCCGTGGCCTGCACATACTGCGGCAAGCCCGTGGCGGCGGCGGGGGGAGCGCGGCCTCGACCCGCATTCGCTCGCCTGCCGCCGCCGGCCGCCAAGATGAAGCAAGTGTCGTCGTGCCCCAACTGCCGCAAGCCTCTGCCTCGTTGTGGCGTGTGCTCTCTCCACCTGGGCACGGGCGCGGCGGGGTCGGCGGGCGCCATGGTGGCCGTGGGCGCCGTGGGCGCGGCGGCGGGCGGGGCGGCGGCCGGCGCGGCGTTCGCGGGCTGGTTCAGCTGGTGCGTTTCGTGCCGTCACGGCGGGCACGCAGCGCACCTGCTGCAGTGGTTCAGCGAGCACGCCGAGTGTCCCGTCAGCTCGTGCACGTGTCGCTGCAGCGAGCTGGACCCACCGGACGTGCCGCGCGCCTGACGTGCCTCGGCGGTCCGTCCGTTCCCGTGTTGGTGCCGGGTGCGAGTGGTCGGCGCGTCTTCTCCGCTCGGGTTCAGGGCTTGAAGCGCCTAGTCCTCGTCGCGAGGATCGCATCCCCGCCCCGAACAGCCGTACAAAAATATACACACGACGACCGACACCCGAGGGCCAAGGTCGAGGGTCGAGGGTCTGCGGCCGACGCCCTAACTAACTATCATAAATATTATCCAGAAAAAGTACGACCACAAGGAACAAAGAGACGAGACAACATACAACCGACGCGCCCCGGCGCGACTCGCGGGCTCGGAGCACGCGACACCACAGGAAAATACGAAGACATCTCGAAAACATCTCTCTATACAAAAATAACAATATTTGTAATGAAGTGGACTCCGCTAACAGACCTACCTATATATATCTATTATAGACTTTTCTATAAAACGACAACAACGCGGGGTCGCGGGGTCACGGGGTCGCGGGGTCGCGGGGCACGGGTCGCGCTTCGAGGACGGCGCCGTAACGAATACAATTAA

Protein sequence:

>DPOGS205696-PA
MAGSKLDVLWSPIHHDKFIVWGQDLTLYEVSNLQDIPKNTAYTQLCPTRGATVVASQSASGVRCVDISAVVEHPDPLLALGHGSGRVLLTSFKQAYDSLGLVGKEFVPRYPRQCNSVSWNRSEGHLLVVGMDKHRSDSAVLLWDVQAGAGDDFTGKSGPLSAAGAGEAAGCVSWCGFAPRTVLASMTSKHIKIFDMRENPGKATSSVSTRQWAGATCAGWLVAARGEGGEAAICVRDARMLTRSLALLPLQRPARKIHWSPTRQNLLISLQRDSTTLRLHDIQHMHDPRRQSLDVRSTRVAALPYPVERDVTVSGVPVASFACHPAHRARLLTLTTTGCVAEYMVMERVCVSWGASGALAWGGTSLRVLRPAHLPASTPDLDISYKARARALNDYGLKPDLWQNAELAEDEALSSLWHFLALSKSLVEDGCIRNSGWKHPGVRSVLRSPGEGYRSEAVSALLPDLPSRKVTIYRSAERTRALQLCGWGWGWENAAAGVERAEAEGTPCRAAALAAFHLRVRAALDVLSRARAPALARGAPLAGRSSRRCARPARSLSAGAATLRRRCGASAPAAARPAPSTGLLGRPREYTAQGHVHDGSNDPTMTSFSTERDGHAAGGPRCIRMHLPPGWEAARVPGEHLGLAPRGGLSVGPAVVRSGGGGRGCSAEMVGAHGRRAERGAGGGPRLSTGASPGGARGLVAGGVPRAPGRLAPVVAALPFGYVAGGGGGGRGGGRGGFRGLHILRQARGGGGGSAASTRIRSPAAAGRQDEASVVVPQLPQASASLWRVLSPPGHGRGGVGGRHGGRGRRGRGGGRGGGRRGVRGLVQLVRFVPSRRARSAPAAVVQRARRVSRQLVHVSLQRAGPTGRAARLTCLGGPSVPVLVPGASGRRVFSARVQGLKRLVLVARIASPPRTAVQKYTHDDRHPRAKVEGRGSAADALTNYHKYYPEKVRPQGTKRRDNIQPTRPGATRGLGARDTTGKYEDISKTSLYTKITIFVMKWTPLTDLPIYIYYRLFYKTTTTRGRGVTGSRGRGARVALRGRRRNEYN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: