MonarchBase - Protein-coding gene

DPOGS213625
Transcript	DPOGS213625-TA	3225 bp
Protein	DPOGS213625-PA	1074 aa
Genomic position	DPSCF300033 + 1069131-1076075
RNAseq coverage	286x (Rank: top 38%)

Annotation
*Heliconius*	HMEL007789	0.0	83.77%
*Bombyx*	BGIBMGA011688-TA	0.0	63.91%
*Drosophila*	CG10144-PA	4e-77	27.47%
EBI UniRef50	UniRef50_B4N5I8	6e-76	27.30%	GK20314 n=1 Tax=Drosophila willistoni RepID=B4N5I8_DROWI
NCBI RefSeq	XP_001958397.1	8e-80	28.96%	GF10899 [Drosophila ananassae]
NCBI nr blastp	gi\|194752173	1e-78	28.96%	GF10899 [Drosophila ananassae]
NCBI nr blastx	gi\|195126947	6e-81	28.00%	GI13210 [Drosophila mojavensis]

Group
Gene Ontology	GO:0005515	2e-06	protein binding
KEGG pathway
InterPro domain	[91-238] IPR011046	2e-06	WD40 repeat-like-containing domain
Orthology group	MCL14052		Single-copy universal gene

Nucleotide sequence:

>DPOGS213625-TA
ATGGATTTATTGAAAACACCTTCAACACAGTCTTTATTGGAATCAGATTTAGAATCAGTTGAGAGTCTTCAGTATGTGGATTTTGAAGAGCTTGATGAAGTCGAATATGCCTTGCCAACAAGTGAAGCACCGAGCCTGGCCGAAATTTTATCATCACAAGAATTGGAAATCAATAAAGGGCCATTAAAAAATGTTGAGGAACCTACATGTTCTGCTCTACATGTTGATTTCTTGCAAGCTATTTCACAGCAGCTATTTCAAGCTGAAGAAAGATCATCAGCTGGCGCAGCGACTACATTAAGTATAGGAACAAATGGAAGACTGACTGTAGGAACGGCTCATGGACATCTACTTTCGTTTCATGATCAAACATTGAGATGGGTCTGTGACGCTAACGGAGACAACGGTGCTGTAACTTGCTTGTCGTACAACCATGATAGCACTCGATTATTGGCGGGTTTCGCCCGAGGGCTTGTTTATCAATACGAGAGTGTACGCGGTGTTATCTTGAGACGGGTCACATTGGGAGGTAATATATGGGGCGCGTTGAGAGTCACATGGGCTGGTACTTCGGGACTAGCTCTCGATACAGGTGGATCCGTGTGGCTCATTAAATTCTCAAGACCACTCGGAGTCCGCTCCGCTCGAGTCTCGTGTCTATTTTCCGGTGCTCGTGGTGAAGTTGTAGCTATGACGGCTAGAGATGCTCGTATCTTAGCGTTGGCCACCCTCTCTAGAGTTATCATTGTTGCGGGTGGCCGCGCAGCCGGAGTGAAATTAGACGGACCAGCAGACGTTCTTCCGGTGTTAGAATGGTATGAGATAGATAACAGGCTGCTCGTATGCGCCAGAGCCAACATCATGCAATGGCTCAGTGTTGTTATAAGTGGACCCTCAATTAGCCTGCAGTCGGTCCAACGTGTTGAGTTAAAGTCGACGCCAATTTGGCTCGGTTGGTTGGCCGGAAGTCTAGCGATATTCGATTCGGATGAAAATCTCCGTTTGTGGGGTGATGATTATGATAAACCATTGGATTTGTCACAAATAGAACCAGTATACGCTTCGGCATTTTTCAAGGGTCATTGGACAGATGGTAACGTATCGAGAGCAATGTGCAAGGCTGGCGAGAGTGCGCTTGGAGGGGCTTGTATATCGGAAGGCACGTTAGCACTATTGGGGCGTCGCGGCGTTGTTAGAGTGAAACCTCGTGATCTTCTTGCCAGATCCCAAGCATTCCTGACCTCGGGGCGATATTCTCAAGCATTGCGACTGCTCTGCTCAGCCCAGGGTCCCGAAGCTAAGAAGCTAGCAAACGAGTTTATCTGCAATTTAGCTGATAGGCCACACATAGTGAATAGCAAAAATGTAGCAGTTCAAGTTGTCAAGTTATGCCTCAAATTTGACATGAGTTATGAGTTGTGGAATGTACTATGGGAGAACTGTTCGAGCGAAGACGCGTTTGTGGAGGCATTAAGCGATGCCGTAGTACGAGGAGAACTTGCAAATTTCGCTCCATCGCCTGATTTTACACAGTCACTAATCGAGCGTCTGGCTGACCTTGAGCCAGAACTCGTGGAGCTGGTGGTGTCGTGTGTACCACTGACCTCCCTGGACCCTCACCGGGCCAGTGTGTTCACGAGGGAGAGGCGTCTGTGGCGCGGCGCGGGGGCCATAGTGGCCGCTCTCGACGGTTGTAGCGGTGCTATACGAGAGTTGGTTAGCTACGTGGATTTGTCGTGTGGGAGAAGCGCGGGGGAGGGCGGTGGGGGGTGCAGGTGTGCGGGGGGCGCGCTACTGTTGACTGCCGCGGACGCGTTGGCGGGCCGAGGGGTGGGGGGTCGGCCGCTACCACCACACGCCCGACCCTCGGCCAGGCATGACGCACTACAGGCCTTGTTGGCTGAAGATCCGGAGGGTAGGTCTCCACTGCGAGCGTTGGTGTTGCACGACGCGAGCGCCAGCGTTCGTCTGTTGGAGCAGTGCGCTCGTGAACCGCCGTTCGCGGGACCCCTCGCCAAACAGAACAGGCTGCGTGTAGCAAGAGCGCTCCTCACCTACATCAATCAGTTGCAGGTGTCTGACAGCATAGAAATACTAGAGTTTATATGTGGGCAACTACAAACCGGCGCTTTGCCGCTTGACCAGGAGTTGATAAAAAGAGTTCAGGAAGTCATATCGAACACAGATGACGAGCGAGCAGACGTCGCCTGGTTAGCAGTCTTAACACGGATCCGAACGCAGAGAGATCAGATGGTCATGCAATATAAAGATGCCGTCCCCCGACCACGGGTGCTGTGGCGGATTAATGCGATGCTCGACCAGCATAGCGAGGTCCTCAAGGAGTTCTTCAACATCAGCAATCCGTCCAGTCGCGATATAAACGAGCTGTTTGAATATTTGCGATCCCGAATCGAAACTGACCCCGAGGCTAGAGACCATATACGGGATCACCTTCCAGCTCTGATTCAGTTGCGACCGCGATCGGCGGCGGCGCTTCTCAATGAACAGCAAACTAATACGATAGGATCTGTTTACGACACATTAAGTACCGAATGTAGAATAGAATTCGGCGAGTGTCTCCTAGACATGGGGCGCTTGAAGGGGGACATCGCCGCATCTCACCTCCGAACTCTGTGTATCGAGAAGCCGAACGACGTTAAAGAGTTTCTTAAAAAGAATTCGGGAATAATCAGACCCGAGGACGCTTTAAAAATAATCAAAGAACACGGCCCAAAAGACGCGGAGCCGATCTGTCTGGAGGCGAGCGGTGATCACATGGGCGCTCTGGAGTCGTTGCTGCAGTCAGTGGCCGCCGCTGATGACGAGGCGACCAAAGCCAGTCTGATCGAGGAGGCGGGCGCGCTGTGCGTGCGTGTGGGACCCGCCGTCCCGCAGGCCGTGGCCTCCGACATGTGGTCGCGGCTCCTGCGCCACACGGACACGATTCCCGCGACGCTGCTGTTCGAAGCCGTCGCCTATCTTCCTCTCGAAGAACTCGCCACTAAGACTTGCACTACGATAACAATGGCCCGAACCATTTTAGCGAGCGGCGTTAGCGGGCGCGACGCCTGGGAATGTGCTTCCCGGCTAGTGCAGCGCGAGGCGCACGAGGCGCTCGCGCGGGAGTTGAGCACGGCTCGTCGCGGACTGGCGGTTCGCGGTCGCTGCGGGCATTGCGAGCTCCTTCCCCTGGACGCTCCACGCAGGACTACGCTCTATCCCTAG

Protein sequence:

>DPOGS213625-PA
MDLLKTPSTQSLLESDLESVESLQYVDFEELDEVEYALPTSEAPSLAEILSSQELEINKGPLKNVEEPTCSALHVDFLQAISQQLFQAEERSSAGAATTLSIGTNGRLTVGTAHGHLLSFHDQTLRWVCDANGDNGAVTCLSYNHDSTRLLAGFARGLVYQYESVRGVILRRVTLGGNIWGALRVTWAGTSGLALDTGGSVWLIKFSRPLGVRSARVSCLFSGARGEVVAMTARDARILALATLSRVIIVAGGRAAGVKLDGPADVLPVLEWYEIDNRLLVCARANIMQWLSVVISGPSISLQSVQRVELKSTPIWLGWLAGSLAIFDSDENLRLWGDDYDKPLDLSQIEPVYASAFFKGHWTDGNVSRAMCKAGESALGGACISEGTLALLGRRGVVRVKPRDLLARSQAFLTSGRYSQALRLLCSAQGPEAKKLANEFICNLADRPHIVNSKNVAVQVVKLCLKFDMSYELWNVLWENCSSEDAFVEALSDAVVRGELANFAPSPDFTQSLIERLADLEPELVELVVSCVPLTSLDPHRASVFTRERRLWRGAGAIVAALDGCSGAIRELVSYVDLSCGRSAGEGGGGCRCAGGALLLTAADALAGRGVGGRPLPPHARPSARHDALQALLAEDPEGRSPLRALVLHDASASVRLLEQCAREPPFAGPLAKQNRLRVARALLTYINQLQVSDSIEILEFICGQLQTGALPLDQELIKRVQEVISNTDDERADVAWLAVLTRIRTQRDQMVMQYKDAVPRPRVLWRINAMLDQHSEVLKEFFNISNPSSRDINELFEYLRSRIETDPEARDHIRDHLPALIQLRPRSAAALLNEQQTNTIGSVYDTLSTECRIEFGECLLDMGRLKGDIAASHLRTLCIEKPNDVKEFLKKNSGIIRPEDALKIIKEHGPKDAEPICLEASGDHMGALESLLQSVAAADDEATKASLIEEAGALCVRVGPAVPQAVASDMWSRLLRHTDTIPATLLFEAVAYLPLEELATKTCTTITMARTILASGVSGRDAWECASRLVQREAHEALARELSTARRGLAVRGRCGHCELLPLDAPRRTTLYP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: