MonarchBase - Protein-coding gene

DPOGS210472
Transcript	DPOGS210472-TA	1845 bp
Protein	DPOGS210472-PA	614 aa
Genomic position	DPSCF300062 + 419528-422903
RNAseq coverage	11x (Rank: top 84%)

Annotation
*Heliconius*	HMEL021572	0.0	70.59%
*Bombyx*	BGIBMGA002764-TA	0.0	68.12%
*Drosophila*			%
EBI UniRef50	UniRef50_D6WSV9	5e-140	46.00%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WSV9_TRICA
NCBI RefSeq	XP_967756.1	9e-141	46.00%	PREDICTED: similar to Bbs2 protein [Tribolium castaneum]
NCBI nr blastp	gi\|91086107	2e-139	46.00%	PREDICTED: similar to Bbs2 protein [Tribolium castaneum]
NCBI nr blastx	gi\|91086107	1e-135	46.00%	PREDICTED: similar to Bbs2 protein [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.6e-10	protein binding
KEGG pathway
InterPro domain	[62-279] IPR011046	1.6e-10	WD40 repeat-like-containing domain
Orthology group	MCL16188		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210472-TA
ATGCAAGTTTCTAGTGTCCAGCCAGTATTTAAATTAGAATTAAACCACAAAGTAACACCTGGTATAGTAACTATCGCTAAATATGATGGTACACATTATTGTCTTACTGCGTCTGCTGGATATGATAAAATAATTATTCATCACCCTCACGGTGGTATGAGTGTTGGACGTGCTCAACGTTCCCAGGCACATGGAGAAGTGTCTGAACTCAACCTTAGCCAAGCTGTGATAGCTTTAGAAGCTGGGCCTATAAAACCAGACTGTGCGCGAGATATGCTTTTGATTGGCTCGCCCACCCAAATTTTAGCCTACGATGTCCATAACAATTCAGACATATTTTATAAAGAAGCTCCAGATGGTATAAATGTAATAATTGCAGCCCATTTTAGTAAATACTCAGATATGTTGGTCATGGTTGGCGGAAATAGTTCTGTTTGTGGTATAAATTCGGAAGGCGAAGAGGTGTTTTGGAATGTTGTTAGTGGAAAAGTTTTTTCCATGATAACATTTGATTTTGATAAGGATGGCAAAAATGAGCTGCTTATAGGTTGCGAAGATTCTTATATAAAAGTACTAAAGGATGATCATTTTATCATGGAGATTGCGGAAACGGGGCCTGTTTCTTGTTTATCCTATATAAATGAAGTGAGATTTGCTTACGGACTAGCAAATGGAACTATTGGTATATATGAGGATGGCATCCGTCTTTGGAGAGTAAAGTCGAAACAAAACGCAAGAAATCTTCAATGGTCAGGAGACAACTTAGTCTGTTGTTGGGCGAATGGCCGAATAGACTGGAGAGATTGCACAGGGAGAGTACTAAGAAGAGTACAGTTACGATCTGACGCAGCGGCAATGATTTTAGCGGATTATCGCACAGTTGGCATCCCTGACCTTGTTTGTGTATCAACTAAAGGCGAAGTGCTTGGATTCCCGCCGATCCAAGAAAATGGTGGACCAAACACAAAAAAAATTGCTCCATCGGAAGAGGATAGGCTTGCAGTAACTGAGTTGCTGAATAAGAAGCAGGCGTTAATGATAGAACTGCAACACTACGAGGGCAACGCTGCTAACACATCCTTAGACATAGACCGACCTGACAGCGCTATGCCGACAAATACAAGGCTTCAAGTCGCAGTAGCCGCTGACACAGAAGAAGGATGCCTGCAGTTGGCTGTATCGACAAACAATGACACAATTGTGCGTATGGCACTAGTGTTAGCGGAAGGTATTTTTGATTCTGGAGAAACGCTCGCGCGTCATCCTCATCCGGCTAAACTGAGATCCGTTCTTTACATACCACTAAAGCCACCGAGAGATGTTCCCGTTGATGTTCATATTAAGGCACTGGTTGGTTATCCAGAGAGTGAACGGTTTCACATATTTGAACTTACAAAGCAGTTGCCACGTTTTTCGATGTATACTTTAGTTTCGTCATCTATCGCAAAGTCAAAGGTTGTAAACTACGTGACTTTCCGCATTACTGAGAGAGTTCAGAGAATATGCATATGGATAAATCAAAACTTTTTATTAGACGAAGAAATTGAAATTAACAACGAGGAGACAAAAGAGCTGCATATTAGTTTTATGTGTCTCAGAGATATGTCTCGCTTGGATTTGGATTTTTGCCCAGATGGTCAAGTGAAAATTACAACTCACGACATTAGACTTGCTGGAGATTTGATTCAGAGTTTGGCTGTTTTTTTGAACTTGTCTGATTTACAGGTATTTCGAATACCTATTTTATTTTTTGTTATTAATTTTTTTTTTATAATTTTTTATTACATGTGTGACCAATACAAAATCGAACGAAATATATTTGTCTTTATAAGGTTCTGTTGGTAG

Protein sequence:

>DPOGS210472-PA
MQVSSVQPVFKLELNHKVTPGIVTIAKYDGTHYCLTASAGYDKIIIHHPHGGMSVGRAQRSQAHGEVSELNLSQAVIALEAGPIKPDCARDMLLIGSPTQILAYDVHNNSDIFYKEAPDGINVIIAAHFSKYSDMLVMVGGNSSVCGINSEGEEVFWNVVSGKVFSMITFDFDKDGKNELLIGCEDSYIKVLKDDHFIMEIAETGPVSCLSYINEVRFAYGLANGTIGIYEDGIRLWRVKSKQNARNLQWSGDNLVCCWANGRIDWRDCTGRVLRRVQLRSDAAAMILADYRTVGIPDLVCVSTKGEVLGFPPIQENGGPNTKKIAPSEEDRLAVTELLNKKQALMIELQHYEGNAANTSLDIDRPDSAMPTNTRLQVAVAADTEEGCLQLAVSTNNDTIVRMALVLAEGIFDSGETLARHPHPAKLRSVLYIPLKPPRDVPVDVHIKALVGYPESERFHIFELTKQLPRFSMYTLVSSSIAKSKVVNYVTFRITERVQRICIWINQNFLLDEEIEINNEETKELHISFMCLRDMSRLDLDFCPDGQVKITTHDIRLAGDLIQSLAVFLNLSDLQVFRIPILFFVINFFFIIFYYMCDQYKIERNIFVFIRFCW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: