MonarchBase - Protein-coding gene

DPOGS204225
Transcript	DPOGS204225-TA	1518 bp
Protein	DPOGS204225-PA	505 aa
Genomic position	DPSCF300046 - 695207-697410
RNAseq coverage	502x (Rank: top 25%)

Annotation
*Heliconius*	HMEL015146	97.23%
*Bombyx*	BGIBMGA007583-TA	90.34%
*Drosophila*	ebi-PA	87.43%
EBI UniRef50	UniRef50_O60907	70.13%	F-box-like/WD repeat-containing protein TBL1X n=20 Tax=Eukaryota RepID=TBL1X_HUMAN
NCBI RefSeq	XP_317781.4	87.60%	AGAP007739-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158297568	87.60%	AGAP007739-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158297568	87.80%	AGAP007739-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	1.1e-75	protein binding
KEGG pathway	aga:AgaP_AGAP007739	0.0
	K04508 (TBL1)	maps->	Wnt signaling pathway
InterPro domain	[148-504] IPR011046	1.1e-75	WD40 repeat-like-containing domain
	[340-504] IPR015943	2.8e-50	WD40/YVTN repeat-like-containing domain
	[422-460] IPR019781	1.4e-13	WD40 repeat, subgroup
	[421-460] IPR001680	6.7e-13	WD40 repeat
	[6-32] IPR013720	1.2e-09	LisH dimerisation motif, subgroup
	[174-188] IPR020472	1.3e-07	G-protein beta WD-40 repeat
	[4-36] IPR006594	9e-06	LisH dimerisation motif
Orthology group	MCL10939		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204225-TA
ATGAGTTTTTCCATTGATGAAGTGAATTTTCTCGTGTATCGATACTTACAGGAGTCCGGATTCCATCATTCAGCTTATACATTTGGAATTGAATCACATATATCCCAAAGCAATATAAATGGAGCCTTAGTTCCGCCGGCAGCATTGTTAAATATTCTGCAGAAGGGTTTGCAATATACCGAAGCCGAAATAACTATAGGAGAAGATGGAACTGAAACACGTCTTACAGAGAGCCTGAGTTTAATTGATGCTGTAACTCCGGATATTGTTTCCACTCGTCAAAATGCTCATAATGCTCAAAAGCAAGCTAATAAAGAACCAGGGTCTGGTGGAGAACAAAACGGAGTTGATGGAACAGCATGTAGTGCAGCATCAACTACAGGAGGTACAGTAACACCAAATGTACCAGAAAATATGGATGTTGATCAATCAATCGAAATACCAGCAAGCAAGGCGACAGTACTACGAGGACATGAATCTGAAGTGTTTATTTGCGCTTGGAATCCAAGCACTGATTTATTGGCTAGTGGCTCAGGAGATAGTACTGCTCGAATATGGGACATGTCAGACAATCCAGCAACTACCCCTAATCAGCTTATATTAAGACATTGTATTCAAAAAGGTGGAGCTGAGGTGCCCAGCAATAAAGATGTTACCTCATTGGATTGGAATTGTGATGGTAACTTATTGGCAACTGGATCATATGATGGCTATGCAAGAATCTGGACAACTGATGGCACATTAGCATCTACCTTGGGACAGCACAAAGGTCCTATATTTGCACTTAAGTGGAATAAGAGGGGAAATTATATCTTAAGTGCAGGGGTTGACAAGACAACAATTATATGGGATGCAGCATCAGGCCAATGCACTCAACAGTTTTCTTTCCATGCAGCACCAGCTCTTGATGTTGATTGGCAAACAAACAACTCATTTGCTTCATGTTCAACTGACCAATGTATTCATGTTTGCAGATTACATGTTGACAAACCAATAAAAAGTTTCAAGGGACATACGAATGAAGTCAATGCAATAAAATGGGACCCACAAGGACAACTCCTTGCATCATGTTCAGATGACATGACATTAAAAATATGGTCCATGAAACAAGACACATGGGTTCATGACCTGAAGGCACATTTGAAAGAAATATACACCATAAAGTGGTCTCCTACTGGTCCTGGAACACAAAATCCTAATATGAATTTGATCTTAGCCAGTGCATCATTTGATTCTACGGTGCGCTTATGGGACGTGGAAAGAGGAGTTTGTATTCATACTCTAACTAAACATACTGAACCAGTTTACAGTGTAGCATTCTCTCCCGACGGAAAATTTTTAGCCAGTGGCTCCTTTGACAAGTGTGTTCACATTTGGTCTACGCAGACAGGTGGGCTGGTACATTCTTATAAAGGGACGGGTGGCATTTTTGAAGTATGCTGGAATTCAAGAGGTACAAAAGTAGGTGCCAGTGCGAGTGATGGAAGTGTTTTTGTCCTAGATTTACGCAAATTGTAA

Protein sequence:

>DPOGS204225-PA
MSFSIDEVNFLVYRYLQESGFHHSAYTFGIESHISQSNINGALVPPAALLNILQKGLQYTEAEITIGEDGTETRLTESLSLIDAVTPDIVSTRQNAHNAQKQANKEPGSGGEQNGVDGTACSAASTTGGTVTPNVPENMDVDQSIEIPASKATVLRGHESEVFICAWNPSTDLLASGSGDSTARIWDMSDNPATTPNQLILRHCIQKGGAEVPSNKDVTSLDWNCDGNLLATGSYDGYARIWTTDGTLASTLGQHKGPIFALKWNKRGNYILSAGVDKTTIIWDAASGQCTQQFSFHAAPALDVDWQTNNSFASCSTDQCIHVCRLHVDKPIKSFKGHTNEVNAIKWDPQGQLLASCSDDMTLKIWSMKQDTWVHDLKAHLKEIYTIKWSPTGPGTQNPNMNLILASASFDSTVRLWDVERGVCIHTLTKHTEPVYSVAFSPDGKFLASGSFDKCVHIWSTQTGGLVHSYKGTGGIFEVCWNSRGTKVGASASDGSVFVLDLRKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: