MonarchBase - Protein-coding gene

DPOGS202501
Transcript	DPOGS202501-TA	2217 bp
Protein	DPOGS202501-PA	738 aa
Genomic position	DPSCF300131 - 444441-485006
RNAseq coverage	1152x (Rank: top 11%)

Annotation
*Heliconius*	HMEL007430	0.0	87.82%
*Bombyx*	BGIBMGA012449-TA	5e-171	63.57%
*Drosophila*	gro-PE	0.0	63.02%
EBI UniRef50	UniRef50_Q7PMQ2	0.0	70.11%	AGAP010324-PA n=17 Tax=Coelomata RepID=Q7PMQ2_ANOGA
NCBI RefSeq	NP_001128361.1	0.0	93.81%	groucho [Bombyx mori]
NCBI nr blastp	gi\|201025390	0.0	93.81%	groucho [Bombyx mori]
NCBI nr blastx	gi\|201025390	0.0	93.81%	groucho [Bombyx mori]

Group
Gene Ontology	GO:0005515	1.8e-70	protein binding
	GO:0005634	2.6e-57	nucleus
	GO:0006355	2.6e-57	regulation of transcription, DNA-dependent
KEGG pathway	tca:656496	0.0
	K04497 (GROUCHO)	maps->	Wnt signaling pathway
			Notch signaling pathway
InterPro domain	[20-139] IPR005617	1.8e-70	Groucho/TLE, N-terminal Q-rich domain
	[404-738] IPR011046	1.3e-69	WD40 repeat-like-containing domain
	[451-736] IPR015943	1.7e-65	WD40/YVTN repeat-like-containing domain
	[637-659] IPR009146	2.6e-57	Groucho/transducin-like enhancer
	[573-612] IPR001680	3.1e-08	WD40 repeat
	[576-612] IPR019781	5.8e-08	WD40 repeat, subgroup
Orthology group	MCL10141		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202501-TA
ATGTATCCTAGCGCGGGCGCGATGAACGCCGCCGCTGCCGCCGCTGCCGTGGCGGCCGCCAGGCATCCGGGCCCCCCGCAGCCCGGGCAACCCATCAAGTTCACGGTGGGCGAGTCATGTGACAGGATTAAGGAGGAATTTAATTTCTTACAAGCTCAATATCATAATTTAAAATTAGAATGCGAGAAACTGGCTAGTGAAAAAATTGAAATACAGAGGCATTATGTTATGTACTATGAAATGTCATACGGGCTCAACGTGGAAATGCACAAACAGACGGAGATCGCTAAGAGATTAAATGCTATAATAGCTCAAATATTGCCATTCCTCTCTCAAGAGCATCAGCAGCAAGTGGCGTCGGCAGTGGAGAGGGCGAAGCAGGTCACGATGACAGAACTGAACGCTATTATTGGGGTCGGCTGGCCGCGCGCCAACCGCCGACATCCAACATCCAACATCCAAGAGCGAACGACGAACAACGACCAACGCGATTTTCAACAGCGACCAGACCTGCCGCGTCTCTTGCAGCAGATGCATGCAGCACATTTGCCGGCACACGGAGCTCCGCCACTGCCTCTTCTCAGCCAAGGAGCCCTGCCGCCCGCGGGGTTACTGGGCCTCGGAGTACCCCACCATCCTCTGTCAGTGCTCGCCAAACCCCCCGACATACATCGTCCTGATGATAAGGGCAATGGTATCAGCTCGGCGGAAGAGCGACACAGAAATTCAATATCCCCGGGCGAGAGAGAGAAATATAGAACAAGGAGTCCCGCTGAACCAGATCACAAGAAACTAAAAAAGGAGGAAAAAGATATGGGACATGAATTAGTTGTAGACGACGCCAGCGAAGAACCCACATCACCTCACAACGGGGCGCCTTCACCCAGAGAGAACGGTCTGGACAAACTTCAACCCAAGAAAGAACATCCCCCTCACAGTCCGCGGTCTGGAACGTCCAGTAACGCATCGACGCCTTCGACAAAAAAGTTAGACGAGAAACCCAGCACGCCGATTTCAAAACCGGTGACGCCGACTTCCGGCGCTAGTGGCGTCGGCTCGGCGGGGCCACCTATGAAGGCGGCGGTGAAGCCCCCGGCGTTACAGTACCCCTACCTAGGTAACGGGGCCCACGACGCATACGGACTTGCCGGATATTCAGCCAGAGCGGCGATGGCGTACGAGCCACTACGTCCCCCAATAGGACCAGCGGCTCTGGCACCCATACCTGGCGGAAAACCAGCGTACTCGTTCCACGTATCGGCCGAGGGCCAGATGCAACCGGTCCCATTCCCCCCGGACGCCCTCATGGGGCCGGGGATCCCCCGCCACGCGCGGCAGGTGTCCGCCCTCGCCCACGGGGAAGTGGTGTGCGCGGTGACAGTCTCCTCGCCAACCAAGTACGTGTACACCGGCGGTAAGGGCTGCGTCAAGGTGTGGGACATCAGCCAGCCGAGCAAAGCGCCCGTCAGCCAGCTGGATTGTTTGCAACGTGATAATTACATCCGGTCGGTGAAGTTACTTCCTGACGGCCGGACCTTGATTGTCGGCGGGGAAGCCTCCAACTTGTCTATATGGGACCTCGCTTCTCCGACTCCCCGCATTAAGGCGGAACTGACGTCATCAGCGCCCGCTTGTTACGCGCTGGCTATTAGCCCAGACTCTAAGGTGTGCTTCAGTTGTTGTTCCGACGGCAACATCGCGGTGTGGGACCTCCACAACCAGACCCTGGTGAGACAGTTCCAGGGACACACGGACGGAGCCTCATGCATCGACATCTCCGCTGACGGCACCAAGCTTTGGACGGGCGGACTTGATAATACTGTCAGATCCTGGGATTTAAGAGAAGGAAGACAATTACAACAGCACGACTTCAGCTCACAGATATTCTCACTGGGATACTGTCCGACGGGTGAATGGCTCGCAGTGGGCATGGAGAACAGCAACGTGGAGGTGTTGCACGCCGTGAAGCCTGACAAGTACCAACTGCACCTGCACGAGTCCTGTGTACTTTCCCTCAGGTTCGCCTCCTGCGGGAAGTGGTTCGTCTCCACGGGGAAGGACAACCTGCTCAACGCCTGGCGCACGCCCTACGGGGCGAGCATCTTCCAGTCTAAGGAGTCGTCGTCGGTGCTGAGCTGCGACATCTCATCGGACGACAAGTACATAGTGACCGGGTCAGGCGACAAGAAGGCCACAGTGTACGAAGTGATCTACTAA

Protein sequence:

>DPOGS202501-PA
MYPSAGAMNAAAAAAAVAAARHPGPPQPGQPIKFTVGESCDRIKEEFNFLQAQYHNLKLECEKLASEKIEIQRHYVMYYEMSYGLNVEMHKQTEIAKRLNAIIAQILPFLSQEHQQQVASAVERAKQVTMTELNAIIGVGWPRANRRHPTSNIQERTTNNDQRDFQQRPDLPRLLQQMHAAHLPAHGAPPLPLLSQGALPPAGLLGLGVPHHPLSVLAKPPDIHRPDDKGNGISSAEERHRNSISPGEREKYRTRSPAEPDHKKLKKEEKDMGHELVVDDASEEPTSPHNGAPSPRENGLDKLQPKKEHPPHSPRSGTSSNASTPSTKKLDEKPSTPISKPVTPTSGASGVGSAGPPMKAAVKPPALQYPYLGNGAHDAYGLAGYSARAAMAYEPLRPPIGPAALAPIPGGKPAYSFHVSAEGQMQPVPFPPDALMGPGIPRHARQVSALAHGEVVCAVTVSSPTKYVYTGGKGCVKVWDISQPSKAPVSQLDCLQRDNYIRSVKLLPDGRTLIVGGEASNLSIWDLASPTPRIKAELTSSAPACYALAISPDSKVCFSCCSDGNIAVWDLHNQTLVRQFQGHTDGASCIDISADGTKLWTGGLDNTVRSWDLREGRQLQQHDFSSQIFSLGYCPTGEWLAVGMENSNVEVLHAVKPDKYQLHLHESCVLSLRFASCGKWFVSTGKDNLLNAWRTPYGASIFQSKESSSVLSCDISSDDKYIVTGSGDKKATVYEVIY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: