MonarchBase - Protein-coding gene

DPOGS208624
Transcript	DPOGS208624-TA	2658 bp
Protein	DPOGS208624-PA	885 aa
Genomic position	DPSCF300052 + 1037500-1045157
RNAseq coverage	1917x (Rank: top 6%)

Annotation
*Heliconius*	HMEL015851	0.0	67.11%
*Bombyx*	BGIBMGA005733-TA	2e-121	93.09%
*Drosophila*	CG31716-PH	2e-97	50.13%
EBI UniRef50	UniRef50_E2BJE2	3e-98	48.56%	CCR4-NOT transcription complex subunit 4 n=6 Tax=Eumetazoa RepID=E2BJE2_HARSA
NCBI RefSeq	XP_972337.2	4e-99	74.88%	PREDICTED: similar to AGAP009827-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189238402	8e-98	74.88%	PREDICTED: similar to AGAP009827-PA [Tribolium castaneum]
NCBI nr blastx	gi\|195473651	3e-107	30.81%	GE18937 [Drosophila yakuba]

Group
Gene Ontology	GO:0003676	6.3e-19	nucleic acid binding
	GO:0000166	4.5e-09	nucleotide binding
KEGG pathway	tca:661055	1e-98
	K10643 (CNOT4, NOT4, MOT2)	maps->	RNA degradation
InterPro domain	[75-154] IPR003954	6.3e-19	RNA recognition motif domain, eukaryote
	[72-158] IPR012677	4.5e-09	Nucleotide-binding, alpha-beta plait
	[1-47] IPR013083	6.1e-06	Zinc finger, RING/FYVE/PHD-type
Orthology group	MCL30368		Lepidoptera specific

Nucleotide sequence:

>DPOGS208624-TA
CAGATATGCAGGTTTTGTTGGAATCGAATCCGGGAAGGGGAGAACGGTCTATGTCCAGCCTGCAGGAAGGCCTACCCCGAAAACCCTGCAGACTTCACCCCGCTCAGTCAAGAGCAGGTGGCCGCTATAAAGACGGAGAAGAAGGCCAGGGAACAGAAGCGTCGCAACAAAACTTTGGAGTCACGACGAGCTCTGGCCAACGTGAGGGTTGTTCAGAACAATCTCGTGTTCGTTGTGGGACTTCCGGTCAGGCTGGCGGATCCAGAGATACTAAAACGGCAAGAGTACTTTGGGAAGTATGGAAAAATTCACAAAGTAGTTATAAATCAAAGTAGTTCATATGCCGGGTCACAGAGTCCATTGGCGTCCGCGTACGTAACTTACGTGTCGCCCGCGGACGCGTTACGTGCGATCCAGGGGGTGAATAACGTTACGTTGGACGGTCGGGTGTTGAAGGGCTCGCTAGGAACTACCAAGTATTGCGCTAACTTTATGAAAAACCAACCCTGCCCTAAGCCAGACTGCATGTATCTACACGAACTGGGCGATCCAAAGGCGTCGTTCACAAAGGAGGAGATGCATGCGGGGCTTCACCAAGTGTACGAGCGGCGGCTACACCAACAGTTACTACAGGCGCAGAGGGATCGTCCAGACGATAGGCACTATAGCGACGGAAATCAACCAAATTTTATACCAACCACAGTGGTCACATCGTCTCAAATAAATGTAGTCAGCACATCCAAATCAAAAAAGGAACCAATGAACGGCATCATAAACGGCAGCGGCAGCAAGGAGGCGTGGCCGAGTCTCGGGGCTTCCCCGCCGGCAGACAGCCCCGCAAGGAAACAAAACAGCCCAAAACCCACAGTAAAGTCACTAGAAAACGGCATATCAGAATCCTCGAGTCCAACACAACTACAAACACAACAGTCTCAAACGAAAAACGTCAAAGAAAGTAACACGGACAGCAAAAATAGAAATAGTAGCAACACAAACGGTCACACGAGCAAAAAGAATAAAGACAGCAAATCCAAAAAGGGCAATAGCAATACGAGTGAATCCAGCGACCAGGGAGCCGACGAAAAGACGGAAAACAACGCTATCAGTATACAAACACAGGCGAACTCTGTGTTCGAAAACGACACACAGAGCTATCTATCAAACGAATTGGACGAACTGGAATCAGATAGGCACAGCTTGTTGGAAAACCACGATCTATTGGACAGTTCGGATCACAGTCTACTAGAGGACGACAACACACACAATCTGCTCAACGACGCCAGTAACGAAGTCATGATGATGCAGAGGCATAGAGAAATGCTCGCGGGTCTAGTTGATAATAACCACTTACTGCTGAAAAGTCTACCTATGAACGGTTACGGCTTGTCAGATAGAGATATTTACCTAGCTAGTGATAGACAGATTAGTCAAATTAATCATGGTATCATGGAAAAAGAATTGATGCTCAGAGACCGCAATAGAAGCAGTCTTCTGATGAGGCAGAATGAAATGATGTCGAGACATAGCATGGAACCTAAACATTATATGCCCACATCCAGTATAGGACTCGAATCAGCTAGTGAATTATTAGGTGCTAATTTTCATCCAAATCACAGTATGCTACCCCCGTTCGGTATGCGTGTAGACAACTCAATGGGCGCTAGCTCTTTAGGAAATACAATGACAACACTATCAGCGAACACATTAAACAATCCAATAACAAATTCACTATCAAATACTTTGGCGAGTTCCATGGCAACGAATTCGATGGCCGCGAACTCTATGGGCAGCTCTATGGGTTTGTCTATGGGAAGTTCCATGGGCAAGTCCATGGGGGGATTCATGCTGGCCGCCCAACAGTTACCGCAGATTCAGAACCAGGGACAGATGCAGAGCGGCCTCGTCAACGGTTTCGATTCCACACAAACTACTAGCGAGGGTCGCTACCAGGCTGAGACTATGGACAAATTCTTTACGGACTTCCACAAGGCACAGCAGATGCGGCAGATGAGAGACGAGCGGAGGGAGCCACCACCACACGCCCTTAGCGCTGAGAGGCTTGAGATGGAGCAAAAGCACAGGATGAACAACATGAGATCCAGTGAGACACTGAGCGGCCGGGCTGCCGGGGACGGTGATGATGATTTAGACTTTGATCCCTTCAAGGAGACGCAGAAAGCACTCGCTGAGATGATGGAGACCGAACTCATGTTGAACTCTATATCCAGCGGAGACAATATGGAGCGTGTCCGTCGCTCGCGACTCCCTCCACCAGGATTCAGTCACGTTAATACATTTGGTATCGGCGTACCGCGACACCAGACACACCATCAAGGCTACAGTTCCAACAACGCCATGTTCTCAGACTGGACACAAATGGACCCCGCTATAATGTCGACATCCGTTAACTTTGGCAAGAGTGCAACAAACGCCCCCGCCGGTTCTAGCGCAGCATTATCTCAACAACAGCAGGAGCTATTCGCGCGGTTCAACCAGCTCCAGGTGGCCGCGAATGCTCCTAACGGCGTTAAGCAGTCACAGCTCAACCTGAACTGGGCACCACCAAAACTTGGCTGGGGTCACTCTGTACCCCTCCCGCCCGGCTTCGCTCCGCCCAAGCCGTCCCAACACCCCGCTGAATGCATCGACGCCAAGTAG

Protein sequence:

>DPOGS208624-PA
QICRFCWNRIREGENGLCPACRKAYPENPADFTPLSQEQVAAIKTEKKAREQKRRNKTLESRRALANVRVVQNNLVFVVGLPVRLADPEILKRQEYFGKYGKIHKVVINQSSSYAGSQSPLASAYVTYVSPADALRAIQGVNNVTLDGRVLKGSLGTTKYCANFMKNQPCPKPDCMYLHELGDPKASFTKEEMHAGLHQVYERRLHQQLLQAQRDRPDDRHYSDGNQPNFIPTTVVTSSQINVVSTSKSKKEPMNGIINGSGSKEAWPSLGASPPADSPARKQNSPKPTVKSLENGISESSSPTQLQTQQSQTKNVKESNTDSKNRNSSNTNGHTSKKNKDSKSKKGNSNTSESSDQGADEKTENNAISIQTQANSVFENDTQSYLSNELDELESDRHSLLENHDLLDSSDHSLLEDDNTHNLLNDASNEVMMMQRHREMLAGLVDNNHLLLKSLPMNGYGLSDRDIYLASDRQISQINHGIMEKELMLRDRNRSSLLMRQNEMMSRHSMEPKHYMPTSSIGLESASELLGANFHPNHSMLPPFGMRVDNSMGASSLGNTMTTLSANTLNNPITNSLSNTLASSMATNSMAANSMGSSMGLSMGSSMGKSMGGFMLAAQQLPQIQNQGQMQSGLVNGFDSTQTTSEGRYQAETMDKFFTDFHKAQQMRQMRDERREPPPHALSAERLEMEQKHRMNNMRSSETLSGRAAGDGDDDLDFDPFKETQKALAEMMETELMLNSISSGDNMERVRRSRLPPPGFSHVNTFGIGVPRHQTHHQGYSSNNAMFSDWTQMDPAIMSTSVNFGKSATNAPAGSSAALSQQQQELFARFNQLQVAANAPNGVKQSQLNLNWAPPKLGWGHSVPLPPGFAPPKPSQHPAECIDAK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: