MonarchBase - Protein-coding gene

DPOGS208376
Transcript	DPOGS208376-TA	7155 bp
Protein	DPOGS208376-PA	2384 aa
Genomic position	DPSCF300146 + 157925-171312
RNAseq coverage	775x (Rank: top 17%)

Annotation
*Heliconius*	HMEL007237	86.64%
*Bombyx*	BGIBMGA012230-TA	83.75%
*Drosophila*	Not1-PG	49.13%
EBI UniRef50	UniRef50_F4W6V5	59.74%	CCR4-NOT transcription complex subunit 1 n=14 Tax=Endopterygota RepID=F4W6V5_ACREC
NCBI RefSeq	XP_395830.2	60.78%	PREDICTED: similar to CCR4-NOT transcription complex, subunit 1 isoform a [Apis mellifera]
NCBI nr blastp	gi\|383858423	61.13%	PREDICTED: CCR4-NOT transcription complex subunit 1 isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|383858423	61.29%	PREDICTED: CCR4-NOT transcription complex subunit 1 isoform 1 [Megachile rotundata]

Group
KEGG pathway	ame:412371	0.0
	K12604 (CNOT1, NOT1)	maps->	RNA degradation
InterPro domain	[2010-2369] IPR007196	1.2e-140	CCR4-Not complex component, Not1
Orthology group	MCL12100		Single-copy universal gene

Nucleotide sequence:

>DPOGS208376-TA
ATGAACCTGGACCCTCTAACGTTTAGTTTATCACAAATAAATTATCTTGTTGTAAATTTAAATAAGAAGAACTTTAAACAGACAAGTCAAGAGTTGTCCCAGATTGTCAGTCTCTATGGCTTGGAAGCAGAGAATCAACTGCTGAGGTGTCTGCTCAGTGAGGCGGCTAAAACGTGGGACGAGCGTACGGCATCCAGCGTGCATGCGTCACTCCTCGCCCAGCACTTGGCCTGTCTACTCAACCACCCCGCAAAGTCTACGGTGATCTGCCAAGCTGTTGATCAACCCACACGCTCACTGCAAAAGGTTTTAAAACCAACGAATTCACTACTTAGTCGACTAGCAAGGTTGCTGAAATTTACGACAGCCCAAGATGTTGCCTTCACATTGGTGCTGAGAAGAAATTCTTCGAAACCTGACATTGTTTCTCTTGCCAAACAGCATTTAAAGAAAAGATTTTTGGACTTTGTCCAGTGTTATCTTGACGCAGAGCGTGGTCATCAAGTTGAGAGAGCGGGACTTCAGGAATGCAGCCCTGAAGTTTTGCAAACTCTTCTAACCAGTCTCGCCTACGAGAACTTCCGGCTTGCAGCCGTCACGAAGGATTTGTTTTTGAAACGTCTGCGTATAGACTTTCCCCGCGAGGTTGTTCCTATTGTACTTGCGCCCCTGCTGTACCCCGACGACACACAAACTCCTTTGGAGGAGATGACAACGTCTGATGATATGACAGCAGCAATGATGGATAATACTTTAGCGGAAATCATTCGAGACATCGGCTATGCCTTCACGGCTTCCGTCGAAGACTGTAAAAATAATATGGTCAATTTTGGTGCCAGGGAGCCCACAGCAATTGACGTTGCCAGAATCATATCTACTATGATCAAGTATCATGCAACTATACAAGAAGCTCCACATGTCCAAACTCCAGGGAATTTCTGGATGAATCATGAGGCTAAAAAGGAGGCCATGGCCCATGGGCACGTCGGAGAAACGTGGAACCCAGAGGTATTTGTCCAGACACTCAAAGAACTTGCTTCAAATTTAAATTGGAAAGAAGTCATTCTACAATTAGATCATCCAGAATTCATTGTTCCCGACAGACAGGGTTTGAGCCTACTATTTACTATTTTGCGCCTAGGTCTCCAGAGCGCTGGATATCCTGCAAATATATTCCCCGTTGAATACCTTTGTCGTCGTTGGGCGAATTTGGAAGGTCAAATGAGTTTATTAACGAACATACTCAAACATCCGGATATATTCAGCTTTGCCGATCATCCTTTCCATCCAGTATCGATAGATCTGCTGAAATCGCCACCGGAAACAGATAACAAAGAAGTATCTACTTGGCGATGTCTATATTTGGTAGAGCTATTATTATATGCTTCAGAACGCGGCTATTATCTGCAAGTACACGAGCTATTTAAATATCCACTACAGCACTGTCCTGACATACTATTGTTGGCGTTGTTACAAATTAGTCCACCTATAACGGTGTTTAGACAAGAATTATTAACAACACTCATTCCTATATTTTTGGGCAACCATCCAAACTCGGGCATAGTTTTACAACATGCATGGCATTCACAAAATCCCAATATCAAGCCCATAATCATGCACGCAATGGCAGATTGGTACATACGAGGAGAATGTGATCAGTCGAAGCTATCAAGAATATTGGACGTTGCGCAGGACCTTAAGGCTCTATCCTTATTGTTGAACGTCCAATCTTTTCCATTTATAATCGATCTAGCTTGCCTAGCATCGCGTAGAGAGTACCTCAAACTTGACAAGTGGCTAACAGACAAAATACGTGATCATGGAGAGACATTTGTTACAGCCATGGTTAAATTTCTGCAACGACGATGTCCCCAAATAATTGGGAAAATACCGGAAGACCAATTGCCCAAAGCGGCACAGTTACCGCCGGAGACTGTGGGCACAATGTTGGCCTGTCTACAGTTGTGTATCCCCAATGTTCAGCAAGAATTACAGGAGGCGATATACAACTTAATGGCTAGCTGTCAAGCCTTAATTCTTACTAAAGCTAGACCGGGTATACCCGGTATTGCAAGACCTCATACACGGATTTTAGAAACTCCATTCAATCCTGCTGGCTTGGGCCCTCAGCTTTTTACTCCCCATGTTGACGCTATTGCAAATTTAGCACCGAATGTCGCCAATATGACATTGGGAGCACCGGCAAATACAGCTTTTGCAATGCCAGGTACTCTCGGACCATTAGTCGCAGCTCCAGGATCACCATCTCGTCTCCTAGGAGCTGGACCTAATAGTCCCTTTGCTATGATGCCCATGCAGCAACATGTCGCCAATGTGGCAAATATGGGAGCATTAGCCCGAATGCCTCCAACACCTATGGACAAGCCACGATTGCCAGATCCTATACATTTACCAGAAATGATTCACAATGTGTCCAAAGAAATAGAAGACGAAGCCAATGGTTATTTTCAAAGGATTTACAATCATCCTCCTCATCCTACATTATCAATAGATGAGGTACTAGAAATGCTTAAGAAATTCCAAGATTCGCCCAACAAAAGGGAACGTGATGTGTTCTCTTGTATGCTCCGGAACCTATTCGAAGAGTATAAATTTTTCCCACAATACCCCGATAAAGAGTTGCATATTACAGCGCAGTTATTCGGTGGTATCATTGAGAAGGGATTAGTTCCTAGTTATGTGTCACTAGGGCTGGCTCTAAGATTCGTCCTAGATGCTTTACGAAAGCCGGAGGGCTCTAAAATGTATTACTTTGGCATAGCGGCTTTAGATAGATTTAAGTCGCGATTAAAAGATTACCATAAATATTGCGAACACGTAAGAGCCATACCGCATTTTAATGAGTTCCCTCCACACTTAATCGAATACATTGAGTACGGTCTCCAGAGCCAAGAGCCGCCCACTAAACCACAGGGGGCAGTTTTACCTACGAGTCTAACCGCCATCTTGAATCAGACCGCCGTTATAACAGTTTCAGCACCTTACAGGGCAGTAATTTGCGCTCCCAGTGCCATCTCTGTCATCTCGAAAGTGTCAAATTGTATTGCGGGCGGTATAGGAAGTCGGCCGTCAATAGCCAACGCCACCAACATTGATACACTACTGACTGCTACCGACAGGGAAGAGAAGATAAACGCACCACCAGAGGCTATTCAAGATAAAACTGCTTTCATATTCAATAATCTTAGTCAATTGAACTTACAACCCAAATGTGAAGAGTTAAAAGAAATTATAACAGAAGAATATTTCCCATGGCTATCACAGTACCTAGTGATGAAAAGGGCGTCCATAGAACTAAATTTCCACGCTCTGTACTCAAATTTCCTAGACGTCCTAAAAATTCGTGAAATAAACAGGTTAGTTACTAAAGAAACTTATCGGAACATCAGAGTATTGTTGCGATCTGATAAAGGCATAGCTAACTTTTCTGATCGATCGTTACTCAAAAACCTCGGCCATTGGTTAGGCATGCTCACCTTAGCTCGCAATCAACCGATCCTCTACATCGACCTCGACCTCAAAGCACTCTTACTTGAAGCTTATCACAAAGGCCAGCAGGAGCTGTTATATGTCGTGCCGTTTGTTGCGAAGGTCTTGGAATCCTGCGCCAAGAACGTCGTATTTAAACCGCCGAACCCTTGGACAATGGCCCTAATGAACGTATTGGCTGAATTACATCAAGAACCAGACTTAAAATTAAATCTGAAGTTTGAAATAGAAGTGCTTTGTAAAAACTTGAGTTTAGACATAGCCGATCTTAAGCCATCTCTGTACCTGAAGGACCCAGAGAAAGTGAGGACGATAGAGTTCCAGCTCTCACAACCGAAACCGGTCAAAGAAACCCCCAACGTGATGCCAGTGAATCAGACATTAGTTCCGGCACCACAAATACAATTGATGCCACCACAGCCTCAGATGATACCCGTCGAAGATATGTCAGCTGCCGCGCCCACGCCCACCGCTGGGCTGGTCGCCAATGATCCAAACCTCATGGGCGTCCTAGGTTTGCCAGAGCCACGGTTCAACTACCTCGACGTCAACGTCTCATCCACCTCGGCCTTCGGACAGAAAATATGTTTCAATCCGCATATCATTCTGTTCCAAAACTACCCACACTTGAAACAATTTGTGAAACCTGCTATAGAAAGGTCGATTCAAGAATGGATACATCCAGTCGTCGATAGGTCCATCAAGTACGCTCTGACGACTTGTGAGCAGATAATAAGGAAAGACTTCTCCTTCGACCCCGACGAAGTACGTATGCGCACTTGCGCTCATCACATGATGAGGAATTTAACGGCCGGCATGGCTATGATAACCTGTCGGGAGCAGATCATCAGCACCATTAGCACAAACCTTAAGGCGGCGTTCATCACGGCTTTGATACCGACCACGCCGCAACAGAAGGATATCATAGAGAGTGCCGCAGCGGTGCTTGCTACTGAGAACATGGAACTTGCTTGTGCTTTCATCCAGAAGACAGCCGTTGAGAAGGCGCTCCCGGAACTCGACAAACGACTGATGAACGATTACGAAATGCGTAAAATTGCTCGGCAAGAGGGCAGGAGATACTACGATCCCATTGTCTTGACGTATCAGACAGAGAGGATACCGGAACGAGTCCGCCTACGCGTCGGAGGTCCAACGGACTTGCAGATCTCTGTCTACGAGGAGTTCGCGTGCAACATTCCAGGATTCATGCCTGTGAGAGACGCTGGAATGTTCATACCGAAACCGTCCGCCCAAGAACAAGTACCACAGATGACGTTTAATCAAGTAATGAATCCGCAACAGGTATATGGAACGGATGAGATGGGTACACTGATATCAGCTGCGGAGTTGTTCCTCAGCAACGCCCTGTCTGTTCCCTCGTTCGCGGTGCAAGCGACAAACATGCATACTTTACTCGAATGCCTCATCATCGCCAGACGGAATCGTGATATCGTTTCGGGCTACACTCTCCTACAACGAGCTGTTGAGGGTCTCCTAGATGGTCACATTGTACAGCCGGGCACGAACCCAGAACACGCTGAAATGATGACCCGTTATCGTGATATCCACCTGCGAGTACTGAAGCTGTTAGAAGACGCGAGGGTGTACGGCCACGCGTGGACAACTAAACAGATCACATACTGCGTATCCGAATGTAGGGATGAACTGAGATACAACCTGGAAGCTATCGACTGTCTCGTAAGGAACCACCTGATCAACATGCCACAGTACGATCTTGCGTTGGCACATTTGATGGACAACGGCAACAACTACGTCGCCGTGGCTTTCGCGATGCAAGTGGTTCAGTTATACCTTGTGGATGACAGGAACAACGTGTACGCAACGGAATCAGACCTCTACCACACTACTGACACCCTCGTTAGGATGATGTCACACTCGCGGCAGCCGCCGCCAGAGGGTCTTGCCACATTGATTGAAACTATCCGCATCAACCAGGACCCCAGCACATATCTTGGTGAACGTTCACCTCTTGGACCCACCGCTCACATTCACAATGGCATTTTGCAAGTGCGGGCCCGCGACTACGAGGATCCACCCGGTCTCCAAGAGAAGACGGAAAATCTGCTCCGCGAATGGAGGAACGTGCTCCTCAGTCCACTCACTGAAATAGAGATCGGACAGAACTTCAATATATACGTGCACAGGATGAACATGAATGGTATACTGAAATCTGATGACATGATCACACGTTTCTTCCGCATAGCCACTCAGATGTGCGTCGAGAATGTATACCAGCTGTTGAACGAGGACAGGATGAATCCTCCCCCCGTGCCGCCCAAGAGGGACAAGTATTACGCTATGTGCGACTCATTCATCAAGCTTGTGTCGCTGCTGATTAAGAATACGGCTGACGGAGGAAATCCAACACCGAAATTGAACTTATTGAACAAGATCCTGGGTATAATCGCGGGCTGTCTGCTGCAAGACCACGAGGAGCACGGCTCGAATTTCCAGCAGCTGCCGTACCACCGTCTCCTGCTGATACTGTTCCTAGACATGAACATGGCCGAACCCGTCCTTGAATCTATGAACTACCAGGTTCTAACAGCATTCTGCCACACCCTCCGCATCATACGCCCGAGTGTAGCTCCAGGGTTTTGTTACGCGTGGCTTGAAATAGTCGCCCACCGAGCATTCGTGAATCGTGTTCTGGCTGTGACGCCGCAACAGAAGGGTTGGGGGATGTATTCGACGCTGCTTATCGACCTTTTCAAGTTCCTCGATCCGTTCTTACGTAACACGGAGCTGGCGACGCCAGTCATGATGCTGTACAAGGGAACACTTAAAGTGTTGCTAGTATTGCTCCACGACTTTCCCGAGTTTTTGTGTGACTATCACTATGGCTTTTGCGATGAGATCCCACCGAATTGCATACAGATGAGGAATCTCATTCTGTCCGCGTTCCCGAGGAACATGCGTCTGCCGGATCCATTCACACCCAACTTGAAGGTGGATCTGTTGGCCGAGATCACTCTACCACCGCGTGCCGTTATCAACTACGCCAATATAATACCGGCGTCGCAGTTCAAAAAGGATCTGGACGCGTATATCAAGGCCAGGGCTCCGGTTACATTCCTATCGGAACTGCGCAGTAACATGCAGGTGGTGAACGAGCCAGGTCGCAGGTACAACAGCCAGCTGATGAACGCGGTGGTGCTTTACGTCGGGACGCAGGCGATCGCTTACATCCGTGCCAAAGGGCAGACGCCGAACATGTCGACGATAGCACATTCAGCTCACATGGATATATTCCAGAATTTCACCGTAGACTTTGACTATGAGGGCCGGTATCTATTCTTGAACGCTATCGCGAATCAGCTCCGTTATCCGAACAGTCACACGCACTACTTCAGTTGCTGCCTGCTGTATCTGTTCGCCGAGGCTAACACGGAGGCTGTTCAGGAACAGATAACGAGGATGCTCCTAGAAAGGTTGATAGTAAACCGACCACATCCCTGGGGGCTCCTCATCACATTCATCGAACTCATCAAAAATCCTATATATAAGTTCTGGACACACGAATTCGTACATTGCGCGCCCGAGATCGAAAAGTTGTTCGCGTCGGTCGCCCGCTCGTGCATCGCGGACAAGGCTGGGGGGGAAAGGGATATGACCGAGTAG

Protein sequence:

>DPOGS208376-PA
MNLDPLTFSLSQINYLVVNLNKKNFKQTSQELSQIVSLYGLEAENQLLRCLLSEAAKTWDERTASSVHASLLAQHLACLLNHPAKSTVICQAVDQPTRSLQKVLKPTNSLLSRLARLLKFTTAQDVAFTLVLRRNSSKPDIVSLAKQHLKKRFLDFVQCYLDAERGHQVERAGLQECSPEVLQTLLTSLAYENFRLAAVTKDLFLKRLRIDFPREVVPIVLAPLLYPDDTQTPLEEMTTSDDMTAAMMDNTLAEIIRDIGYAFTASVEDCKNNMVNFGAREPTAIDVARIISTMIKYHATIQEAPHVQTPGNFWMNHEAKKEAMAHGHVGETWNPEVFVQTLKELASNLNWKEVILQLDHPEFIVPDRQGLSLLFTILRLGLQSAGYPANIFPVEYLCRRWANLEGQMSLLTNILKHPDIFSFADHPFHPVSIDLLKSPPETDNKEVSTWRCLYLVELLLYASERGYYLQVHELFKYPLQHCPDILLLALLQISPPITVFRQELLTTLIPIFLGNHPNSGIVLQHAWHSQNPNIKPIIMHAMADWYIRGECDQSKLSRILDVAQDLKALSLLLNVQSFPFIIDLACLASRREYLKLDKWLTDKIRDHGETFVTAMVKFLQRRCPQIIGKIPEDQLPKAAQLPPETVGTMLACLQLCIPNVQQELQEAIYNLMASCQALILTKARPGIPGIARPHTRILETPFNPAGLGPQLFTPHVDAIANLAPNVANMTLGAPANTAFAMPGTLGPLVAAPGSPSRLLGAGPNSPFAMMPMQQHVANVANMGALARMPPTPMDKPRLPDPIHLPEMIHNVSKEIEDEANGYFQRIYNHPPHPTLSIDEVLEMLKKFQDSPNKRERDVFSCMLRNLFEEYKFFPQYPDKELHITAQLFGGIIEKGLVPSYVSLGLALRFVLDALRKPEGSKMYYFGIAALDRFKSRLKDYHKYCEHVRAIPHFNEFPPHLIEYIEYGLQSQEPPTKPQGAVLPTSLTAILNQTAVITVSAPYRAVICAPSAISVISKVSNCIAGGIGSRPSIANATNIDTLLTATDREEKINAPPEAIQDKTAFIFNNLSQLNLQPKCEELKEIITEEYFPWLSQYLVMKRASIELNFHALYSNFLDVLKIREINRLVTKETYRNIRVLLRSDKGIANFSDRSLLKNLGHWLGMLTLARNQPILYIDLDLKALLLEAYHKGQQELLYVVPFVAKVLESCAKNVVFKPPNPWTMALMNVLAELHQEPDLKLNLKFEIEVLCKNLSLDIADLKPSLYLKDPEKVRTIEFQLSQPKPVKETPNVMPVNQTLVPAPQIQLMPPQPQMIPVEDMSAAAPTPTAGLVANDPNLMGVLGLPEPRFNYLDVNVSSTSAFGQKICFNPHIILFQNYPHLKQFVKPAIERSIQEWIHPVVDRSIKYALTTCEQIIRKDFSFDPDEVRMRTCAHHMMRNLTAGMAMITCREQIISTISTNLKAAFITALIPTTPQQKDIIESAAAVLATENMELACAFIQKTAVEKALPELDKRLMNDYEMRKIARQEGRRYYDPIVLTYQTERIPERVRLRVGGPTDLQISVYEEFACNIPGFMPVRDAGMFIPKPSAQEQVPQMTFNQVMNPQQVYGTDEMGTLISAAELFLSNALSVPSFAVQATNMHTLLECLIIARRNRDIVSGYTLLQRAVEGLLDGHIVQPGTNPEHAEMMTRYRDIHLRVLKLLEDARVYGHAWTTKQITYCVSECRDELRYNLEAIDCLVRNHLINMPQYDLALAHLMDNGNNYVAVAFAMQVVQLYLVDDRNNVYATESDLYHTTDTLVRMMSHSRQPPPEGLATLIETIRINQDPSTYLGERSPLGPTAHIHNGILQVRARDYEDPPGLQEKTENLLREWRNVLLSPLTEIEIGQNFNIYVHRMNMNGILKSDDMITRFFRIATQMCVENVYQLLNEDRMNPPPVPPKRDKYYAMCDSFIKLVSLLIKNTADGGNPTPKLNLLNKILGIIAGCLLQDHEEHGSNFQQLPYHRLLLILFLDMNMAEPVLESMNYQVLTAFCHTLRIIRPSVAPGFCYAWLEIVAHRAFVNRVLAVTPQQKGWGMYSTLLIDLFKFLDPFLRNTELATPVMMLYKGTLKVLLVLLHDFPEFLCDYHYGFCDEIPPNCIQMRNLILSAFPRNMRLPDPFTPNLKVDLLAEITLPPRAVINYANIIPASQFKKDLDAYIKARAPVTFLSELRSNMQVVNEPGRRYNSQLMNAVVLYVGTQAIAYIRAKGQTPNMSTIAHSAHMDIFQNFTVDFDYEGRYLFLNAIANQLRYPNSHTHYFSCCLLYLFAEANTEAVQEQITRMLLERLIVNRPHPWGLLITFIELIKNPIYKFWTHEFVHCAPEIEKLFASVARSCIADKAGGERDMTE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: