MonarchBase - Protein-coding gene

DPOGS215981
Transcript	DPOGS215981-TA	3621 bp
Protein	DPOGS215981-PA	1206 aa
Genomic position	DPSCF300078 - 432365-442025
RNAseq coverage	836x (Rank: top 15%)

Annotation
*Heliconius*	HMEL008680	0.0	67.21%
*Bombyx*	BGIBMGA001211-TA	0.0	62.83%
*Drosophila*	HLH106-PB	1e-66	32.12%
EBI UniRef50	UniRef50_D2A113	9e-98	32.92%	Putative uncharacterized protein GLEAN_07163 n=1 Tax=Tribolium castaneum RepID=D2A113_TRICA
NCBI RefSeq	XP_974195.1	2e-98	32.92%	PREDICTED: similar to sterol regulatory element-binding protein 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91081473	3e-97	32.92%	PREDICTED: similar to sterol regulatory element-binding protein 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91081473	4e-93	32.54%	PREDICTED: similar to sterol regulatory element-binding protein 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	1.6e-21	nucleus
	GO:0006355	1.6e-21	regulation of transcription, DNA-dependent
KEGG pathway	dre:793274	7e-76
	K07197 (SREBP1, SREBF1)	maps->	Insulin signaling pathway
InterPro domain	[286-356] IPR011598	1.6e-21	Helix-loop-helix DNA-binding
	[288-338] IPR001092	1.8e-16	Helix-loop-helix DNA-binding domain
Orthology group	MCL10763		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215981-TA
ATGGATCCGATGGAGCCTTTAATAAACAATGATGTTTTTAATGTCAACGAAATAGCTGAAATAGAAGATTTCTTGAATGGCTGTGACGGAGATTTTATGAAAAAGTTAGAAGAAGAACTAGTATTTGCAGATAATGACACTGGTCTGTTGAGCGTGGACACTAAATTTAGTACGAATGTTTCATCACCCCAAGATTCTCCTTATTACACTGCTCCGGGGAACCCATTGGTTTCTCAACATCCGCAAAAGAGAAAACTGCCTCCATTTACTCAACAACCGAAAACAAGCCCAGTTTTAGGGGTGTATGGCAGAGAAGAAAGTTATAATTTGGAAGTTAAAGCAGAAAGCCATCAGTTGCCTGAGGTGCTACTTCAAAAAGCTCAAAACCAGACAGTTCAAACTCCGATGTTTGTGCAACAAGTTATTCCAAAACCTCAATATGTTGCCTTAGGAAGCTTACAAAAATTACCCGATGGGGTGGCATCTCTTGTTCAATTAGATTCTCCAATAAATCAAAATACTAAAGCCCAACCCGCAGCCAAGCCATTGCTGCTCCCAAATAATGCAAAAGGGGTTACACCAGTTATTTTGAAGAGCAGCGACTCAAATTTTTCACCTGTGATATTACAGTCAAATATTCTCAATCCTGAAACTCAGACTTTGATGTACACCAGTGCTCCTGTACAAGGAACAACTCAAAGTATTATTACCAATTCTGGTGCTGAAAGTCAGCCTGTACACACTTTCTTTGCTAGTAATAATGGCCCTACATTGGTTACTGGCATACCATTGGTCCTGGATGGTGACAAAATTTCCTTCAACCAATCTTCGAATGGAAGTCCTCCTAAAGTTAAAGAAGTAAAGAGAAGTGCCCACAATGCTATCGAAAGAAGATATAGAACTAGCATAAACGATAGAATAGTGGAGCTTAAGAATATGTTAGTAGGTGAAGAAGCAAAGTTAAATAAGTCAGCAATATTAAGAAAAACAATAGATTACATAAAGTACCTGCAAAATCAGAATACTAGACTTAAACAAGAGAATATAGCTCTGAAACTGGTGTGTCAGAAGTCTGGAGTGAAGGATGTTGTGTTTGATGGAGCCTACACCCCACCACATAGTGACATATCATCCCCCTACCACTCTCCCCATGGTATGGATAGCACTCCTTCATCACCAGAGAGTAAGGTCGAAGAAAAATACTCGAAAATTGTTATTGGAATGGGAGATCATTCTCGTCTAGCATTATGTGCCTTTATGATAGGGCTGATTGCCTTCAATCCATTCAGTGCTTTCTTTGGCAGTTTTATGTCCGAATCCTCTTATGATTACAACGCTCGACTTGATCAACGAAGAATACTTTCCGAAGATAGTTTTGGTGCTGGAAATGTATCGTGGGGAGCCTGGCTATTCAATATGTTTTTGATATATTTGGTAAATACAATAATTTTGGGAGGTTGTCTCATCAAACTTCTAGTGTATGGGGATTCTGTACCAAAATCACAATCTAAGGAAGCCGGCCTATTTTACAAACACAAGCAACAAGCTAATAATCATTTAAAGAAGAATGATCTGGAGAATGCTCGGAGTGAGCTGAATCGTGCTCTGTCGGTATGTGGTCGTAGTGTCCAGGCGGGTGGGTGGGGGCGTTACTCAGCGCTCACTGCTGCTGTAATGAGACAGATACTGCAACGACTTCCCTTGGGAGGCTTCCTGGCAAGACGAGCTGGAGATCTGTGGGGTGACAGTCCAGCGAGACGCGCCACTCAGCACTGGGCCAAAGAAGTGTCTATGGTGTCTCACAAATTGGCCCAATTGGAAATATTATCTAATCAGACGAGTGGCAGTAAATGTGTACTACTGGCGTTACAAGCTGTCAACCTTGCTGAAGTCACGAGCGATAAGCAGTTACTCGCCGAGACTTATGTTACCGCGGCGTTAGTCTTTAAGGACTATATGCCAAATTTTGGAAAATGGCTATGTGGATACTACCTGCGTCTATGTACATATTGGTGTTGGGAGACGATCCCTGAGGGTAATCCGCGTGTACGGTGGGCGACCAGCTCACGGGGACAGGACTTCCTCAGAACCCGTCGCTGGGTGTATGAACAGAAACCTGCTTACCAACTGTTTTCCAGACTACCCACGCTCACCGATCCACTGGCTTATGCTATGAGGGCCTACCACCTGGAACTGCTGCAAACGAGCCTGCAAATGCTGCTTTGTGCTGACGAACGCAGCAGCACACGAGATGTCCTCGACCTGTGGTGGGCTAGCGTCGTTGGCGCTGCGGCAGCCTGCTTGCTGGCCGACGCGCCCGCCATCGCCGACCTCGCCGACAAACTGGCCGTTCTGCCGGACGAACTCGCCACCAGTGAGGATCCGCTGCCGGGTTCGCTGGACATGGCCTACAAAAGCCGGCGCGGGCTGCTCGCACTAGCTCACTGCTCAGATGAAGACAAGCACTCGAAGACCACTCACACGCTGCTCAAGACGATCCCTGAGGGTAATCCGCGTGTACGGTGGGCGACCAGCTCACGGGGACAGGACTTCCTCAGAACCCGTCGCTGGGTGTATGAACAGAAACCTGCTTACCAACTGTTTTCCAGACTACCCACGCTCACCGATCCACTGGCTTATGCTATGAGGGCCTACCACCTGGAACTGCTGCAAACGAGCCTGCAAATGCTGCTTTGTGCTGACGAACGCAGCAGCACACGAGATGTCCTCGACCTGGTGAAGCTGATTATTGATGACGTGTCCACAGACGCGCCCCATCACTCAGGTTGCTGGGACCCGGTGTTAGAGTGGTGGGCTAGCGTCGTTGGCGCTGCGGCAGCCTGCTTGCTGGCCGACGCGCCGGCCATCGCCGACCTCGCCGACAAACTGGCCGTTCTGCCGGACGAACTCGCCACCAGTGAGGATCCGCTGCCGGGTTCGCTGGACATGGCCTACAAAAGCCGGCGCGGGCTGCTCGCACTAGCTCACTGCTCAGATGAAGACAAGCACTCGAAGACCACTCACACGCTGCTCAAGGTTTGTGATGTCGCCGGAGCCCGGCTAGCGGATTCCTTGGCGTATTACTGCTGCCGGAAGCCGACACAGCTCATGATGCTGATGCAGGTCCTATGCTGTGATTGGGTGCTGGAGGTGAGAGCGGGGGTGTGGGAGGCGCGCGGCGCGGGAGGGGGCGGGTCGCCCGTCCACAACCAGCTGGCTGGCTTCCAGAGGGATTTACATTCTTTGAGGAGGCTGTCGCAGAACTTACCGTGGGTGACGTCAGCCCACAAGGACGTGAGGCGGCACTGCCGCATGATGGCGGGCGCGGCGCCGCGGCGCACGCAACAACTGCTGGACGGGAGCCTCAGACCCAGGTCTAACAGGACCTCGCTGATATGCGGCAAGGAGCGTGCGTTAGAGGGCGGGGGTGGGGAGGGCGAACGTGCGGTAGCTTTATACATGGCGTGCAAGCATCTCCCGGCGGCGGTGCTAGCGACCCCCGGCGAGAGGGCCGGCATGTTGGCGCAAGCTGCAGCTACGCTACAGAAGATAGGCCATCGTTCAAGACTACCACACTGCTACCACCTCATGAAGACCTTTGGCACTCTGCCCGCGCCTTGA

Protein sequence:

>DPOGS215981-PA
MDPMEPLINNDVFNVNEIAEIEDFLNGCDGDFMKKLEEELVFADNDTGLLSVDTKFSTNVSSPQDSPYYTAPGNPLVSQHPQKRKLPPFTQQPKTSPVLGVYGREESYNLEVKAESHQLPEVLLQKAQNQTVQTPMFVQQVIPKPQYVALGSLQKLPDGVASLVQLDSPINQNTKAQPAAKPLLLPNNAKGVTPVILKSSDSNFSPVILQSNILNPETQTLMYTSAPVQGTTQSIITNSGAESQPVHTFFASNNGPTLVTGIPLVLDGDKISFNQSSNGSPPKVKEVKRSAHNAIERRYRTSINDRIVELKNMLVGEEAKLNKSAILRKTIDYIKYLQNQNTRLKQENIALKLVCQKSGVKDVVFDGAYTPPHSDISSPYHSPHGMDSTPSSPESKVEEKYSKIVIGMGDHSRLALCAFMIGLIAFNPFSAFFGSFMSESSYDYNARLDQRRILSEDSFGAGNVSWGAWLFNMFLIYLVNTIILGGCLIKLLVYGDSVPKSQSKEAGLFYKHKQQANNHLKKNDLENARSELNRALSVCGRSVQAGGWGRYSALTAAVMRQILQRLPLGGFLARRAGDLWGDSPARRATQHWAKEVSMVSHKLAQLEILSNQTSGSKCVLLALQAVNLAEVTSDKQLLAETYVTAALVFKDYMPNFGKWLCGYYLRLCTYWCWETIPEGNPRVRWATSSRGQDFLRTRRWVYEQKPAYQLFSRLPTLTDPLAYAMRAYHLELLQTSLQMLLCADERSSTRDVLDLWWASVVGAAAACLLADAPAIADLADKLAVLPDELATSEDPLPGSLDMAYKSRRGLLALAHCSDEDKHSKTTHTLLKTIPEGNPRVRWATSSRGQDFLRTRRWVYEQKPAYQLFSRLPTLTDPLAYAMRAYHLELLQTSLQMLLCADERSSTRDVLDLVKLIIDDVSTDAPHHSGCWDPVLEWWASVVGAAAACLLADAPAIADLADKLAVLPDELATSEDPLPGSLDMAYKSRRGLLALAHCSDEDKHSKTTHTLLKVCDVAGARLADSLAYYCCRKPTQLMMLMQVLCCDWVLEVRAGVWEARGAGGGGSPVHNQLAGFQRDLHSLRRLSQNLPWVTSAHKDVRRHCRMMAGAAPRRTQQLLDGSLRPRSNRTSLICGKERALEGGGGEGERAVALYMACKHLPAAVLATPGERAGMLAQAAATLQKIGHRSRLPHCYHLMKTFGTLPAP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: