MonarchBase - Protein-coding gene

DPOGS200685
Transcript	DPOGS200685-TA	1155 bp
Protein	DPOGS200685-PA	384 aa
Genomic position	DPSCF300353 - 29861-31573
RNAseq coverage	144x (Rank: top 54%)

Annotation
*Heliconius*	HMEL008301	8e-153	75.38%
*Bombyx*	BGIBMGA008916-TA	2e-142	66.26%
*Drosophila*	HLHmgamma-PA	4e-24	36.94%
EBI UniRef50	UniRef50_C5NS70	3e-80	90.18%	Enhancer of split mbeta-2 (Fragment) n=1 Tax=Bombyx mori RepID=C5NS70_BOMMO
NCBI RefSeq	XP_001949270.1	1e-34	59.84%	PREDICTED: similar to AGAP012342-PA [Acyrthosiphon pisum]
NCBI nr blastp	gi\|251752778	1e-79	90.18%	enhancer of split mbeta-2 [Bombyx mori]
NCBI nr blastx	gi\|251752778	1e-76	90.18%	enhancer of split mbeta-2 [Bombyx mori]

Group
Gene Ontology	GO:0005634	4.5e-13	nucleus
	GO:0006355	4.5e-13	regulation of transcription, DNA-dependent
	GO:0003677	4.9e-08	DNA binding
KEGG pathway
InterPro domain	[13-71] IPR011598	4.5e-13	Helix-loop-helix DNA-binding
	[14-65] IPR001092	2.6e-12	Helix-loop-helix DNA-binding domain
	[77-115] IPR003650	4.9e-08	Orange
Orthology group	MCL25552		Lepidoptera specific

Nucleotide sequence:

>DPOGS200685-TA
ATGTCGGACCCGGCGCCGCTATCCAAAACAGCCAAATACAAGAAGATAACTAAACCGTTACTGGAGAGGAAACGAAGGGCGCGCATCAATAGATGTCTGGACGAATTAAAGGACCTGATGATCGATGACGACAACCTGAGCAAGCTGGAGAAGGCTGATATCCTTGAGCTAACCGTGAATCACCTCACAAAGTTGCACAGACCCAAGGATCCCGTTATGGAAGCGAAGAAATTTCAAGCCGGATTCGGACAATGCGCGGCTGAGGCTTGTAGATTTATTATGTCCGTACCAGATTTAGACTCCAAAGTTAGTCAAAATCTCGTTGGACATCTGTCGAGACTGATCACATCCCAGCCGCTGACGATACAAGTACCGGAGAGGTCTTCATTCTCGCCGCCGACATCTCCGTCGTCCGTTGTCTCCGATAGACATCATTACTACAGCGATCACGAGAGATCATCCTCAGACGCTGAGGACTCTGTATACTCGGGAGACAGCGCAACAAAACAATGGACATACAAACCCAGTAATAAACAAAGTTTACCAGTTACCGGATTACTTACGACAGTTGACAAGCTATCGCCCCATAACCCAGAACACACCTTCAACGGCCATCGGAACGGGACTTACTTTAACAAAGTTCCAGCTGAAGCGAAAGACGTTATATTGCAGAAGATAAGACAACACATCATGGACAAACGCGGCAACGAGTACGTCGGACACATGGATGTCAACGCAAACGCGGACATCCCCAACGAGAACAGGTACCTTCGTGAGGAGGTCTACAGGAGTGAAGCGCATCACTATCCAGTGCATTACACGACTAACGACACGTTGGATCTCAGAAAAGTAAGATCGCCAGCAAGACAAGCACAAGAGAAATTGAATTCCCCGCCGGAACCGATCCATCCGAACTCAGAATCGGAACATTTAGACAAAAAGCTCCAAATATCCGTCAGCGTTCCGGAACATTGCGAGTCACCGATGGACTACAGCAACTTGCCGCCCAAGAAGAAGAGGAAGTTGATCGAGTACCAGGAGTACAAAAAACAGGAGGAGGCGAGGAGGCAGAACGCTTTCTACGAGGAAAAGGAACGCCGATACGGAGCGCCTTCCGACAGCGAGAATGACGCTAACAAGTGGCGACCTTGGTGA

Protein sequence:

>DPOGS200685-PA
MSDPAPLSKTAKYKKITKPLLERKRRARINRCLDELKDLMIDDDNLSKLEKADILELTVNHLTKLHRPKDPVMEAKKFQAGFGQCAAEACRFIMSVPDLDSKVSQNLVGHLSRLITSQPLTIQVPERSSFSPPTSPSSVVSDRHHYYSDHERSSSDAEDSVYSGDSATKQWTYKPSNKQSLPVTGLLTTVDKLSPHNPEHTFNGHRNGTYFNKVPAEAKDVILQKIRQHIMDKRGNEYVGHMDVNANADIPNENRYLREEVYRSEAHHYPVHYTTNDTLDLRKVRSPARQAQEKLNSPPEPIHPNSESEHLDKKLQISVSVPEHCESPMDYSNLPPKKKRKLIEYQEYKKQEEARRQNAFYEEKERRYGAPSDSENDANKWRPW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: