MonarchBase - Protein-coding gene

DPOGS202775
Transcript	DPOGS202775-TA	1764 bp
Protein	DPOGS202775-PA	587 aa
Genomic position	DPSCF300018 - 1012265-1027328
RNAseq coverage	1706x (Rank: top 7%)

Annotation
*Heliconius*	HMEL002679	3e-81	53.28%
*Bombyx*	BGIBMGA010496-TA	1e-101	55.28%
*Drosophila*	dl-PC	6e-104	61.46%
EBI UniRef50	UniRef50_G3LF42	3e-144	51.54%	Dorsal n=1 Tax=Helicoverpa armigera RepID=G3LF42_HELAM
NCBI RefSeq	NP_001036896.1	2e-128	45.83%	embryonic polarity protein dorsal isoform B [Bombyx mori]
NCBI nr blastp	gi\|346987765	1e-143	51.54%	dorsal [Helicoverpa armigera]
NCBI nr blastx	gi\|346987765	1e-142	53.15%	dorsal [Helicoverpa armigera]

Group
Gene Ontology	GO:0006355	3.9e-70	regulation of transcription, DNA-dependent
	GO:0003700	3.9e-70	sequence-specific DNA binding transcription factor activity
	GO:0005634	1.2e-67	nucleus
	GO:0005515	4.5e-10	protein binding
KEGG pathway
InterPro domain	[55-241] IPR008967	3.9e-70	p53-like transcription factor, DNA-binding
	[57-232] IPR011539	1.2e-67	Rel homology
	[234-371] IPR014756	2.4e-36	Immunoglobulin E-set
	[234-348] IPR013783	6.4e-34	Immunoglobulin-like fold
	[62-79] IPR000451	4.2e-29	NF-kappa-B/Rel/dorsal
	[236-335] IPR002909	4.5e-10	Cell surface receptor IPT/TIG
Orthology group	MCL10541		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202775-TA
ATGGACAACGGCGGAGAGGGCGTGCTGCATGTAGACCACAGTGAGGCGGGCCAGCCGTCCAACCTGAATATAAGTGATGTCATTGAGGCGATCACGAAGGCGGACCCGCTGTTCGGGCCGGGAGTAGAGGCAATGCCGCGACCTCTGACCTCCCACCCGGGGCAGACCTACGTCCGCATAGTGGAGCAACCCGCCGGGAAGGCGCTCAGGTTCCGGTACGAGTGTGAGGGTCGGTCGGCGGGCTCCATCCCCGGGGTGAACAGCACCCTCGAGAGGAAGACCTACCCCACCATAGAGATCGTGGGCTACAAGGGAGATGCCGTCGTCGTGGTGTCCTGCGTCACCAGGGAACAGCCCTACAGACCTCACCCCCACAACCTGGTGGGTCGCGAGAGGTCATGCGAGAACGGAGTGTGCACCGTGAAGAGGAGCATCAGCGAGGAGTCGCCACAGGTGTCCTTCAGTAACCTGGGGATACAATGTGTCAAGAGGAAGGACATCGCCGAGGCGCTCAAGACGAGAGAGAGGCTCCGGGTGGACCCTTTCAAGACCGGTTTCGGTCACCGCAACAAGCCGCAGAGCATCGACCTGAACACTGTGAGGCTCTGCTTCCAAGTGTTCCTCCCTGACGAGCGGACAGGCAAGATCAAGCACTCGCTGCCGCCCGTCGTGTCCGACGTCATCTACGACAAGAAGGCCATGAGCGACCTGGTCATCATGAGGGTCAGCCAGTGCTCGGACTTCGTCAAGGGAGGCGCCGAGATCATCCTGCTGTGCGAGCGAGTGACGCGCGAGGACATCTCCGTGGTGTTCTTCCAAAAGGAGGGCGACAACGTGGTTTGGGAGGAAAGCGCGCACATCGTGCTCGTCCACAGGCAGTACGCCATCGCTTTCCACACGCCGCCCTACAGAGACCAGGCGGAGACAGGACACGTGCAGGTGTATCTCCAGCTGAAGCGGATCTCGGACAACGCCCGCAGCAACGCCGTGCCGTTCGAGTACATCCCGGAATACCAAGATACGAACTATTTAAAGCATAAGAGGTTGAAGAAGTTACCTTCGGTGTTGCATACTTCCTACGACACAGACAGAAGCTACCAAGGAGATCAGAAGATTAAAGCGGAACCCAGAGACAAAACTCCGCCTCACCCCGCGGCCAGCCCGCTGCAAGTGTTCTCGCCACACTACGAGCAGGAACAGATGCAGCAAGACCACTACCAGCAACAGGCCTGGGGAATGCAAGGCGGATTAAACATGGCCGGGCCGAGCCATATTAACTATGGTCAGGACTTGCAGTGGAGTCCGAATTACGTCCAACTGGGTTCCAACCTCCAGCCTCTGTCACCGAATATGACGACCCTGACCTCCAACATGCAACAGATGTCAAGCCTGCAACCTCTGTCGCCGAATATGCAGAGGATGTCGCCGAATATGCAGGCCATGTCTCCCAATATGCAAGCGATGTCTCCGAACATGCAAGCACTATCGCCCTTATACGTCCGGTACAGACCCAACATGCAAGCAATGTCTCCGAACATGCAAACGATGTCTCCAAGCATGCACGGCATGTCTCCTAACCTGCAAGCGATGAACACCAACATGCAGATGGGTATGGCGCCGCTGCTGGAGTCGCCGCTGGGAGAGCCTCTGACGTCTTCGGAGCTGTCCGGACTGGCCGCTCTGCTGGACCGAGGACCCGACCTCAGCGACAGCCTCAACCGCCTCTCCACCGGGGACCTCTACCCCATCTGCAGCGGAGACTAG

Protein sequence:

>DPOGS202775-PA
MDNGGEGVLHVDHSEAGQPSNLNISDVIEAITKADPLFGPGVEAMPRPLTSHPGQTYVRIVEQPAGKALRFRYECEGRSAGSIPGVNSTLERKTYPTIEIVGYKGDAVVVVSCVTREQPYRPHPHNLVGRERSCENGVCTVKRSISEESPQVSFSNLGIQCVKRKDIAEALKTRERLRVDPFKTGFGHRNKPQSIDLNTVRLCFQVFLPDERTGKIKHSLPPVVSDVIYDKKAMSDLVIMRVSQCSDFVKGGAEIILLCERVTREDISVVFFQKEGDNVVWEESAHIVLVHRQYAIAFHTPPYRDQAETGHVQVYLQLKRISDNARSNAVPFEYIPEYQDTNYLKHKRLKKLPSVLHTSYDTDRSYQGDQKIKAEPRDKTPPHPAASPLQVFSPHYEQEQMQQDHYQQQAWGMQGGLNMAGPSHINYGQDLQWSPNYVQLGSNLQPLSPNMTTLTSNMQQMSSLQPLSPNMQRMSPNMQAMSPNMQAMSPNMQALSPLYVRYRPNMQAMSPNMQTMSPSMHGMSPNLQAMNTNMQMGMAPLLESPLGEPLTSSELSGLAALLDRGPDLSDSLNRLSTGDLYPICSGD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: