MonarchBase - Protein-coding gene

DPOGS213157
Transcript	DPOGS213157-TA	2073 bp
Protein	DPOGS213157-PA	690 aa
Genomic position	DPSCF300016 + 1283497-1290986
RNAseq coverage	139x (Rank: top 55%)

Annotation
*Heliconius*	HMEL010318	0.0	69.35%
*Bombyx*	BGIBMGA007914-TA	0.0	75.17%
*Drosophila*	Hr39-PB	2e-135	41.24%
EBI UniRef50	UniRef50_E0VMS4	2e-134	42.37%	Ecdysone receptor, putative n=4 Tax=Neoptera RepID=E0VMS4_PEDHC
NCBI RefSeq	XP_001845875.1	3e-141	43.78%	nuclear hormone receptor FTZ-F1 beta [Culex quinquefasciatus]
NCBI nr blastp	gi\|3834346	0.0	73.85%	hormone receptor 39 [Bombyx mori]
NCBI nr blastx	gi\|3834346	0.0	83.82%	hormone receptor 39 [Bombyx mori]

Group
Gene Ontology	GO:0003707	2.9e-37	steroid hormone receptor activity
	GO:0005634	2.9e-37	nucleus
	GO:0006355	2.9e-37	regulation of transcription, DNA-dependent
	GO:0043401	2.9e-37	steroid hormone mediated signaling pathway
	GO:0003700	2.9e-37	sequence-specific DNA binding transcription factor activity
	GO:0008270	4.7e-34	zinc ion binding
	GO:0043565	4.7e-34	sequence-specific DNA binding
	GO:0003677	1e-11	DNA binding
KEGG pathway
InterPro domain	[487-656] IPR008946	2.9e-37	Nuclear hormone receptor, ligand-binding
	[360-431] IPR001628	4.7e-34	Zinc finger, nuclear hormone receptor-type
	[359-426] IPR013088	9.6e-28	Zinc finger, NHR/GATA-type
	[550-657] IPR000536	6.8e-16	Nuclear hormone receptor, ligand-binding, core
	[424-434] IPR001723	1e-11	Steroid hormone receptor
Orthology group	MCL12890		Insect specific

Nucleotide sequence:

>DPOGS213157-TA
ATGTCTAGTGAGGGGGAGGCGGTGAAAGTGGAAGGGGGTCATATCTCCGTCACTACTATCAGCATGTCGGGACCGGAGAGTAGCAATGGGCAGTTCTCGTATAGCTCGAGCGGAGTCCGTATCAGCGTGTCCTCGGAGCCTCAAGACGAGGATTCGACGGACGCGGAAATATCCAAAATAGATTTCACCCAACACCAGTATGAGGTCAACATGCGGAATAAGAAGAAGCGTTCGTCCGGCCAGTGTGACCAGGCCAAGGAGCAAGAGAGGCCGATGTCCTGGGAGGGAGAGCTGTCAGACTCGGAAATGGTCATCGACACCAGCACCAATAACGTAGACGAGAACAGCAGCTCCCTGGACCTCCAATCCTCCCGGGATTCAATCGACACGCTCCGCAACGTGTCCATTAAGACTGAACCTCTTAAAACAGAGCTCTTCCACACTATGGAGGACCAACGTGTTCTGGACCTGAAGTATACCGTGCCTCTTCAGTCACATCAGCGCAGTCTTAGTATGAATAGGATATCGGTCCTAACAGACAGTAATTCGTTGTTAGCGCGGCGGCCGTCATCACCCTCGCACTACGACGCGCATCCCGAGGTCCAGAACCTCACTATCAAGAAGGAACAGCTCTCTGGTGGGTATTATGGACCTGAAAGACAGTCCACTGTCCGTGAACTCAAGTCCGAACCGACGTCCAGTGTGGACAAGCTGCTAGGGCTCCACGGTTCCCCCCTGATGGGACGCCTCCCCCGCGTGCAGTCCAGCGCCAGCACTGACTCCGCGGTACACTCAATGTATACACACAGTGTATACAGCAGTCCGTCAGCCAGCCCCCGCCCCTCGCGCCACTACACCCCCTCCCTCTCCCGGAACAACAGCGACGCGTCACACTCCTCGTGCTACTCCTACAGCTCAGAATTTTCCCCCACTCACTCTCCAGTACAAAGTCGTCACCCCCACGTGGTGTACCGCGAGGCGGCCGTGTTCCCCGCCTCCCCCGCTCATGATGAGGACGCGGACGGAACCGACGACAGGCTGCATCATCACCAGGGGATCAGCCGCCAACAACTCATTAACAGTCCGTGTCCAATTTGCGGCGACAAAATCAGTGGCTTCCACTACGGGATATTTTCATGCGAGTCTTGCAAGGGCTTCTTCAAGCGGACGGTTCAAAATCGGAAGAACTACATGTGTCTGAGAGGCGGGAACTGTCCCGTCACCGTCGCCACCAGGAAGAAGTGCCCCGCGTGTAGATTCGATAAGTGTCTGGGATGCGGGATGAAACTCGAAGCTATAAGAGAGGACCGCACACGCGGCGGTCGGTCTACTTATCAATGTTCGTACACGCTGTCTGGCGCGGCCTCCACGGGCTCCTTACTATCAGCGCACGCGCCCGCAACGCTGAGACACGCCTCGAGTCTCACATGTGTGAACGGTCCGGGCTCCTACAACAGAGGCGAATCAAGCAACAGTCGACTCACCCCTGACATACCGCCGTTATTGCAGGAAATAATGGACGTGGAACATCTATGGCAGTACAACGAGTCCGAGCTGAGTCGTATGAGCAAGAGCTCGAGCAGTCCGTCCGCCAACCCCCTGTTAGCGGCCAGCGGCATCACGGCGCAGAACTCTAGCGCCGACTTCCTGGCCGACCTGTGCAATATAGCAGACCACAGATTATACAAGATCGTCAAGTGGTGCAAGAGTCTGCCGCTCTTTAAAAATATCTCCATCGACGATCAGATATGTCTGTTGATAAACAGCTGGTGCGAGTTACTGGTGTTGTCCTGTTGCTACAGAGGAGTCAGCACGCCAGGGGAGGTGCGGGTGGGGGGAGGCAGGGGAATAACGCTGCAGCAGAGCGCCAAGTATGGCCTAACTCCATGTATTGAACGTATGTTGAGTTTCACTGATCACTTGAGGAGGCTGCGTGTGGACCGCTACGAGTACGTCGCGCTCAAGTTTTTCATGCAAGTCGGAAAAGAAATGCTCAATCCAGCGAACAAGAGTAAGGACGGAGAGGGACCGAGCTTCAACCTCCTCATGGAACTGCTTCGAGGAGATCATTGA

Protein sequence:

>DPOGS213157-PA
MSSEGEAVKVEGGHISVTTISMSGPESSNGQFSYSSSGVRISVSSEPQDEDSTDAEISKIDFTQHQYEVNMRNKKKRSSGQCDQAKEQERPMSWEGELSDSEMVIDTSTNNVDENSSSLDLQSSRDSIDTLRNVSIKTEPLKTELFHTMEDQRVLDLKYTVPLQSHQRSLSMNRISVLTDSNSLLARRPSSPSHYDAHPEVQNLTIKKEQLSGGYYGPERQSTVRELKSEPTSSVDKLLGLHGSPLMGRLPRVQSSASTDSAVHSMYTHSVYSSPSASPRPSRHYTPSLSRNNSDASHSSCYSYSSEFSPTHSPVQSRHPHVVYREAAVFPASPAHDEDADGTDDRLHHHQGISRQQLINSPCPICGDKISGFHYGIFSCESCKGFFKRTVQNRKNYMCLRGGNCPVTVATRKKCPACRFDKCLGCGMKLEAIREDRTRGGRSTYQCSYTLSGAASTGSLLSAHAPATLRHASSLTCVNGPGSYNRGESSNSRLTPDIPPLLQEIMDVEHLWQYNESELSRMSKSSSSPSANPLLAASGITAQNSSADFLADLCNIADHRLYKIVKWCKSLPLFKNISIDDQICLLINSWCELLVLSCCYRGVSTPGEVRVGGGRGITLQQSAKYGLTPCIERMLSFTDHLRRLRVDRYEYVALKFFMQVGKEMLNPANKSKDGEGPSFNLLMELLRGDH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: