MonarchBase - Protein-coding gene

DPOGS211084
Transcript	DPOGS211084-TA	1839 bp
Protein	DPOGS211084-PA	612 aa
Genomic position	DPSCF300007 - 1212322-1222665
RNAseq coverage	43x (Rank: top 72%)

Annotation
*Heliconius*	HMEL012492	0.0	93.95%
*Bombyx*	BGIBMGA002964-TA	0.0	89.34%
*Drosophila*	Hr38-PB	2e-147	64.21%
EBI UniRef50	UniRef50_D6WNH9	0.0	65.90%	Hormone receptor in 38-like protein n=3 Tax=Coelomata RepID=D6WNH9_TRICA
NCBI RefSeq	XP_001814072.1	0.0	64.90%	PREDICTED: similar to AGAP008334-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189237801	0.0	64.90%	PREDICTED: similar to AGAP008334-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189237801	0.0	65.84%	PREDICTED: similar to AGAP008334-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0003707	5.8e-65	steroid hormone receptor activity
	GO:0005634	5.8e-65	nucleus
	GO:0006355	5.8e-65	regulation of transcription, DNA-dependent
	GO:0043401	5.8e-65	steroid hormone mediated signaling pathway
	GO:0003700	5.8e-65	sequence-specific DNA binding transcription factor activity
	GO:0003677	7.4e-63	DNA binding
	GO:0004879	7.4e-63	ligand-dependent nuclear receptor activity
	GO:0008270	2.8e-37	zinc ion binding
	GO:0043565	2.8e-37	sequence-specific DNA binding
KEGG pathway
InterPro domain	[348-612] IPR008946	5.8e-65	Nuclear hormone receptor, ligand-binding
	[349-364] IPR003070	7.4e-63	Orphan nuclear receptor
	[274-345] IPR001628	2.8e-37	Zinc finger, nuclear hormone receptor-type
	[274-340] IPR013088	5e-31	Zinc finger, NHR/GATA-type
	[421-580] IPR000536	1.3e-20	Nuclear hormone receptor, ligand-binding, core
	[338-348] IPR001723	6.7e-15	Steroid hormone receptor
Orthology group	MCL11558		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211084-TA
ATGCGAGGTGCGTTGCTGACGCCCTCCAGCCAACATTGTGGCCTTAGACAATTTCTTACCACACGGCCGAGCGCCACTGAGCCGCGCTCGCCAAGCGCTTTCACGTCAAATTCCTCCAGCATGCTACTGCTGCAAACACACAGCAACTACGGTTCGTCCTTCACTGATTTACCAAGCCTGTTGCCACAGTATCAAGACGATTCAGCTGAAATCTTAGAAGAGAACTTGGACCCATTTCCTGACGTCGAATTCCATGCGCCTATTCCTTTTGAAATTAAAGCACAACGTACTACTCCAGTAAGTGAGACCCCGTCGCCTACCTTGGGCCCAGCGCTGCCTAGTTTCGAAGAAACATATTCGGTTCGCTATCCAAAACAAGAAATGGCGGAATTTGGTCTTAAAATGGACGAAGACTGTTACAATGTCAGTGCTTATTCGCACCCTGGACATGCATCGACACAATTATTATATCAATATCATCAGCCGACTTTACCCTATGTTCCTTCACCATATTATGCGCCAGCTCAGCCCTGTTCGCCGACATTCGACACAGGTGGAGTTACTACTGCCCAGGATTCTTATTCTTTACCGCCTTTCCCAAGTTCAGTTGACTTACACATATCTACAGAACAAGCTAACAGGCAAAGAAGATCATCATTGCCCGTTCAACGTTCTGAATCTAACAGTTCCAACGATAGTCCCAAACTGCATGGAAGTCGAATCCATTGCATGCAAGCTTCAGCGCCGAGTTCTGCGTCTAGTTCACCTGGAGGTGTACCACAAGACAATAATGCATCTCGAGCTGCGCCACCATCACCCAGCCAACTATGTGCTGTATGTGGAGATACTGCAGCGTGCCAACATTACGGCGTTCGAACCTGTGAAGGATGTAAAGGATTTTTCAAAAGAACTGTTCAGAAAGGATCAAAGTACGTGTGCTTAGCAGAAAAGTCGTGTCCGGTAGATAAAAGAAGAAGAAACAGATGTCAGTTTTGTCGTTTTCAAAAATGTCTTGCTGTTGGTATGGTGAAAGAAGTAGTTAGAACAGATTCTTTAAAGGGCAGACGGGGACGATTGCCTTCAAAACCAAAATGCCCTCAAGAATCTCCACCTAGTCCACCAATATCACTTATAACAGCACTAGTAAGAGCTCACGTAGACACATCTCCTGACTTTGCTAATCTTGATTACTCCCAGTATAGAGAACCAAATCCAATGGAACCTCCTATTTCGGATATAGAAGTAATCCAGCAATTCTATACTCTACTATCCACATCGATCGATATGATAAAAGTTTTTGCTGAAAAGGTGCCAGGCTACGGCGATTTGTGCCCAGAAGACAGAGAGCAATTATTTGCATCAGCGCGACTTGAATTATTTGTGCTCCGTTTAGCCTATCGCACTCGCCCTGATGATACTAAACTCACCTTCTGCAATGGCTTGGTTCTCGACAAACGACAATGTCAACGATCTTTTGGGGACTGGTTGCACGCTGTACTCGACTTCAGTAATACTCTGCACTCTATGGACATTGATATATCCACTTTCGCCTGTCTTTGTGCGTTGACATTAATTACAGAGAGACATGGCTTAAAAGAGCCGCATCGTGTTGAACAATTGCAAATGAAGATAATCGGATGTCTTCGGTCTCACATGCCAGGCGGGGGCGCGGCCAGTGCCGCCGGCGCGCCTCACTTCAGCCGCGTCCTTGGGGCTCTACCCGAACTGCGCTCGCTTTCCGTTCAGGGTCTTCAAAGAATCTTCTACCTGAAGCTTGAAGACTTAGTGCCAGCGCCGCCGCTGATTGAAAACATGTTTCGCGCCAGTTTACCTTTCTAG

Protein sequence:

>DPOGS211084-PA
MRGALLTPSSQHCGLRQFLTTRPSATEPRSPSAFTSNSSSMLLLQTHSNYGSSFTDLPSLLPQYQDDSAEILEENLDPFPDVEFHAPIPFEIKAQRTTPVSETPSPTLGPALPSFEETYSVRYPKQEMAEFGLKMDEDCYNVSAYSHPGHASTQLLYQYHQPTLPYVPSPYYAPAQPCSPTFDTGGVTTAQDSYSLPPFPSSVDLHISTEQANRQRRSSLPVQRSESNSSNDSPKLHGSRIHCMQASAPSSASSSPGGVPQDNNASRAAPPSPSQLCAVCGDTAACQHYGVRTCEGCKGFFKRTVQKGSKYVCLAEKSCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKCPQESPPSPPISLITALVRAHVDTSPDFANLDYSQYREPNPMEPPISDIEVIQQFYTLLSTSIDMIKVFAEKVPGYGDLCPEDREQLFASARLELFVLRLAYRTRPDDTKLTFCNGLVLDKRQCQRSFGDWLHAVLDFSNTLHSMDIDISTFACLCALTLITERHGLKEPHRVEQLQMKIIGCLRSHMPGGGAASAAGAPHFSRVLGALPELRSLSVQGLQRIFYLKLEDLVPAPPLIENMFRASLPF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: