MonarchBase - Protein-coding gene

DPOGS214673
Transcript	DPOGS214673-TA	1446 bp
Protein	DPOGS214673-PA	481 aa
Genomic position	DPSCF300321 + 89256-96407
RNAseq coverage	811x (Rank: top 16%)

Annotation
*Heliconius*	HMEL010472	3e-112	97.46%
*Bombyx*	BGIBMGA001947-TA	1e-59	95.54%
*Drosophila*	Hnf4-PB	3e-146	74.16%
EBI UniRef50	UniRef50_P49866	8e-144	74.16%	Transcription factor HNF-4 homolog n=82 Tax=Metazoa RepID=HNF4_DROME
NCBI RefSeq	NP_001037474.1	0.0	95.00%	hepatocyte nuclear factor 4 isoform a [Bombyx mori]
NCBI nr blastp	gi\|90025357	0.0	82.30%	SXR-like nuclear receptor [Lymantria dispar]
NCBI nr blastx	gi\|90025357	0.0	85.58%	SXR-like nuclear receptor [Lymantria dispar]

Group
Gene Ontology	GO:0003707	2.6e-68	steroid hormone receptor activity
	GO:0005634	2.6e-68	nucleus
	GO:0006355	2.6e-68	regulation of transcription, DNA-dependent
	GO:0043401	2.6e-68	steroid hormone mediated signaling pathway
	GO:0003700	2.6e-68	sequence-specific DNA binding transcription factor activity
	GO:0008270	1.9e-38	zinc ion binding
	GO:0043565	1.9e-38	sequence-specific DNA binding
	GO:0003677	7.2e-26	DNA binding
	GO:0004879	1.9e-05	ligand-dependent nuclear receptor activity
	GO:0005496	1.9e-05	steroid binding
KEGG pathway
InterPro domain	[147-402] IPR008946	2.6e-68	Nuclear hormone receptor, ligand-binding
	[214-376] IPR000536	3.2e-47	Nuclear hormone receptor, ligand-binding, core
	[78-149] IPR001628	1.9e-38	Zinc finger, nuclear hormone receptor-type
	[77-146] IPR013088	5e-30	Zinc finger, NHR/GATA-type
	[142-152] IPR001723	7.2e-26	Steroid hormone receptor
Orthology group	MCL12590		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214673-TA
ATGCCAGTGCTCGGCGTCGGCATGGCTCAGGAAATCGGACTGCGCTACTGTCCCACTACTGATTACATTCTACCGGGGGGGTACTGGGAGAAGAACTCCGTCCAGTATAACATGACCTACCACAGGCAGCACGACGATGCACAGTGTAACAACACAGTGTCATACAACACAGATAGTGATATGCAGCTTGAAACGAGCAGTAGTGAGGCGAGTGCTAGCTCGACCGTGCTGTCCCAACACTGCGCTATATGTGGAGACCGAGCCACCGGCAAGCACTATGGAGCGTCCTCGTGCGACGGATGCAAGGGGTTCTTCAGACGTAGCGTCAGAAAAAACCATCTCTATACATGCAGGTTCAGCAGGAATTGTGTAGTTGACAAGGACAAACGAAATCAGTGCAGATATTGCAGACTAAGGAAGTGCTTTAAGGCCGGCATGAAGAAAGAGGCGGTCCAGAACGAACGTGATCGTATTAACTGCAGACGGCCGTCTTACGAGGAGCCGGCTCAGGCGAACGGACTGTCAGTCGTGTCGCTGTTGAACGCTGAACTACTCAGTAGGAAAGTCATTGACGAGACAAACAACGTAACAGACGCCGAGATAAACAACCGGAAGTTGGCTAAGATCAATGACGTGTGTGACTCCATCAAACAGCAACTACTCATTCTGGTGGAGTGGGCCAAGTACATACCCGCCTTCACGGAGCTGCACTTGGACGATCAGGTGGCGCTGCTGCGGGCCCACGCTGGCGAACACCTGCTGCTGGGTTGTGCTCGTCGGTCGCTCCACCTGCGAGACGTGCTGCTCCTGGGAAACAACTGCATCATCACCAAACACCATCTCGACGGCAGAATGGATATAGACATCAGCATGATCGGCATGAGGGTGATGGATGAGATCGTCAAACCGCTCCGGGAGATCGACATCGACGACACGGAGTTCGCCTGCCTTAAGGCCATCGTCTTCTTCGATCCGAACGCCAAGGGTCTCTCTCAACCGCAGAAGATCAAGCAACTCCGTTACCAGATCCAAATCAACCTGGAGGACTACATCAGCGACCGTCAATACGACGGGCGCGGGCGGTTCGGCGAACTGCTGCTGTGTCTGCCGCCGCTGCAGAGCATCACCTGGCAGATGATCGAGCAGATACAGTTCGCCAAACTGTTCGGAGTCGCGCACATCGACAGCCTGCTGCAGGAGATGCTGTTGGGAGGAGCATCAACAGAAGCGACGCTCGACGAGAGTTCAGCGGGCGGGGAGGGGACCGCGGGGGTCGGGGGCGACTCGGCGGCCGCTGGGGTCGCGGGTGGACACGCCTCGCCACCACTCGTGCCCCAACTGCCTCCCGGTGAACACGTGTTTGACGCGACCTTCAAACAGGAGCCCAACATGAGTCCAGAACATACAGCCCGAGTACTGAAGACCTCGGATATAACACTGTTATAG

Protein sequence:

>DPOGS214673-PA
MPVLGVGMAQEIGLRYCPTTDYILPGGYWEKNSVQYNMTYHRQHDDAQCNNTVSYNTDSDMQLETSSSEASASSTVLSQHCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHLYTCRFSRNCVVDKDKRNQCRYCRLRKCFKAGMKKEAVQNERDRINCRRPSYEEPAQANGLSVVSLLNAELLSRKVIDETNNVTDAEINNRKLAKINDVCDSIKQQLLILVEWAKYIPAFTELHLDDQVALLRAHAGEHLLLGCARRSLHLRDVLLLGNNCIITKHHLDGRMDIDISMIGMRVMDEIVKPLREIDIDDTEFACLKAIVFFDPNAKGLSQPQKIKQLRYQIQINLEDYISDRQYDGRGRFGELLLCLPPLQSITWQMIEQIQFAKLFGVAHIDSLLQEMLLGGASTEATLDESSAGGEGTAGVGGDSAAAGVAGGHASPPLVPQLPPGEHVFDATFKQEPNMSPEHTARVLKTSDITLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: