MonarchBase - Protein-coding gene

DPOGS214137
Transcript	DPOGS214137-TA	1401 bp
Protein	DPOGS214137-PA	466 aa
Genomic position	DPSCF300014 - 1260694-1274453
RNAseq coverage	1392x (Rank: top 9%)

Annotation
*Heliconius*	HMEL005004	0.0	93.92%
*Bombyx*	BGIBMGA006183-TA	2e-115	77.24%
*Drosophila*	usp-PA	4e-115	53.54%
EBI UniRef50	UniRef50_O76202	0.0	83.51%	Protein ultraspiracle homolog n=13 Tax=Ditrysia RepID=USP_CHOFU
NCBI RefSeq	NP_001037470.1	0.0	80.35%	protein ultraspiracle homolog [Bombyx mori]
NCBI nr blastp	gi\|18202151	0.0	83.51%	Ultraspiracle [Choristoneura fumiferana]
NCBI nr blastx	gi\|18202151	0.0	85.65%	Ultraspiracle [Choristoneura fumiferana]

Group
Gene Ontology	GO:0003707	1.6e-75	steroid hormone receptor activity
	GO:0005634	1.6e-75	nucleus
	GO:0006355	1.6e-75	regulation of transcription, DNA-dependent
	GO:0043401	1.6e-75	steroid hormone mediated signaling pathway
	GO:0003700	1.6e-75	sequence-specific DNA binding transcription factor activity
	GO:0008270	1.5e-37	zinc ion binding
	GO:0043565	1.5e-37	sequence-specific DNA binding
	GO:0003677	2.6e-29	DNA binding
	GO:0004879	4.1e-28	ligand-dependent nuclear receptor activity
	GO:0005496	4.1e-28	steroid binding
KEGG pathway
InterPro domain	[207-458] IPR008946	1.6e-75	Nuclear hormone receptor, ligand-binding
	[252-427] IPR000536	4.6e-46	Nuclear hormone receptor, ligand-binding, core
	[113-184] IPR001628	1.5e-37	Zinc finger, nuclear hormone receptor-type
	[111-206] IPR013088	4e-37	Zinc finger, NHR/GATA-type
	[177-187] IPR001723	2.6e-29	Steroid hormone receptor
	[184-197] IPR000003	4.1e-28	Retinoid X receptor
Orthology group	MCL10722		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214137-TA
ATGTCGAGCGTGGCGAAGAAAGATAAGCCGACAATGTCAGTGACGGCGCTTATCAACTGGGCCCGACCGGCGCCGCCGGGGCCTCAGCAGCAGTTGGCGCAGGCGGTGCCAGTCTCCTCGACGGCTCTCCTGCAGTCCCTAGGAACATCCTCGAACATTCCCAACGTCGACTGCTCTATCGACATGCAATGGCTGAACATAGAATCGGGGTTCATGTCCCCTATGTCTCCACCAGAGATGAAGCCGGACACAGCGATGCTGGACGGCATGAGGGAGGACGCCACCTCACCCTCGGCCATGAGGAACTATCCCCCGAATCACCCGCTCAGCGGATCCAAGCACCTCTGTTCCATCTGCGGAGACAGAGCATCGGGCAAACATTACGGCGTTTATAGCTGCGAAGGCTGTAAAGGATTCTTCAAGAGGACCGTCCGTAAAGATTTGACGTACGCGTGTCGCGAGGAGAGGAATTGTATAATAGACAAGCGTCAAAGGAATAGGTGCCAGTACTGCCGCTATCAGAAATGTCTGGCGTGCGGGATGAAGAGGGAGGCGGTGCAGGAGGAGAGGCAGAGGGCTGCAAGGGGTGCTGAGGACGTACATCCAAGCAGCTCAGTACAGGAGCTGTCAATCGAGCGTCTCCTTGAGATGGAATCTCTGGTGGCGGACCCTAACGAGGAGTTCCAATTCCTCCGCGTGGGTCCTGACAGTAACGTGCCACCGAGATACAGGGCTCCCGTCTCCAGCCTCTGTCAGATTGGTAATAAACAGATCGCTGCATTAGTAGTATGGGCTCGTGACATACCGCACTTCAGTCAGCTGGAGTTGGAAGACCAGGTCATACTGATCAAGGCCTCCTGGAACGAGCTCATGCTGTTCGCCATCGCCTGGAGGAGTATGGAGTACTTGGAAGATGAGAGAGAGAATCTAGACGGCACTCGGACAGCGCCACCGCCACAACTGATGTGTCTCATGCCAGGGATGACCCTCCATCGTAACTCAGCGCTTCAGGCCGGCGTTGGTCAGATCTTCGACCGCGTGCTCTCTGAACTCTCGCTGAAGATGAGGGCGCTGAGGATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCGTGCTGCTCAACCCCGACATAAAAGGCCTTAAAAACAGACAGGACGTGGACGTTCTACGAGAGAAGATGTTCTCCTGTTTGGACGAGTACTGTCGCCGCGCGCACAGTTCTGAGGAGGGTCGGTTCGCGTCTCTGTTGCTGCGGCTGCCGGCTCTTCGCTCCATCTCCCTCAAGAGCTTCGAGCACCTGTTCTTCTTCCATTTGATCGCCGAGGGCACCATCGGGACCTACATCAGGGACGCCCTCCGCAGCCACGCGCCCACCATAGACACCAACTCGATTATGTAG

Protein sequence:

>DPOGS214137-PA
MSSVAKKDKPTMSVTALINWARPAPPGPQQQLAQAVPVSSTALLQSLGTSSNIPNVDCSIDMQWLNIESGFMSPMSPPEMKPDTAMLDGMREDATSPSAMRNYPPNHPLSGSKHLCSICGDRASGKHYGVYSCEGCKGFFKRTVRKDLTYACREERNCIIDKRQRNRCQYCRYQKCLACGMKREAVQEERQRAARGAEDVHPSSSVQELSIERLLEMESLVADPNEEFQFLRVGPDSNVPPRYRAPVSSLCQIGNKQIAALVVWARDIPHFSQLELEDQVILIKASWNELMLFAIAWRSMEYLEDERENLDGTRTAPPPQLMCLMPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIVLLNPDIKGLKNRQDVDVLREKMFSCLDEYCRRAHSSEEGRFASLLLRLPALRSISLKSFEHLFFFHLIAEGTIGTYIRDALRSHAPTIDTNSIM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: