MonarchBase - Protein-coding gene

DPOGS206043
Transcript	DPOGS206043-TA	1551 bp
Protein	DPOGS206043-PA	516 aa
Genomic position	DPSCF300028 - 1274054-1284631
RNAseq coverage	270x (Rank: top 40%)

Annotation
*Heliconius*	HMEL008775	0.0	95.53%
*Bombyx*	BGIBMGA000716-TA	0.0	90.79%
*Drosophila*	ftz-f1-PB	5e-77	78.11%
EBI UniRef50	UniRef50_P49867	4e-160	88.89%	Nuclear hormone receptor FTZ-F1 n=8 Tax=Pancrustacea RepID=FTZF1_BOMMO
NCBI RefSeq	NP_001037528.2	8e-161	88.89%	nuclear hormone receptor FTZ-F1 [Bombyx mori]
NCBI nr blastp	gi\|17979670	0.0	92.63%	nuclear hormone receptor betaFTZ-F1 [Manduca sexta]
NCBI nr blastx	gi\|17979670	0.0	92.63%	nuclear hormone receptor betaFTZ-F1 [Manduca sexta]

Group
Gene Ontology	GO:0005634	3.3e-38	nucleus
	GO:0006355	3.3e-38	regulation of transcription, DNA-dependent
	GO:0043565	3.3e-38	sequence-specific DNA binding
	GO:0008270	3.3e-38	zinc ion binding
	GO:0003700	3.3e-38	sequence-specific DNA binding transcription factor activity
	GO:0003707	1.6e-18	steroid hormone receptor activity
	GO:0043401	1.6e-18	steroid hormone mediated signaling pathway
KEGG pathway
InterPro domain	[42-517] IPR016355	1.7e-130	Steroidogenic factor 1
	[95-166] IPR001628	3.3e-38	Zinc finger, nuclear hormone receptor-type
	[94-161] IPR013088	6.4e-31	Zinc finger, NHR/GATA-type
	[336-378] IPR008946	1.6e-18	Nuclear hormone receptor, ligand-binding
Orthology group	MCL12629		Single-copy universal gene

Nucleotide sequence:

>DPOGS206043-TA
ATGACGATGGACCAGCAGACAGGCCTCATGTCTCTAAACATGTCCCCGTTCGACCTCAGTCCGGGCCCCGAAGGGTCCGGCTCGGGCGGTGGACCCTCGGGTGCCTCCCAGCAGTATGTGCCGCAGGGCGCCGCTTATCAATGCACATCAGACCAACAGCCTTTCGGCTACGCAAACCTGGATGCTTCATATCTCTTTCCAACAGGTGCCGGAAGCGAATCTGGAGCTTATTTACCAGCAGCCGGGACTGTCTGCGATCAAACCGACACCAAGGACGTCATAGAAGAACTCTGTCCCGTTTGTGGGGACAAGGTGAGCGGTTACCATTACGGGTTGCTCACTTGCGAGTCCTGTAAAGGTTTCTTCAAGAGGACCGTTCAGAACAAGAAAGTATACACCTGCGTCGCGGAACGCGCCTGCCACATTGATAAAACACAGAGGAAACGATGCCCATTCTGCCGCTTCCAAAAGTGTCTCGACGTCGGCATGAAACTAGAGGCCGTACGTGCGGATCGCATGCGTGGCGGACGTAATAAGTTCGGCCCCATGTACAAACGCGACCGCGCCAGGAAACTGCAAATGATGAGACAAAGGCAAATCGCTGTTCAAACGCTGCGGGGATCGCTCGGTGACAGCGGGATCGTGCTCGGTTTTAATTCACCCTACGCGTCTGTGCCAGTCAAACAGGAAATACAGATACCGCAGGTGTCGTCGCTGACGTCATCGCCCGAGTCGTCGCCTGGGCCGGCTTTGCTGGCCGCTCAGCCGCAGGCCGCCCAGCCTCCGCCTCCTCCTGCACACGACAAGTGGGAGACTCACTCTCCTCACTCGGCGTCCCCAGACGCGTTCGCGTTCGACGCGCCCGCCACCACGGCCGCCACGCCCTCCAGCACGGCCGAGCCCACCAGCACGGAAACACTGCGAGTGTCGCCCATGATACGAGAATTCGTTCAGACCATCGACGACAGGGAGTGGCAAAATTCACTGTTCGGACTCTTGCAGAGCCAAACCTACAATCAGTGTGAAGTGGATCTGTTCGAGTTAATGTGCAAAGTGCTGGACCAAAACTTGTTCTCTCAAGTGGATTGGGCGAGAAACACCGTGTTCTTTAAGTATCTAAAGAGTCGCAGCCAGTCACGTGGTTTTGCGACGTTGCCGCTCCGCGCATCCCGCCGTCTCGCTCCGTCAGACAACTTCCACACCACAACTAGCAATTTTCATTTGTTCCAAATGACGCGACTTGTTTACGACCCATTCTCGGAATTAGGCCGGCCAACGAAACGTGTACATGAATCTCGCGTTTTATCACTACCGAAGAAAAATATACGAAACGACGATAATTCCGATTCCACTCCCATTATAGATATGTTTCGGCCCGTTCCCTACCGTACTCGGCGGGATAGACGCGTGATGTTGATGACCTACGCTTTCTCCAGACGGATGTGTTGTAAGCGTTCGGGACGGCAACGCTGTACTTTCCTTGCCGCACTTGACACATTGCCCGTGGCCGAGTTGCCGCGAGAAAGCACTTTTTACCCGCGTAACCGCTAA

Protein sequence:

>DPOGS206043-PA
MTMDQQTGLMSLNMSPFDLSPGPEGSGSGGGPSGASQQYVPQGAAYQCTSDQQPFGYANLDASYLFPTGAGSESGAYLPAAGTVCDQTDTKDVIEELCPVCGDKVSGYHYGLLTCESCKGFFKRTVQNKKVYTCVAERACHIDKTQRKRCPFCRFQKCLDVGMKLEAVRADRMRGGRNKFGPMYKRDRARKLQMMRQRQIAVQTLRGSLGDSGIVLGFNSPYASVPVKQEIQIPQVSSLTSSPESSPGPALLAAQPQAAQPPPPPAHDKWETHSPHSASPDAFAFDAPATTAATPSSTAEPTSTETLRVSPMIREFVQTIDDREWQNSLFGLLQSQTYNQCEVDLFELMCKVLDQNLFSQVDWARNTVFFKYLKSRSQSRGFATLPLRASRRLAPSDNFHTTTSNFHLFQMTRLVYDPFSELGRPTKRVHESRVLSLPKKNIRNDDNSDSTPIIDMFRPVPYRTRRDRRVMLMTYAFSRRMCCKRSGRQRCTFLAALDTLPVAELPRESTFYPRNR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: