MonarchBase - Protein-coding gene

DPOGS200543
Transcript	DPOGS200543-TA	1404 bp
Protein	DPOGS200543-PA	467 aa
Genomic position	DPSCF300119 - 113368-119190
RNAseq coverage	473x (Rank: top 26%)

Annotation
*Heliconius*	HMEL016865	2e-135	59.41%
*Bombyx*	BGIBMGA010783-TA	8e-116	80.40%
*Drosophila*	Hr96-PA	1e-88	50.79%
EBI UniRef50	UniRef50_D6X2K2	2e-112	49.68%	Hormone receptor in 96-like protein n=1 Tax=Tribolium castaneum RepID=D6X2K2_TRICA
NCBI RefSeq	XP_968487.1	5e-113	49.68%	PREDICTED: similar to nuclear receptor nhr-48 [Tribolium castaneum]
NCBI nr blastp	gi\|91093732	9e-112	49.68%	PREDICTED: similar to nuclear receptor nhr-48 [Tribolium castaneum]
NCBI nr blastx	gi\|91093732	3e-109	49.58%	PREDICTED: similar to nuclear receptor nhr-48 [Tribolium castaneum]

Group
Gene Ontology	GO:0003707	4.6e-40	steroid hormone receptor activity
	GO:0005634	4.6e-40	nucleus
	GO:0006355	4.6e-40	regulation of transcription, DNA-dependent
	GO:0043401	4.6e-40	steroid hormone mediated signaling pathway
	GO:0003700	4.6e-40	sequence-specific DNA binding transcription factor activity
	GO:0003677	2.3e-09	DNA binding
KEGG pathway
InterPro domain	[273-462] IPR008946	4.6e-40	Nuclear hormone receptor, ligand-binding
	[275-439] IPR000536	4.3e-17	Nuclear hormone receptor, ligand-binding, core
	[276-297] IPR001723	2.3e-09	Steroid hormone receptor
Orthology group	MCL15164		Insect specific

Nucleotide sequence:

>DPOGS200543-TA
ATGGTGAAGGAGTTTATTATGTCCGACGAGGACAAGGCGGAAAAGAGACGAAAAATAGAAGAAAACCGCGCCAAAAAGAGACAACTACAGGATTCGGATGACAGTGTGTCTAGTTCTAAGAATTTTAGACGTGATGTTGAGAGTCCTTACACCACACCCGTACAAGAGAGTACAATACAGTATGATGTTTTAAACAGTACAACATGCAGTCCTCACAGCTCAGCGGAATCCCCCTTGAGCACCGATGTAGATTCTATGCCAACACCAGCCTATGGCCGATATGTGCCGGTGCAGACAGAGCTATTCACAGTAAAGGGTTACCCACCAGAAGAGAAGACAAATCCAAACCAGAGATATTATGAGCCCCGGCAAGAACATTACATGTGTGACAGTATGGATGGCATATACGAACAAACCAAACAAAATAGTATAAGGTCGATCCTGACCAACGGCGAAGGTCTCCCTCATCACCAGGACACGGAGCACGTGTGCGAGGAGATGCCGTCCACCAGCAACCCTGAGGTTAACAAGGCCAGGGACATACTGCAAGACGTCGAGAGGATAGAGCCCAACTCTATGGAGTCAATACTGTGCGAGGCGATTAAGCTGGAGTTCGGGGCTTACTCTTCCGTCAACAGTTGTAGTGGATCATCCAGAGAATTGAATGAGGTGGAGAGAGCCAAGCTGAACGAGCTGATCGTCGCCAACAAAGCGCTCCACGCTCCCATAGACGACGACGTGTCACAACTGATCGGAGACGCGGCCACCGCCGGCCTCAAGGTCGGCGAAGGAAAACATGACCCTCGCCTCATAACGTTGGTCAACCTGACAGCCGTCGCCATACGGAGGCTCATCAAGATCGCCAAGAAGATCAACGCGTTCAAGAACATGTGCGAGGAGGACCAGGTGGCGCTCCTGAAGGGAGGCTGCATAGAGATGATGGTGTTGCGGAGCACCATGACCTACGACGGACAGAGGAACCAGTGGAAGCTGCCTCACAGTCACAAGCAGTACGGCAGCATCCAAACGGACGTGCTGAAGCTGGCCAAGGGGAACATCTACCGCAGCCACGAGGCCTTCATCAGCTCCTTCGAGCACAGGTGGCGCACCGACGAGAACATCATCCTCATCATGTCCGCCATACTGCTGTTCACGCCCGACCGGCCGCGCGTCGTGCACCGCGACGTCATCAAGTTGGAACAGAACTCGTACTACTACCTGCTCCGGCGCTACCTGGAGAGCTCGTTCGCGGGCTGCGAGGCGAAGGCCACGTTCCTCAAGCTGATCGCCAAGATCCTGGAGCTGAGGAAGCTGGCCGAGGAGGTGACGGGCGTCTACCTCGACGTGCACCCCTTGGAACCGCTGCTCGTGGAGATCTTTGACCTCAAACACCACGCGGCATGA

Protein sequence:

>DPOGS200543-PA
MVKEFIMSDEDKAEKRRKIEENRAKKRQLQDSDDSVSSSKNFRRDVESPYTTPVQESTIQYDVLNSTTCSPHSSAESPLSTDVDSMPTPAYGRYVPVQTELFTVKGYPPEEKTNPNQRYYEPRQEHYMCDSMDGIYEQTKQNSIRSILTNGEGLPHHQDTEHVCEEMPSTSNPEVNKARDILQDVERIEPNSMESILCEAIKLEFGAYSSVNSCSGSSRELNEVERAKLNELIVANKALHAPIDDDVSQLIGDAATAGLKVGEGKHDPRLITLVNLTAVAIRRLIKIAKKINAFKNMCEEDQVALLKGGCIEMMVLRSTMTYDGQRNQWKLPHSHKQYGSIQTDVLKLAKGNIYRSHEAFISSFEHRWRTDENIILIMSAILLFTPDRPRVVHRDVIKLEQNSYYYLLRRYLESSFAGCEAKATFLKLIAKILELRKLAEEVTGVYLDVHPLEPLLVEIFDLKHHAA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: