MonarchBase - Protein-coding gene

DPOGS201083
Transcript	DPOGS201083-TA	1401 bp
Protein	DPOGS201083-PA	466 aa
Genomic position	DPSCF300185 + 123217-131984
RNAseq coverage	125x (Rank: top 57%)

Annotation
*Heliconius*	HMEL004621	2e-147	90.07%
*Bombyx*	BGIBMGA001391-TA	2e-132	84.59%
*Drosophila*	svp-PA	6e-99	76.62%
EBI UniRef50	UniRef50_E3X805	2e-97	70.27%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3X805_ANODA
NCBI RefSeq	XP_001655965.1	6e-98	77.23%	coup transcription factor [Aedes aegypti]
NCBI nr blastp	gi\|312374364	5e-97	70.27%	hypothetical protein AND_16003 [Anopheles darlingi]
NCBI nr blastx	gi\|347968055	4e-94	71.16%	AGAP002544-PB [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005634	2.5e-46	nucleus
	GO:0003677	2.5e-46	DNA binding
	GO:0006355	2.5e-46	regulation of transcription, DNA-dependent
	GO:0004879	2.5e-46	ligand-dependent nuclear receptor activity
	GO:0003707	2.4e-43	steroid hormone receptor activity
	GO:0043401	2.4e-43	steroid hormone mediated signaling pathway
	GO:0003700	2.4e-43	sequence-specific DNA binding transcription factor activity
KEGG pathway
InterPro domain	[161-173] IPR003068	2.5e-46	Transcription factor COUP
	[195-347] IPR008946	2.4e-43	Nuclear hormone receptor, ligand-binding
	[224-347] IPR000536	4.8e-22	Nuclear hormone receptor, ligand-binding, core
	[238-259] IPR001723	5.5e-18	Steroid hormone receptor
Orthology group	MCL12044		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201083-TA
ATGTTTCGTACGATGCTGCAGGGCCGCTCGTTATGGTCCAAATTCTGGGAAAACTTAGCCTCACTATCCGCGTCTGACATTAAGATAAAATCACCTACGTGCCGACGCGTTCCCACGGCCGTCGCGAAAAACCCCCGACTCCGGCCAGTGGACAACCCTAGACGGGATCGATCGAAGACATTAATTAAAAAGGATGAAATAATAGTCCGGTTCCGATTGTTTATGGTGTATGGTCAAGCGTCCGACCCCCAGGACCTGCCGATACTGGTTCCGGGCGTCATCTTATCTGCTTTTGAATGGGAAATTGTGATATTTGTCGAAACCATACATCAATCGGAATGTTCCGAGACACCATGCAGCATGTTATGGCACGTCAAAATATTCACCTACAGGGGGTTATTTGAATGGTCGTTCCACTTGCCAGGACGAGAATCGAAGGTGGACCCCCGCGGTGCGGTCGGCGTGCACCTAACGAACCAGAGAGCTGTTCAGAGAGGTCGAGTGCCTCCGTCTCAGTCCGCCGGCCTGGCGCTGCCGGGGCAATTCGCCTTGACCAACGGTGATCCCGCCGCGGGCTTGAACAGTCACCCTTACCTCTCCTCGTACATCTCCCTGCTCCTTCGAGCGGAGCCCTACCCCACGCAGCCGGCCTCGAGGTACGGCCAATGCGTGCAGCCCACCAACGTCATGGGTATAGACAATATATGCGAACTAGCCGCCAGGTTGCTCTTCTCCGCCGTCGAGTGGGCGAGGAACATCCCCTTCTTCCCCGAACTGCAGGTCACGGACCAGGTCGCGCTCCTGCGACTGGTTTGGTCCGAGCTGTTCGTCCTCAACGCCTCCCAATGCTCGATGCCCCTCCACGTGGCGCCGCTGTTGGCCGCCGCGGGTCTACACGCGTCACCCATGGCCGCCGACCGCGTGGTGGCCTTCATGGACCACATACGGATCTTCCAGGAGCAGGTGGAGAAGCTGAAAGCGCTCCACGTGGACTCCGCGGAGTACTCCTGTCTGAAGGCCATCGTCCTCTTCACGACAGGTAAAATTTTGGACAGCTTATTCGGGGAGGCGAGGTTGCTGCTGTACAGAGTCGCCGGCGCGTTCGCTGCTATCACGAACCACGGGGAGCTCCTGGCGCTGGTCCGCACGCACTTGGACGCGTACGCCGAGGCGACCAGGGCTCCCCAGCCGCCCGCGCCGCCGCCTCCGTCCGCAGCCTCCTCGGGCTACTACTCCACGATGGAGACATCGCTCGGCGTCAACTCCTCCCTGTCCTACGGCAGCTTCCTGTCTCCGTCGCGTGTGCCGCCTCAGTATACGAGCAGTCCGCGTTTGGACGCGGGTACGTCATCGTTTAAGATATACGAGGGCAGCGGGAGCAGGGTTGACGCCAAGCGATGA

Protein sequence:

>DPOGS201083-PA
MFRTMLQGRSLWSKFWENLASLSASDIKIKSPTCRRVPTAVAKNPRLRPVDNPRRDRSKTLIKKDEIIVRFRLFMVYGQASDPQDLPILVPGVILSAFEWEIVIFVETIHQSECSETPCSMLWHVKIFTYRGLFEWSFHLPGRESKVDPRGAVGVHLTNQRAVQRGRVPPSQSAGLALPGQFALTNGDPAAGLNSHPYLSSYISLLLRAEPYPTQPASRYGQCVQPTNVMGIDNICELAARLLFSAVEWARNIPFFPELQVTDQVALLRLVWSELFVLNASQCSMPLHVAPLLAAAGLHASPMAADRVVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTTGKILDSLFGEARLLLYRVAGAFAAITNHGELLALVRTHLDAYAEATRAPQPPAPPPPSAASSGYYSTMETSLGVNSSLSYGSFLSPSRVPPQYTSSPRLDAGTSSFKIYEGSGSRVDAKR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: