MonarchBase - Protein-coding gene

DPOGS206374
Transcript	DPOGS206374-TA	1617 bp
Protein	DPOGS206374-PA	538 aa
Genomic position	DPSCF300192 - 196299-203335
RNAseq coverage	239x (Rank: top 43%)

Annotation
*Heliconius*	HMEL009016	1e-157	91.50%
*Bombyx*	BGIBMGA005775-TA	0.0	80.98%
*Drosophila*	ewg-PB	2e-106	67.43%
EBI UniRef50	UniRef50_E0VWB8	2e-175	65.19%	DNA-binding protein Ewg, putative n=3 Tax=Pediculus humanus corporis RepID=E0VWB8_PEDHC
NCBI RefSeq	XP_002430412.1	4e-176	65.19%	DNA-binding protein Ewg, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242019932	7e-175	65.19%	DNA-binding protein Ewg, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|380025841	1e-173	65.40%	PREDICTED: uncharacterized protein LOC100864370 [Apis florea]

Group
KEGG pathway	phu:Phum_PHUM477360	1e-175
	K11831 (NRF1)	maps->	Huntington's disease
InterPro domain	[79-300] IPR019525	4.8e-122	Nuclear respiratory factor 1, NLS/DNA-binding, dimerisation domain
	[449-516] IPR019526	1.5e-09	Nuclear respiratory factor-1, activation binding domain
Orthology group	MCL13294		Single-copy universal gene

Nucleotide sequence:

>DPOGS206374-TA
ATGGCTCTGGACAGTCAGGGGGACTCCGACTACGGCAACATGAACTCAGCAGTGAGCACGGAGTCCATGGACATGGCAGAGGAGGAGATGTCACAGGTGGAGGGTTGTGGTCTGAGCGCCTCCGAGGATGAGGACGAGTGTGCCTCGTCTCCGGCCGGCTCAGCCTACGACGACGCCGGTGACGTCATCAAGAGCGCCATGAGCGACGAGGTCACCAAGCAGTTAGCGGCCGCAGGCCCAGTAGGCATGGCGGCGGCGGCTGCGATCGCCTCCTCTAAGAAACGCAAGAGACCGCATTCCTTCGAAACAAACCCCTCCGTGAGGAAGAGACACCAGAACAGACTGCTGAGAAAGCTTAGACAAACGATCGAGGAGTTCGCGACCCGCGTGGGTCAGCAGGCGGTGGTGCTGGTGGCGACCCCCGGCAAGCCGAACACCTCCTACAGGGTGTTCGGAGCCAAGCCGCTGGAGGACGTTGTGCGGAACCTGCGCTGTATGATCATGGAGGAACTCGAGAACGCGCTGGCGCAGCAGTTCGGGCTGGGCGGGTGCGCGCAGGCGCCGCCGCCGCCGCAGGACGACCCGTCGCTGTTCGAGCTGCCGCCTCTCATCATAGACGGCATCCCCACGCCCGTGGAGAAGATGACGCAGGCGCAGCTGCGGGCCTTCATACCGCTCATGCTCAAGTACTCCATGGTACGCGGTAAGCCGGGTTGGGGCCGGGAGTCGACGCGGCCGCCCTGGTGGCCCAAAGACCTGCCCTGGGCCAACGTGAGGATGGACGCGCGCTCTGAGGACGAGAAACAGAAGATGTCGTGGACGCACGCCCTGCGGCAGATCGTGATCAACTGTTACAAGTATCACGGGCGAGAGGACCTGCTGCCCGCCTTCACCGAGGACGAGGACGACAAGCAGGCGCCGCAGACTTCGTCGTCGTGTGCTAGCGGCAGCACGAGTCGCTCGCAGCCGGCCGTGCTCGCCTCGCAGCAAGTCTGCATCGACCAGATGACGCTGGCCGACGTCGATGATGTTGTCGTTATACGTTATCGGTCTGACCACCAGATGTCGCAGTACGCGCCGGCCATGCTGCAGACGATCACCAACCCTGACGGAACGGTGTCTCTCATACAGGTGGATCCCAACAGTCCCATCATCACCTTACCTGATGGTACCACCGCACAAGTGATCCACAGCGGTTCTGAGGGAGCTGCGAGTGTGGTGCAGGCTCTGGAGGGCGAAGGCGCGGTCGCCGTAGACCTCAATGCTGTGGCAGAGGCCACGCTCAACCACGACGGACAGATCATACTCACCGGGGAGGACGGACACGGCTACCCGGTGTCGGTGTCGGGTGTGATCACCGTGCCCGTGTCAGCATCAGTGTACCAGTCTATGGTGGCCTCTATGCAGCAGCAGGACGGCGTCTGCGTCACTCCACTAGTACAGGTGGAGCAGGGCGGCGAGACGCTGGAGGCGCTCTCGATGGGTGGAGGGGTAGCCCAGGTGGTACTACAGGGGGGGGAACAGGTGTTGCAGGTGTTGAGCCTCAAGGACGCCTCCGTACTCACCAAGGCCATGCAAGTGAAGTCCGAACGTGACGCGGTGGTGGCGGACTCCTAG

Protein sequence:

>DPOGS206374-PA
MALDSQGDSDYGNMNSAVSTESMDMAEEEMSQVEGCGLSASEDEDECASSPAGSAYDDAGDVIKSAMSDEVTKQLAAAGPVGMAAAAAIASSKKRKRPHSFETNPSVRKRHQNRLLRKLRQTIEEFATRVGQQAVVLVATPGKPNTSYRVFGAKPLEDVVRNLRCMIMEELENALAQQFGLGGCAQAPPPPQDDPSLFELPPLIIDGIPTPVEKMTQAQLRAFIPLMLKYSMVRGKPGWGRESTRPPWWPKDLPWANVRMDARSEDEKQKMSWTHALRQIVINCYKYHGREDLLPAFTEDEDDKQAPQTSSSCASGSTSRSQPAVLASQQVCIDQMTLADVDDVVVIRYRSDHQMSQYAPAMLQTITNPDGTVSLIQVDPNSPIITLPDGTTAQVIHSGSEGAASVVQALEGEGAVAVDLNAVAEATLNHDGQIILTGEDGHGYPVSVSGVITVPVSASVYQSMVASMQQQDGVCVTPLVQVEQGGETLEALSMGGGVAQVVLQGGEQVLQVLSLKDASVLTKAMQVKSERDAVVADS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: