MonarchBase - Protein-coding gene

DPOGS209788
Transcript	DPOGS209788-TA	1419 bp
Protein	DPOGS209788-PA	472 aa
Genomic position	DPSCF300117 - 981622-983040
RNAseq coverage	382x (Rank: top 31%)

Annotation
*Heliconius*	HMEL009001	0.0	74.21%
*Bombyx*	BGIBMGA008014-TA	2e-178	64.94%
*Drosophila*	CG5694-PB	2e-44	31.27%
EBI UniRef50	UniRef50_UPI000206459B	3e-60	34.79%	UPI000206459B related cluster n=3 Tax=unknown RepID=UPI000206459B
NCBI RefSeq	XP_393488.3	5e-61	34.79%	PREDICTED: similar to CG5694-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|340710196	6e-62	38.08%	PREDICTED: hypothetical protein LOC100646816 [Bombus terrestris]
NCBI nr blastx	gi\|340710196	2e-61	37.09%	PREDICTED: hypothetical protein LOC100646816 [Bombus terrestris]

Group
KEGG pathway	hmg:100199903	3e-08
	K11831 (NRF1)	maps->	Huntington's disease
InterPro domain	[2-92] IPR019525	4e-08	Nuclear respiratory factor 1, NLS/DNA-binding, dimerisation domain
Orthology group	MCL16973		Insect specific

Nucleotide sequence:

>DPOGS209788-TA
ATGATTACCAATTTGCCGCTTCTTATTTGCAATGGTAATCCGACAGCTCTGGCGAAGCTGAATGCCGCCGAATTGGAAAAGTTTATAACGTTCATGGTGACATGTTCCTGGGGTCATGATACTGCTAAGGATATCCGGCAACCACCATGGTGGCCCAAGGATGTAAACTTTTCTCATCCCTTTGTTAAACCACCAGTTGTTCCCGACGATTGGGAGGCGAGACTGAAGAGATTGATCAAGAGATGTTATGAATATCATAAGAGTGCGTTTTTATTAGTGTTCTCAGCACAGCTTGCGCGATATCCGCCTCGACGACTCCGGTATGTTGACAATCGTGATCACACCACTTCCCTCTACTACAGACCCAGTGGTAGACTACTGGTGACGTTCCGAAATGAAAATCTGTGTTATGATAGAGACACTGTGGAGGAGACGAGCTATCACCTGAAATCCACTGATATTTATCTTTGTGATAATTGTGATAGTCATTTTGATAATTTGGAAGTTCTCAAAGCTCACGAGAGACTGTGTAACAATGAAGTAGTGGCAACTAGTTCGTGTAGTAGTGGTTTTTCAGATTTTCTATCAGCTCTGAAGTTGCAATCTATATCGGATGTTTCAGATAACAAACATCCACTATGTGTTGAAGTTGACTCGCGGCCACGGAATGCTAGAGGTGCATCTTATCTGGATAGAGGTCCTCCCTACCCATTCTCATCCCTTGCATATATGAAAAATGCAAAGATAAATGTACAAAGGGATACCACCTATTCTAGAGAAAGAATAGAGAGATATTGTTGTCCTACAACAATTATTAGTAAAAATGTAGGTAGCAAAAGTAAAAATCATCAATTTCCAGTAAGATATAGACGACCAATAGATTACTGGCACAGGAAGCATGTGTTCCCCAATCAAAGATACAAGAAAATACTTGATCTCAAAAGCCAGTTGTTGCTTTTAAAATGCAGGCCCGTTACTGTGAATGTTGAGAGAATGACAATGGAAAAAGTAGATGAATATATCGAAAACCTGCATAAGGAGTCCGAGAAACATAGCTTAGTGGACAAAGACATTGTGTTTGTTGATGGATTAGACTCTGAACAAATGGATGTAGACTGTAAGGTTGAGACTAAAACTAGTGATCCTCTCAAAAAGGTAGACTGTGACTGTGAAGTGATTGATCTGTGTTCGGACGATGAAACTTCCAGTACTAATGAGAACTGTGACCCTCGAGCTGGAGTGACTTGTGTGATGAGAGGTGGTGCGGTACTCAGGCGTACTGCCGCGACGCCTCATTCATTGCCCGCAGAGCCCTGCGGCGCTCGCCAGCGCCCTCTACCGTCTCTCATCCTACAGCCCCATCCAGTTATTTTAATAACTCACACTCTAAACAATTTACAGACTATAGCATTAGATTAA

Protein sequence:

>DPOGS209788-PA
MITNLPLLICNGNPTALAKLNAAELEKFITFMVTCSWGHDTAKDIRQPPWWPKDVNFSHPFVKPPVVPDDWEARLKRLIKRCYEYHKSAFLLVFSAQLARYPPRRLRYVDNRDHTTSLYYRPSGRLLVTFRNENLCYDRDTVEETSYHLKSTDIYLCDNCDSHFDNLEVLKAHERLCNNEVVATSSCSSGFSDFLSALKLQSISDVSDNKHPLCVEVDSRPRNARGASYLDRGPPYPFSSLAYMKNAKINVQRDTTYSRERIERYCCPTTIISKNVGSKSKNHQFPVRYRRPIDYWHRKHVFPNQRYKKILDLKSQLLLLKCRPVTVNVERMTMEKVDEYIENLHKESEKHSLVDKDIVFVDGLDSEQMDVDCKVETKTSDPLKKVDCDCEVIDLCSDDETSSTNENCDPRAGVTCVMRGGAVLRRTAATPHSLPAEPCGARQRPLPSLILQPHPVILITHTLNNLQTIALD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: