MonarchBase - Protein-coding gene

DPOGS210834
Transcript	DPOGS210834-TA	660 bp
Protein	DPOGS210834-PA	219 aa
Genomic position	DPSCF300027 - 37441-39937
RNAseq coverage	1902x (Rank: top 7%)

Annotation
*Heliconius*	HMEL007977	2e-87	81.82%
*Bombyx*	BGIBMGA003924-TA	2e-120	91.86%
*Drosophila*	ND23-PA	9e-92	86.93%
EBI UniRef50	UniRef50_O00217	8e-87	84.00%	NADH dehydrogenase [ubiquinone] iron-sulfur protein 8, mitochondrial n=157 Tax=cellular organisms RepID=NDUS8_HUMAN
NCBI RefSeq	NP_001040316.1	1e-118	91.40%	NADH dehydrogenase ubiquinone Fe-S 8 [Bombyx mori]
NCBI nr blastp	gi\|114051372	2e-117	91.40%	NADH dehydrogenase ubiquinone Fe-S 8 [Bombyx mori]
NCBI nr blastx	gi\|114051372	7e-115	91.40%	NADH dehydrogenase ubiquinone Fe-S 8 [Bombyx mori]

Group
Gene Ontology	GO:0016020	2.4e-50	membrane
	GO:0016651	2.4e-50	oxidoreductase activity, acting on NADH or NADPH
	GO:0051539	2.4e-50	4 iron, 4 sulfur cluster binding
	GO:0055114	2.4e-50	oxidation-reduction process
	GO:0051536	1.4e-23	iron-sulfur cluster binding
	GO:0016491	1.4e-23	oxidoreductase activity
KEGG pathway	cqu:CpipJ_CPIJ018590	3e-91
	K03941 (NDUFS8)	maps->	Huntington's disease
			Oxidative phosphorylation
			Alzheimer's disease
			Parkinson's disease
InterPro domain	[76-197] IPR010226	2.4e-50	NADH-quinone oxidoreductase, chain I
	[78-196] IPR012285	1.4e-23	Fumarate reductase, C-terminal
Orthology group	MCL14963		Single-copy universal gene

Nucleotide sequence:

>DPOGS210834-TA
ATGTCTTTAGCAAAAATATTTTCAGTGTCTTCTCGAGTGAGGGCTAGTGGAGCTAGCAATGTTTTAGTACGTTATGCCAGTTCAGGTCAAGAAGGCAAAGTGGAAAAGGTGTATCCACCAAATGTACCTGGATATAAATATGTAAATGCTGAAGATCAGGATATGAGTTTCCGGGAAATGTCCAACAGAGCTGCGCAAACTCTGTTTTGGACTGAATTGGCAAGAGGTTTTGCTGTAACACTTGCACATGTATTTAAGGAACCGGCGACAATCAACTATCCTTTTGAAAAGGGTCCTTTGTCTCCAAGGTTCAGAGGTGAGCATGCATTGAGAAGATATCCATCTGGTGAAGAAAGATGCATTGCTTGTAAGCTGTGTGAAGCTATATGCCCAGCTCAGGCAATCACAATTGAAGCTGAAGAACGCAAAGATGGCTCACGTAGAACAACTAGATACGATATTGATATGACTAAATGCATCTACTGTGGATTCTGTCAGGAGGCTTGTCCAGTTGATGCGATCGTAGAAGGACCGAACTTTGAATTCTCGACCGAAACCCATGAAGAACTCCTTTACAATAAAGAGAAATTACTCTCAAACGGAGACAAATGGGAGAGTGAGATTGCAACTAACATCAGAGCCGATCACCTCTACCGTTAG

Protein sequence:

>DPOGS210834-PA
MSLAKIFSVSSRVRASGASNVLVRYASSGQEGKVEKVYPPNVPGYKYVNAEDQDMSFREMSNRAAQTLFWTELARGFAVTLAHVFKEPATINYPFEKGPLSPRFRGEHALRRYPSGEERCIACKLCEAICPAQAITIEAEERKDGSRRTTRYDIDMTKCIYCGFCQEACPVDAIVEGPNFEFSTETHEELLYNKEKLLSNGDKWESEIATNIRADHLYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: