MonarchBase - Protein-coding gene

DPOGS203997
Transcript	DPOGS203997-TA	1221 bp
Protein	DPOGS203997-PA	406 aa
Genomic position	DPSCF300005 + 1461325-1462545
RNAseq coverage	20x (Rank: top 79%)

Annotation
*Heliconius*	HMEL013864	0.0	89.16%
*Bombyx*	BGIBMGA002989-TA	0.0	77.78%
*Drosophila*	CG1970-PA	6e-152	60.05%
EBI UniRef50	UniRef50_O75306	1e-137	57.91%	NADH dehydrogenase [ubiquinone] iron-sulfur protein 2, mitochondrial n=824 Tax=cellular organisms RepID=NDUS2_HUMAN
NCBI RefSeq	XP_308864.3	1e-151	60.55%	AGAP006891-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158286683	2e-150	60.55%	AGAP006891-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158286683	7e-147	60.55%	AGAP006891-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016651	1.4e-157	oxidoreductase activity, acting on NADH or NADPH
	GO:0055114	1.4e-157	oxidation-reduction process
	GO:0051287	2.1e-104	NAD binding
	GO:0048038	2.1e-104	quinone binding
KEGG pathway	aga:AgaP_AGAP006891	3e-151
	K03935 (NDUFS2)	maps->	Huntington's disease
			Oxidative phosphorylation
			Alzheimer's disease
			Parkinson's disease
InterPro domain	[22-406] IPR010219	1.4e-157	NADH dehydrogenase I, subunit D
	[136-406] IPR001135	2.1e-104	NADH-quinone oxidoreductase, subunit D
Orthology group	MCL26564		Lepidoptera specific

Nucleotide sequence:

>DPOGS203997-TA
ATGGAGAAGTATTATAGGGTAATATATCATGGCAGAGTAAGACCGGTGGAGCGTAAATTACGAAACATGTGGATAAACTTTGGACCTCAACATCCTGCTGCACATGGAGTGCTTCGACTTATTTTGGAATTAGATGGCGAATTAGTTGTCAGAGCAGATCCTCATATTGGTTTTCTACACAGAGCTAGTGAAAAATTAATGGAACACAAACATTATACACAAAGTTTGCCATATGTTGATCGCTTTGATTATGTGTCAACCCTAGCAAATGAACAAGGATTTGCAATTGCTGTCGAAAGACTTCTTAACATAGAAGTTCCTCCGAGAGCTCAAGCTATAAGAGTATTGTGTAGTGAACTTTCTCGCATAGCTAATCATCTATTAAATATTTCTGGCACTATTCTTGATGCAGGAGGAATAACACCATTTTTTTGGATGTGTGAGGAGCGAGAGAAGATATATGAGTTATCTGAACGACTTTGTGGTGCTCGAATTCATTGTGCTTATGTCAGACCAGGAGGTGTATCCCAAGACATTCCTATAGGTTTCATGGATGATATACATGAGTTTTGTATGAAACTCGGTGAACGGTGTGACGAAACTGAAGATATCGCTACTGGTAATAGGTTGTATTACGCAAGAACTGCAGGGGTTGGCGTTGTTACTGCTCACGATGCTATATATCATGGCTTTAGTGGACCAATGCTTAGAAGTACAGGAGTTAAGTGGGATTTAAGAATTGCATTTCCTTACGATGGTTACGATCTTTATGACTTTGACGTTCCCATAGGCACTTTTGGGGACAGTTTTGATAGACATCTTCTCCGTTTAATGGAATTACGGCAATCAATTCGAATAATTAACCAAGTAATTGACACGATGCCAGAAGGCGAAGTTAGAACAGACGATTCTAAAGTTTCACCGCCATTGAGATCAGAAATGAAAACTTCTATGGAAGCGCTTATTCATCACTTTAAATTATGTAGCGAAGGCTACGTTGTTCCTCCAGGAGCAACCTATACTGGTGTTGAATGTCCTAAGGGAGAATTAGGTTTCTATATGGTTGGAGATGGTACTTCTAAGCCATATCGAGTTGGTATACGATCTTGTTCTTATAACCATCTAGCGGGCATTGCATTTATGGGTAAAGGTTTACTTCTCGCTGATATATCTATTCTTATTGCAACCATCGATATTGTGTTTGGAGATATCGACCGTTAA

Protein sequence:

>DPOGS203997-PA
MEKYYRVIYHGRVRPVERKLRNMWINFGPQHPAAHGVLRLILELDGELVVRADPHIGFLHRASEKLMEHKHYTQSLPYVDRFDYVSTLANEQGFAIAVERLLNIEVPPRAQAIRVLCSELSRIANHLLNISGTILDAGGITPFFWMCEEREKIYELSERLCGARIHCAYVRPGGVSQDIPIGFMDDIHEFCMKLGERCDETEDIATGNRLYYARTAGVGVVTAHDAIYHGFSGPMLRSTGVKWDLRIAFPYDGYDLYDFDVPIGTFGDSFDRHLLRLMELRQSIRIINQVIDTMPEGEVRTDDSKVSPPLRSEMKTSMEALIHHFKLCSEGYVVPPGATYTGVECPKGELGFYMVGDGTSKPYRVGIRSCSYNHLAGIAFMGKGLLLADISILIATIDIVFGDIDR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: