MonarchBase - Protein-coding gene

DPOGS208887
Transcript	DPOGS208887-TA	1446 bp
Protein	DPOGS208887-PA	481 aa
Genomic position	DPSCF300009 - 1072194-1081770
RNAseq coverage	3563x (Rank: top 3%)

Annotation
*Heliconius*	HMEL002628	2e-146	57.17%
*Bombyx*	BGIBMGA002457-TA	0.0	68.72%
*Drosophila*	CG31075-PA	1e-147	54.51%
EBI UniRef50	UniRef50_Q7Q165	5e-151	54.37%	AGAP009944-PA n=3 Tax=Eukaryota RepID=Q7Q165_ANOGA
NCBI RefSeq	XP_001864975.1	1e-162	60.33%	aldehyde dehydrogenase [Culex quinquefasciatus]
NCBI nr blastp	gi\|170058564	2e-161	60.33%	aldehyde dehydrogenase [Culex quinquefasciatus]
NCBI nr blastx	gi\|114051966	1e-160	59.88%	mitochondrial aldehyde dehydrogenase [Bombyx mori]

Group
Gene Ontology	GO:0008152	5.4e-175	metabolic process
	GO:0055114	5.4e-175	oxidation-reduction process
	GO:0016491	5.4e-175	oxidoreductase activity
	GO:0016620	1.2e-73	oxidoreductase activity, acting on the aldehyde or oxo group of donors, NAD or NADP as acceptor
KEGG pathway	tca:659438	1e-156
	K00128 (E1.2.1.3)	maps->	1,2-Dichloroethane degradation
			Arginine and proline metabolism
			Glycolysis / Gluconeogenesis
			Propanoate metabolism
			Limonene and pinene degradation
			Tryptophan metabolism
			Lysine degradation
			Valine, leucine and isoleucine degradation
			Pyruvate metabolism
			beta-Alanine metabolism
			Fatty acid metabolism
			3-Chloroacrylic acid degradation
			Glycerolipid metabolism
			Ascorbate and aldarate metabolism
			Histidine metabolism
InterPro domain	[5-475] IPR016161	5.4e-175	Aldehyde/histidinol dehydrogenase
	[16-472] IPR015590	2.1e-172	Aldehyde dehydrogenase domain
	[7-261] IPR016162	6.5e-93	Aldehyde dehydrogenase, N-terminal
	[262-447] IPR016163	1.2e-73	Aldehyde dehydrogenase, C-terminal
Orthology group	MCL44364		Lepidoptera specific

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS208887-TA
ATGGCTCCGCAAATTAAATATACGAAAATTTTTATCAACAATTCCTGGGTAGACTCGGTCAGTGGAAAGACATTCCAAACTATAAATCCTCACGATGGATCAGTCAATGCCGAGGCAGATGTGGATGCAGCTGTCGGAGCAGCTAAAAGTGCATTCCACCGCAACTCTGAATGGCGTCTGATGGACCCGTCGGAAAGAGTGAAGCTTTTGAACAAATGGGCTGATCTCGTAAATCGGGATATAGATTACCTTATAAAATTGGAAACATTAGATAACGGTATCGTGGTACAAACCAATCAAAGATTTATGTCAGTGGCTGTTAATGCTATACGTTACAACGCCAGTTGGGCTGATAAGATTCAAGGAACTACGATACCCGTGGACGGTGAAGCGTTTTCCTACACACTGAAGCAACCAGTTGGTGTATGCGCTATAATCATACCATGGAATGCGCCGGTCTTGTTTTTCTGCAGTAAAGTATCAGCGGCTTTAGCTGCAGGCTGCACCGTAGTAGTGAAGCCGGCAGAACAGACTCCTTTAACAGCGCTGGCGCTGGCTTCTCTGGTCGCGGAGGCTGGGATTCCACCAGGTGTTGTGAATGTGGTGCCTGGGTATGGGGAGACAGCAGGAGCGGCTCTAACACATCACCCTGATGTCGCACATATATCGTTCACGGGATCTTTACAGGTGGGTAAGATAATCCAACAGGCGGCAGGCGCCAACAATCTCAAGCGTGTCCAACTTGAGCTAGGCGGGAAAAGTCCTCTCGTTGTTATGAACGATGCAGACTTGGATGCTGCGGTGCAGTTTGCTGCTCTCGGGGTTTTTACCAATCAAGGACAAATGTGTATAGCTGCTTCCCGTCTTTTTGTGCAATCAGGAATTTACGACGAATTTGTTAAAAGAGCTTCCGAATTTGCAAAGAGTCTTGTTGTTGGTAAACCACTAGACCTCAAAACACAGCACGGTCCTCAGATTGATGAAAACTTAATGAATAGGGTGTTAGGTTACATCGAAAAAGGAGTATCCGAAGGTGCAAAGCTTTTGACTGGCGGAAAAAGAATTGGAAAAACTGGTTATTATGTTGAGCCTACCGTCTTTTCTGATGTCACGGATGATATGACCATCGCTGTAGAAGAAATTTTCGGTCCGGTCCAAAACATCTTAAAGTTCGAAACATTTGAAGAAGTTATTGAACGTGCTAACGCTACCAACTATGGTTTGGCGGCTGGGATATTTACAAGCTCTGTCGAAACTGCTCTACAGTTTAGCAAACATATTGAAGCAGGAATTGTTTGGGTGAATACTTATTTACATTTTGGAAGTCAGCTACCATTCGGTGGTTTCAAGGACTCCGGGATTGGCAGAGAAAATGGACCCAACGGAGTGGAAGCTTACTTGGAACTCAAAACAGTAATAATGAAACTTTCGAAGAAGTTGCAATAA

Protein sequence:

>DPOGS208887-PA
MAPQIKYTKIFINNSWVDSVSGKTFQTINPHDGSVNAEADVDAAVGAAKSAFHRNSEWRLMDPSERVKLLNKWADLVNRDIDYLIKLETLDNGIVVQTNQRFMSVAVNAIRYNASWADKIQGTTIPVDGEAFSYTLKQPVGVCAIIIPWNAPVLFFCSKVSAALAAGCTVVVKPAEQTPLTALALASLVAEAGIPPGVVNVVPGYGETAGAALTHHPDVAHISFTGSLQVGKIIQQAAGANNLKRVQLELGGKSPLVVMNDADLDAAVQFAALGVFTNQGQMCIAASRLFVQSGIYDEFVKRASEFAKSLVVGKPLDLKTQHGPQIDENLMNRVLGYIEKGVSEGAKLLTGGKRIGKTGYYVEPTVFSDVTDDMTIAVEEIFGPVQNILKFETFEEVIERANATNYGLAAGIFTSSVETALQFSKHIEAGIVWVNTYLHFGSQLPFGGFKDSGIGRENGPNGVEAYLELKTVIMKLSKKLQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: