MonarchBase - Protein-coding gene

DPOGS201995
Transcript	DPOGS201995-TA	1440 bp
Protein	DPOGS201995-PA	479 aa
Genomic position	DPSCF300060 + 204618-209107
RNAseq coverage	866x (Rank: top 15%)

Annotation
*Heliconius*	HMEL002628	0.0	74.00%
*Bombyx*	BGIBMGA010403-TA	0.0	84.55%
*Drosophila*	CG31075-PA	1e-172	62.45%
EBI UniRef50	UniRef50_Q7Q165	5e-169	57.46%	AGAP009944-PA n=3 Tax=Eukaryota RepID=Q7Q165_ANOGA
NCBI RefSeq	NP_001040198.1	0.0	84.55%	mitochondrial aldehyde dehydrogenase [Bombyx mori]
NCBI nr blastp	gi\|114051966	0.0	84.55%	mitochondrial aldehyde dehydrogenase [Bombyx mori]
NCBI nr blastx	gi\|114051966	0.0	84.55%	mitochondrial aldehyde dehydrogenase [Bombyx mori]

Group
Gene Ontology	GO:0008152	1.7e-178	metabolic process
	GO:0055114	1.7e-178	oxidation-reduction process
	GO:0016491	1.7e-178	oxidoreductase activity
	GO:0016620	3.8e-69	oxidoreductase activity, acting on the aldehyde or oxo group of donors, NAD or NADP as acceptor
KEGG pathway	tca:659438	0.0
	K00128 (E1.2.1.3)	maps->	1,2-Dichloroethane degradation
			Arginine and proline metabolism
			Glycolysis / Gluconeogenesis
			Propanoate metabolism
			Limonene and pinene degradation
			Tryptophan metabolism
			Lysine degradation
			Valine, leucine and isoleucine degradation
			Pyruvate metabolism
			beta-Alanine metabolism
			Fatty acid metabolism
			3-Chloroacrylic acid degradation
			Glycerolipid metabolism
			Ascorbate and aldarate metabolism
			Histidine metabolism
InterPro domain	[8-469] IPR015590	1.7e-178	Aldehyde dehydrogenase domain
	[1-478] IPR016161	2.1e-176	Aldehyde/histidinol dehydrogenase
	[1-259] IPR016162	5.6e-106	Aldehyde dehydrogenase, N-terminal
	[260-444] IPR016163	3.8e-69	Aldehyde dehydrogenase, C-terminal
Orthology group	MCL10890		Insect specific

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS201995-TA
CAGTTATTCATTAACAATAAATGGGTAGATGCTGTGAGTAAAAAAACTTTTCCCACCATAAACCCACAAGATGAAACTGTTATCGCCAATGTTGCCGAAGGAGACAAGGCTGACATAGACATAGCAGTGGAAGCAGCTCGTAAAGCATTTCACAGATATTCAAAATGGCGTACTATGGATGCATCCCAAAGAGGTTTGCTTATGTTAAAACTGGCAGAACTTATGGATTCCCAAGCAAAATATTTGGCAGAACTAGAGACTTTGGACTGCGGTAAACCTGTCAAGATAGCTGAAGAAGAGGTCCACTCTTCAGCTGGGGTATTGAGATATTATGCAGGAAAAGCTGACAAAATATTGGGCAACACTATACCGGCCGATGGTGAATGTTTGTCTATGACATTGAAAGAACCTGTTGGCGTGTGTGGACAGATTATTCCATGGAATTATCCCATACCAATGATATCATGGAAACTTGGACCAGCTCTGGCGGCTGGGTGTACAATAGTATTGAAGCCCGCGGAACAAACTCCACTAACTGCGCTAGCTGTGGCGGCGTTAGTGAAGGAGGCTGGCTTCCCGCCGGGCGTTGTAAATGTTGTTCCTGGATACGGTCCGACCGCAGGGGCAGCCCTAACGCACCACCCACACGTCGACAAGATAGCATTCACAGGCTCCACAGAGGTCGGAAAATTAATATTGGGTGCAGCGTCGGTTGCTAACCTTAAAAGAGTGACGTTGGAGTTGGGTGGAAAGAGCCCTCTGGTGGTGTTTAATGATGCTGATGTTGAGAAAGCTGCAAGAATAGCTCATGCAGCGGCCTTTGCTAATGGAGGGCAATGTTGTTGTGCTGGCACAAGGACCTACGTACAATCTGGGATATACGAGGCCTTCGTTAACAAGGCGGCAGAGATCGCCAACCAAAGGTCCGTCGGCAACCCTTATGATGAAGTAGATCAAGGACCTCAGATCGACCAAGAGATGTTCAGCAAAGTTCTTGGTTATATTGATTCCGGAAAGAATTCTGGGGCTAGATGTGTCGCTGGAGGGGATAGAATTGGTGATAAGGGATACTATATTAAACCTACAGTTTTTGCTGACGTTGAAGATGATATGAAAATAGCAAGGGAAGAGATATTTGGTCCAGTCCAGAGCATACTGAAGTTTGATACATTCGAGGAGGTGATTGATAGAGCCAATGACACTAACTATGGTCTGGGAGCTGGTGTTATAACAAACGATATTACTATTGCAATGAGCTTTGCAAGACACGTCCGTGCTGGATCTATATGGATTAATACCTATGACCATGTTACAAGTCAAACTCCGTTTGGTGGTTTCGGTGACTCTGGTATGGGCAGGGAACTAGGTGAAGATGGTATACTGCCTTATCTTGAAACTAAAACTATTACGTTAGCACTGCCTAAGCATCCACAATTCTAA

Protein sequence:

>DPOGS201995-PA
QLFINNKWVDAVSKKTFPTINPQDETVIANVAEGDKADIDIAVEAARKAFHRYSKWRTMDASQRGLLMLKLAELMDSQAKYLAELETLDCGKPVKIAEEEVHSSAGVLRYYAGKADKILGNTIPADGECLSMTLKEPVGVCGQIIPWNYPIPMISWKLGPALAAGCTIVLKPAEQTPLTALAVAALVKEAGFPPGVVNVVPGYGPTAGAALTHHPHVDKIAFTGSTEVGKLILGAASVANLKRVTLELGGKSPLVVFNDADVEKAARIAHAAAFANGGQCCCAGTRTYVQSGIYEAFVNKAAEIANQRSVGNPYDEVDQGPQIDQEMFSKVLGYIDSGKNSGARCVAGGDRIGDKGYYIKPTVFADVEDDMKIAREEIFGPVQSILKFDTFEEVIDRANDTNYGLGAGVITNDITIAMSFARHVRAGSIWINTYDHVTSQTPFGGFGDSGMGRELGEDGILPYLETKTITLALPKHPQF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: