MonarchBase - Protein-coding gene

DPOGS201127
Transcript	DPOGS201127-TA	1572 bp
Protein	DPOGS201127-PA	523 aa
Genomic position	DPSCF300137 + 467657-478846
RNAseq coverage	83x (Rank: top 64%)

Annotation
*Heliconius*	HMEL005321	1e-124	55.50%
*Bombyx*	BGIBMGA013658-TA	4e-68	60.48%
*Drosophila*	CG17221-PA	3e-08	33.33%
EBI UniRef50	UniRef50_Q17DZ7	1e-30	27.56%	Alcohol dehydrogenase n=8 Tax=Culicidae RepID=Q17DZ7_AEDAE
NCBI RefSeq	XP_001602224.1	1e-41	30.77%	PREDICTED: similar to alcohol dehydrogenase [Nasonia vitripennis]
NCBI nr blastp	gi\|322795058	9e-38	27.14%	hypothetical protein SINV_13816 [Solenopsis invicta]
NCBI nr blastx	gi\|322795058	1e-34	27.37%	hypothetical protein SINV_13816 [Solenopsis invicta]

Group
Gene Ontology	GO:0008270	1.8e-33	zinc ion binding
	GO:0055114	1.8e-33	oxidation-reduction process
	GO:0016491	1.8e-33	oxidoreductase activity
KEGG pathway	bca:BCE_3521	5e-18
	K00001 (E1.1.1.1, adh)	maps->	Drug metabolism - cytochrome P450
			Glycolysis / Gluconeogenesis
			Fatty acid metabolism
			3-Chloroacrylic acid degradation
			Tyrosine metabolism
			Metabolism of xenobiotics by cytochrome P450
			1- and 2-Methylnaphthalene degradation
			Retinol metabolism
InterPro domain	[169-524] IPR002085	1.8e-33	Alcohol dehydrogenase superfamily, zinc-type
	[175-325] IPR011032	4.7e-24	GroES-like
	[200-262] IPR013154	6.5e-08	Alcohol dehydrogenase GroES-like
Orthology group	MCL17355		Insect specific

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS201127-TA
ATGGCCATCTTTACTAATGATGGTAGCCAAGAAGATGAAGATGTGGAAAATGATATTGGTAGCGAAGAAGAAACATTGAGTGAATCTGATATCGACCCTCCCCCGTTGTTTGTGGCTGAAATGGATGATTTCAAACTGAGAGCTGGTGAAAAAATTGGGGCTTTGCATGATGCCGCTCTGGGTGTAGCAAATAACAGCAAAATCAAAATCAATGATGCTATTGATAAAACCGTTGAGGCTGCAAAGAAGATCCGAGAGGTTGTGTTAGAGTTGTGGCAGCATGAGTTAGTGTTAGAGGGCCGGGCGCGAGCGGCGGCCTGGGCGGCCGAGGCGGTGCGCAGAATCAGAGAGGGCGCTCTGCCCCTCTCTCCGGCCGTCTTATACCAAGACCTGGTCGACCTGTTCAAGGATAGAGTATGGCGTCGCAGTATGGTGATCTTCGTATGTGGCGTTGCGGTGGGCGGGGGCGCGGGCCTAATGGTCGGGCTCCGGGCCGGGACCCGCGCTCCTCTCGGACCTCACGCTAGGGCGCTGCACACGCAAAGCGATCAGACCGTCCTCCTGGTAGAGGATGCTGTGTCTCCGGGAGTGTCAGCGGGGGAGGTGCTGGTCCGAGTGCAGTCGTTCAGTGTGTGTCCTGTAGACCGCGCCGTGCTGCGCGGCCGAGGTTCCGCCCTGCGAGCTCTGTTGGGAACCGGACCCGTCACTGTGGGACGAGGCTTCGCGGGAGTGGTGCTGGACGTGGGCCAGGGGGTCAACGACCTGGAACTGGGCGACGAGGTTTGGGGAGTCGTCAGCGAATGGAGCGGCGGCGGGGCCAGTGAACTACTGGCCATTAGGAGGAGCCGTGTGAGTCGCTCCCCGCGCGGCGTATCCCCTCCTCACGCGGCCGCCATCCCCTGGGGGGGCACGAGAGCGCTAAAGGCCCTCGGAAAGATTGATATGAAGGGAAAAAGGGTGTGCGTGGTGGGCGGCAACACGTCCGCCTCGTGCCTGTCGATACAGCTGCTGTGCGGGCGGGGAGCGAGGGTGTGCGTCGCTGAACACTCGAAAGCACATCCCACCATGAAAGCACTCGCCCTCGTCACTAACTCCACACACGTGTTTCCTGAAGGCGCGCACGAGTTCATCGACCTGTCGTCGGAGGCGTGGTGGGTGTCTTTGGAGAAGGCTACGTCGCGGGCCGCGCTCTGGGACTCACTCATCCTAGGAGACACGGCGCCCAACATCCCGCACAAGGGACTCGTCAAAGCCACGAGTCGCTTGCGTTCTATATCTCTGCGTCCGAGGCCTCTATTGTCGGACCGTGTCCCCTCCCCCGTGTGGCCGGCCTTCTGTGTAGCCTTCATGATGTACAGGCTGCTCAGGTGGTCAGTTGGTCTCGGCTGGCACACTGATTGGTTGGAAGATGGTAATCCGAGCGAACAGCTGGAGGTGTTGAGGGAAATGGTGGACGAGGGTCAGCTGGCTCCGGTACTAGACAAGGTATACTTACCTCACGACTTCGAAGCGGCGCTGGCACACGCGTGCAGTGATGAAGCGGTCGGGACAACCGTCATACGGTTCCCATGA

Protein sequence:

>DPOGS201127-PA
MAIFTNDGSQEDEDVENDIGSEEETLSESDIDPPPLFVAEMDDFKLRAGEKIGALHDAALGVANNSKIKINDAIDKTVEAAKKIREVVLELWQHELVLEGRARAAAWAAEAVRRIREGALPLSPAVLYQDLVDLFKDRVWRRSMVIFVCGVAVGGGAGLMVGLRAGTRAPLGPHARALHTQSDQTVLLVEDAVSPGVSAGEVLVRVQSFSVCPVDRAVLRGRGSALRALLGTGPVTVGRGFAGVVLDVGQGVNDLELGDEVWGVVSEWSGGGASELLAIRRSRVSRSPRGVSPPHAAAIPWGGTRALKALGKIDMKGKRVCVVGGNTSASCLSIQLLCGRGARVCVAEHSKAHPTMKALALVTNSTHVFPEGAHEFIDLSSEAWWVSLEKATSRAALWDSLILGDTAPNIPHKGLVKATSRLRSISLRPRPLLSDRVPSPVWPAFCVAFMMYRLLRWSVGLGWHTDWLEDGNPSEQLEVLREMVDEGQLAPVLDKVYLPHDFEAALAHACSDEAVGTTVIRFP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: