MonarchBase - Protein-coding gene

DPOGS212359
Transcript	DPOGS212359-TA	1164 bp
Protein	DPOGS212359-PA	387 aa
Genomic position	DPSCF300019 + 36118-37594
RNAseq coverage	269x (Rank: top 40%)

Annotation
*Heliconius*	HMEL005321	2e-07	28.44%
*Bombyx*	BGIBMGA012009-TA	2e-117	60.87%
*Drosophila*	CG17221-PA	6e-54	34.57%
EBI UniRef50	UniRef50_B0WEB2	1e-65	39.51%	Zinc binding dehydrogenase n=3 Tax=Culicidae RepID=B0WEB2_CULQU
NCBI RefSeq	XP_319942.4	2e-67	40.33%	AGAP009178-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158299942	4e-66	40.33%	AGAP009178-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158299942	1e-63	40.33%	AGAP009178-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0008270	1.1e-69	zinc ion binding
	GO:0055114	1.1e-69	oxidation-reduction process
	GO:0016491	1.1e-69	oxidoreductase activity
	GO:0005488	6.8e-08	binding
	GO:0016747	6.1e-06	transferase activity, transferring acyl groups other than amino-acyl groups
KEGG pathway	bat:BAS3306	2e-23
	K00001 (E1.1.1.1, adh)	maps->	Drug metabolism - cytochrome P450
			Glycolysis / Gluconeogenesis
			Fatty acid metabolism
			3-Chloroacrylic acid degradation
			Tyrosine metabolism
			Metabolism of xenobiotics by cytochrome P450
			1- and 2-Methylnaphthalene degradation
			Retinol metabolism
InterPro domain	[4-367] IPR002085	1.1e-69	Alcohol dehydrogenase superfamily, zinc-type
	[13-189] IPR011032	1.7e-29	GroES-like
	[189-246] IPR016040	6.8e-08	NAD(P)-binding domain
	[41-110] IPR013154	1.4e-06	Alcohol dehydrogenase GroES-like
	[24-363] IPR020843	6.1e-06	Polyketide synthase, enoylreductase
Orthology group	MCL14090		Single-copy universal gene

Nucleotide sequence:

>DPOGS212359-TA
ATGAATGTCGCGAGGGGAGCAGTGAGCGCGGGTCGCATGCGAGCCTGGCGGGTGCACGCCTACAGCGCCGGAACCGAGGAGTTGCGGCTGGAGAGCGCGCGCGTGCCGCCGCTGAGGGCTCCCGATCAGCTGCTTGTGCGAGTCCACACCGCCTCCATCAACCCACTGGACGTGGCCATGCTCGGCGGGTACGGTTCTCGGATACTGAACACGCTGCGGACGCTGGACGGCACCGACCTCGAGTTCCCGCTAGTGCCAGGGAGGGACTTCGCCGGCGAAGTCGTCGCAGCCGGTGCGAGTTGCCGGCTGCGGGTCGGCGACCGCGTGTGGGGTGTGGTCCCGCCGCACAGGCCGGGCTCGCATGCGGAGTACGTGACGGTGCGCGAGCGCTGGACCGGCCTTGCCCCGCTTGCTCTGTCCGACGAGGAGGCAGGCGGGGCGCTGTACGCGGCTCTGAGCGCGTGCGCGGCGCTCCGGGTTGGAGGCCTTCCGCCAGGGAGACGCGCCCGCCGTCCGCCGCGCGTGTTATTACTGGGACTGGGCGGGGTCGGACACGTGGCCCTTCAGCTGCTCGTGGACGCTGGCGCCGAGGTGATCGTTGGCTGCTCTGCGGACCTGTGTGAGCGCGCGACCTCGCTCGGTGCCGCGGCGGCGCTCGATCGGTCGGCGGCTGACTACGACCGCCTCCTCGAGGAGTCCGGCCCGTACGAGGTGATCGTGGACTGTGCGGGAGTGGGTGGCGCGGAGGCCGGTTCGCGGCGCTGGAGGTTCTCCCGGTTCGTGACCCTGAGCTCGCCGCTGCTCCGGCTTACGGACGCCCGCGGGCTGGTGGGCGGGGGATGTGCGGCGGCGGCCCAGCTAGTCGCCGATGGCCTGTCCGCGGCCCGGAGCGCGCCCGCACCGTCCTCCTGCCCGCCGCACGTCCGCTGGGCCTTCTTCGCTCCGTCCTCGGACGACATCGAGACGCTCCGTCGCCTCGCGGAGAGAGGCAGGCTGTCGGTGTGTGTGGAGCGCGTGTTCCCCTGGTGGGAGGGTGTGGCGGCGTACGAGCGCGCGGCTCGTGGCGGGGCGCGAGGGAAGCTCGTGCTGGACTTCACGCGCTCGCCACCCCCCGCTCTCGCCGCTCCCCCCGCCCCCGCCGACCGCACAGTGTCGTCGCGTTAG

Protein sequence:

>DPOGS212359-PA
MNVARGAVSAGRMRAWRVHAYSAGTEELRLESARVPPLRAPDQLLVRVHTASINPLDVAMLGGYGSRILNTLRTLDGTDLEFPLVPGRDFAGEVVAAGASCRLRVGDRVWGVVPPHRPGSHAEYVTVRERWTGLAPLALSDEEAGGALYAALSACAALRVGGLPPGRRARRPPRVLLLGLGGVGHVALQLLVDAGAEVIVGCSADLCERATSLGAAAALDRSAADYDRLLEESGPYEVIVDCAGVGGAEAGSRRWRFSRFVTLSSPLLRLTDARGLVGGGCAAAAQLVADGLSAARSAPAPSSCPPHVRWAFFAPSSDDIETLRRLAERGRLSVCVERVFPWWEGVAAYERAARGGARGKLVLDFTRSPPPALAAPPAPADRTVSSR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: