MonarchBase - Protein-coding gene

DPOGS209371
Transcript	DPOGS209371-TA	1860 bp
Protein	DPOGS209371-PA	619 aa
Genomic position	DPSCF300118 - 151251-153353
RNAseq coverage	64x (Rank: top 68%)

Annotation
*Heliconius*	HMEL013116	1e-111	38.53%
*Bombyx*	BGIBMGA005703-TA	0.0	66.67%
*Drosophila*	CG9509-PA	8e-102	34.24%
EBI UniRef50	UniRef50_Q7QFX9	1e-119	39.54%	AGAP003785-PA n=2 Tax=Culicidae RepID=Q7QFX9_ANOGA
NCBI RefSeq	XP_310335.3	2e-120	39.54%	AGAP003785-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158288468	5e-119	39.54%	AGAP003785-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158288468	1e-116	39.44%	AGAP003785-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016614	6e-156	oxidoreductase activity, acting on CH-OH group of donors
	GO:0008812	6e-156	choline dehydrogenase activity
	GO:0050660	6e-156	flavin adenine dinucleotide binding
	GO:0055114	6e-156	oxidation-reduction process
	GO:0006066	6e-156	alcohol metabolic process
KEGG pathway	dme:Dmel_CG9509	6e-100
	K00108 (E1.1.99.1, betA, CHDH)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[8-614] IPR012132	6e-156	Glucose-methanol-choline oxidoreductase
	[50-348] IPR000172	1.5e-64	Glucose-methanol-choline oxidoreductase, N-terminal
	[458-602] IPR007867	1.4e-41	Glucose-methanol-choline oxidoreductase, C-terminal
Orthology group	MCL25159		Lepidoptera specific

Nucleotide sequence:

>DPOGS209371-TA
ATGACGAGTCTAAGTCCATGTGTGCCTGCCACGTCACCGGCGGGAGCTGCTTTCACTGCTTTAATATCTTATATATCGACCCTCCAGTGTCTCATCACGGAACCCTGGCCGGAAGACCATAGCCATCGCGTTAAAGACGGTGATCAATTCGATTTCATTATTATCGGTTCCGGGACAGCTGGATCAATCTTAGCGAATCGTTTGACACAAGCTGATGATTGGAAGGTTTTACTCCTTGAGGCCGGCGACAATCCGCCTTTGGAGAGTATTATCCCGAATTTCTCCGGAGCGACACATAGGAGTGACCAGGTGTGGCAATATTATACGGAGAGAGATGAGATGTCGAATAGGGCCTGCGTTGATGGACGGTCTTTCTGGCCTCGAGGCAGGATGCTGGGTGGCACGGGATCAATCAATGGAATGCTGCACATGACGGGCAGTCCCGGGGACTATCAATCTTGGAACGTCGATGACGGTTGGGACTATCTTACCATAAAGAAATATTTTAGGAAAAGTGAAAAAATTATCGATCCCTATATTCTTAATAATCCAGAACTTTTAAATAATCACGGCACGAATGGGGAGTTTGTAGTTGATCAATTGAATTTCACACATACGGATATAGCTGATAAACTGACGGAGGCCTACTTGGAAATTGGTCTCGATTACTTGGATGACCTGAATGGACCAACTCAAATGGGTGTTGGTAAGATAAGGGGCGGTCATCACAAAGGGAAACGAGTGAGCACTGCAACTGCTTTTTTAAACGTAATCAAAGAACGTAAAAATTTATACATTCTCAAAAATACATTTGCTACAAAAATTATTTTTCAAGACTCTAAAGCAATTGGCGTAAAGGTTTCTTTGCCAGACAAGAAAACAGCGCAGTATTATACAACAAAAGAGATAATTGTGAGTGCTGGAACAATAAACACTCCAGTTTTACTCATGTCCTCTGGTATAGGACCAAAAGAACATTTGGAGAGTTTGGACATCAAAGTCGTTTCTGACTTACCAGTCGGCAAAAATCTGCAGGATCATGTTAGAATTCCAATACCGGTGAGGATTAATACAGGAGCGAAGGCAAAATCTCAAGATTATTGGCAAAAAGCCACACTGCAATACTTACTAGAGCAGTCAGGTCCACACTCAACTAACTATGATCAACCTAATATTAATGCTTTTCTATCAGTCACAGATCATAAGCAACTCCCGGATATACAAATCGATCATAATTATTTTGTTCCAAATACTTCCTACATATATTCTATGTGTAAAAATGTCATGAACTACAAGGATGAGATTTGCGAACAATTTGCTAAAATGAACGTTGAGAGTGAAATGATAATATTTTTTGTATCTCTATGCCGACCATTTTCAAAGGGTGAGATTTTATTGCGTTCAACTAATCCCTTCGATCATCCACGTATATATCCAAAATATTTCAGTGATCGACGAGACATGGATACATTCATAAAGGGTTTAAAAAAAGTTACGGAAATTGTGAACACAGAAGCATTAAGAAATGTAGACGCGAAGGTTGAAAGAATCTATTTTAAGGACTGTGATGATTTTAAATTTAAATCTGATGATTATTGGGAGTGTATGGCCAGGGCTTTGACGTACAATGTATATCATCCTGTGGGCACCTCGAAGATGGGCAAGCCTGGAGACGCTAGCAGTGTAGTGGATAGTAGGTTGAGGGTGTTAGGAGTGAAAAACTTGAGAGTCGTCGACGCTAGTATAATGCCAACTATAACAAGCGTTAATACTAACGCTCCGACCATGATGATCGCAGAAAGAGCTTCTGCGTTCATAAAACTGCAATATAAAAGCAAATACGCGAATGACGAGTTATAA

Protein sequence:

>DPOGS209371-PA
MTSLSPCVPATSPAGAAFTALISYISTLQCLITEPWPEDHSHRVKDGDQFDFIIIGSGTAGSILANRLTQADDWKVLLLEAGDNPPLESIIPNFSGATHRSDQVWQYYTERDEMSNRACVDGRSFWPRGRMLGGTGSINGMLHMTGSPGDYQSWNVDDGWDYLTIKKYFRKSEKIIDPYILNNPELLNNHGTNGEFVVDQLNFTHTDIADKLTEAYLEIGLDYLDDLNGPTQMGVGKIRGGHHKGKRVSTATAFLNVIKERKNLYILKNTFATKIIFQDSKAIGVKVSLPDKKTAQYYTTKEIIVSAGTINTPVLLMSSGIGPKEHLESLDIKVVSDLPVGKNLQDHVRIPIPVRINTGAKAKSQDYWQKATLQYLLEQSGPHSTNYDQPNINAFLSVTDHKQLPDIQIDHNYFVPNTSYIYSMCKNVMNYKDEICEQFAKMNVESEMIIFFVSLCRPFSKGEILLRSTNPFDHPRIYPKYFSDRRDMDTFIKGLKKVTEIVNTEALRNVDAKVERIYFKDCDDFKFKSDDYWECMARALTYNVYHPVGTSKMGKPGDASSVVDSRLRVLGVKNLRVVDASIMPTITSVNTNAPTMMIAERASAFIKLQYKSKYANDEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: