MonarchBase - Protein-coding gene

DPOGS207052
Transcript	DPOGS207052-TA	1518 bp
Protein	DPOGS207052-PA	505 aa
Genomic position	DPSCF300001 + 2144973-2148105
RNAseq coverage	28x (Rank: top 76%)

Annotation
*Heliconius*	HMEL010504	0.0	92.15%
*Bombyx*	BGIBMGA012996-TA	1e-171	69.59%
*Drosophila*	CG9503-PA	0.0	71.82%
EBI UniRef50	UniRef50_B3MXK3	2e-157	61.35%	GF19432 n=3 Tax=Sophophora RepID=B3MXK3_DROAN
NCBI RefSeq	XP_002009482.1	0.0	71.82%	GI15372 [Drosophila mojavensis]
NCBI nr blastp	gi\|195130080	0.0	71.82%	GI15372 [Drosophila mojavensis]
NCBI nr blastx	gi\|194767934	0.0	72.06%	GF19422 [Drosophila ananassae]

Group
Gene Ontology	GO:0016614	8.1e-108	oxidoreductase activity, acting on CH-OH group of donors
	GO:0008812	8.1e-108	choline dehydrogenase activity
	GO:0050660	8.1e-108	flavin adenine dinucleotide binding
	GO:0055114	8.1e-108	oxidation-reduction process
	GO:0006066	8.1e-108	alcohol metabolic process
KEGG pathway	dpo:Dpse_GA21849	2e-158
	K00108 (E1.1.99.1, betA, CHDH)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[15-499] IPR012132	8.1e-108	Glucose-methanol-choline oxidoreductase
	[60-355] IPR000172	6.5e-80	Glucose-methanol-choline oxidoreductase, N-terminal
	[431-486] IPR007867	2.5e-19	Glucose-methanol-choline oxidoreductase, C-terminal
Orthology group	MCL10024		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207052-TA
ATGAGCTCGATAGTGACAGCAGCTGCGGACGTGCTGTCCGGCACGGCCATCGCTGCTGGCACCCAGGTGGCATGGTTTATTCCAATGTTGGTAGCAGCGATAGCCTACTACCAGTTTGATCAAACGGATCCTGAAGGTCGTCCTGCTGATATTCCAAACTCAAGGTTGCTGCTCGAGTATGACTTCATAATTGTAGGAGCTGGATCAGCTGGAGCAGTAGTAGCAAACCGATTATCCGAAATTGGTCATTGGAAAGTGCTACTTTTGGAAGCAGGTGGCGATGAAACAGAAATATCTGATGTGCCTCTGCTAGCGGGATATTTACAACTTAGCAAACTGGACTGGAAGTACAAGACCGAGCCTCAAGGAACCAGTTGCTTGGCTATGGAGGGTGGTCGCTGCAATTGGCCGAGGGGCAAAGTTCTAGGAGGAAGCTCTGTGCTAAATTATATGCTTTATCTGAGAGGAAATAAAAAAGACTATGACACTTGGGAATCTCTAGGAAACAAAGGTTGGAGTTATAACGATGTCCTTTATTATTTTAAAAAGTCTGAAGATAACCAGAATCCTTATTTGGCCAAAACACCATATCATAGCACCGGAGGGTACCTAACGATATCGGAAGCGCCGTATCATACACCTCTCGTATCCAGTTTTATAGATGCTGGTCTGGAAATGGGTTATCTAAATAGAGACATAAACGGTGAAAACCAAACTGGTTTCATGGTAGCCCAAGGAACATTGAGAAGAGGCAGCCGGTGTTCAACCTCCAAGGCATTTTTACGGCCAGCTAAAGATCGAACAAATCTACATATATCGATAAATTCCTTCGTTACGAAAGTTATGATAGATCCCCGGACTAAAATCGCATTTGGCGTTGAATTTGTTAAAAATAAAATGGTTTATCGGATAAGAGCTCGAAAGGAAGTCATTCTTTCAGGCGGAACAATAAACTCTGCGCAGTTACTACTCTTATCAGGAATAGGTCCAGCAGATGAACTAGCTAAACATAGAATACCCTTGATACAAAACCTTCAAGTTGGAAAGAATCTTCAAGATCATATAGGTCTAGGAGGATTAGCATTTATGATAAATAAACCGATATCGATTGTTGAAAATAGACTACATACTGTCAGTACATTAATGGAATATGCTGTACTTGGAGAAGGACCACTAACTATAATGGGCGGTGTTGAAGGTCTAGCTTTTGTTAACACAAAATATGTGAACGCGTCAGATGACTTTCCTGATATCGAATTTCATTTTATATCAGGAGCTACAAATTCTGATGGAGGAGTGGGTACCGCAAAGATGGGCCCTTATTGGGATCCCGAAGCTGTAGTTGACCCCGAACTGAAAGTATACGGAGTCAAAGGTCTAAGGGTTATCGATGGAAGCATAATGCCTAATCTGGTTAGCGGCAACACTAACGCACCTATAATTATGATTGGAGAAAAAGGCAGTGATATGATCAAAAACTTCTGGCTGAAACGACGAATTTCTAGATATTATGCATGA

Protein sequence:

>DPOGS207052-PA
MSSIVTAAADVLSGTAIAAGTQVAWFIPMLVAAIAYYQFDQTDPEGRPADIPNSRLLLEYDFIIVGAGSAGAVVANRLSEIGHWKVLLLEAGGDETEISDVPLLAGYLQLSKLDWKYKTEPQGTSCLAMEGGRCNWPRGKVLGGSSVLNYMLYLRGNKKDYDTWESLGNKGWSYNDVLYYFKKSEDNQNPYLAKTPYHSTGGYLTISEAPYHTPLVSSFIDAGLEMGYLNRDINGENQTGFMVAQGTLRRGSRCSTSKAFLRPAKDRTNLHISINSFVTKVMIDPRTKIAFGVEFVKNKMVYRIRARKEVILSGGTINSAQLLLLSGIGPADELAKHRIPLIQNLQVGKNLQDHIGLGGLAFMINKPISIVENRLHTVSTLMEYAVLGEGPLTIMGGVEGLAFVNTKYVNASDDFPDIEFHFISGATNSDGGVGTAKMGPYWDPEAVVDPELKVYGVKGLRVIDGSIMPNLVSGNTNAPIIMIGEKGSDMIKNFWLKRRISRYYA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: