MonarchBase - Protein-coding gene

DPOGS204388
Transcript	DPOGS204388-TA	1557 bp
Protein	DPOGS204388-PA	518 aa
Genomic position	DPSCF300002 - 1528403-1535438
RNAseq coverage	119x (Rank: top 58%)

Annotation
*Heliconius*	HMEL007815	0.0	64.65%
*Bombyx*	BGIBMGA013003-TA	2e-135	46.97%
*Drosophila*	CG6142-PA	4e-159	49.42%
EBI UniRef50	UniRef50_Q9VBG8	6e-157	49.42%	CG6142 n=22 Tax=Neoptera RepID=Q9VBG8_DROME
NCBI RefSeq	XP_002016883.1	3e-161	51.76%	GL21830 [Drosophila persimilis]
NCBI nr blastp	gi\|195151913	5e-160	51.76%	GL21830 [Drosophila persimilis]
NCBI nr blastx	gi\|195151913	2e-157	51.76%	GL21830 [Drosophila persimilis]

Group
Gene Ontology	GO:0016614	3e-102	oxidoreductase activity, acting on CH-OH group of donors
	GO:0008812	3e-102	choline dehydrogenase activity
	GO:0050660	3e-102	flavin adenine dinucleotide binding
	GO:0055114	3e-102	oxidation-reduction process
	GO:0006066	3e-102	alcohol metabolic process
KEGG pathway	dme:Dmel_CG9518	6e-131
	K00108 (E1.1.99.1, betA, CHDH)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[1-515] IPR012132	3e-102	Glucose-methanol-choline oxidoreductase
	[5-243] IPR000172	2.5e-62	Glucose-methanol-choline oxidoreductase, N-terminal
	[359-503] IPR007867	1.6e-38	Glucose-methanol-choline oxidoreductase, C-terminal
Orthology group	MCL26249		Insect specific

Nucleotide sequence:

>DPOGS204388-TA
ATGAATTGGGGTTACGTATCTGAACCACAACAAAAGGCCTGTCGTAATTTGAGAGATCATGTTTGTTATATGCCTCGAGGCAAAGTTCTCGGGGGCAGCAGCGTACTTAACTTTTTAATATACCAAAGAGGTCATCCCGAAGATTATAACGATTGGGTCAGGATGGGTAACGAGGGTTGGAGCTACAATGAAGTCTTGCCATACTTTAAGAAATCCGAAAATATACATATAAAAGAACTTCTAAACTCCACTTATCATGGCAAAGGAGGTTATTTAGACATTGATTATTCTTCATTTTCAACGCCACTCAATGATGCATTCAAGAACGCTGGTCACGAACTCGGGTACGAATGGAATGACCCCAATGGAGAAAATGTAATCGGTTTTTCAAAACCTCAAGCGACAATAAGAAAAGGAAGACGGTGTAGCTCATCAAAAGCATTTTTAGAACCCGTAAGGTATAGAAGAAACCTAAAAGTATCTAAATTTTCCACAGCAACGAAAATATTAATCGACCCTCTTACGAAAAGAGCTAATGGAGTGGAATTTATAAAAAATAATAAAATAAAACGTATATACGCCCGTCGTGAGGTTGTACTTGCTGGTGGCACAATAGGGTCTGCCCAATTATTAATGCTATCGGGAGTGGGCCCTAAAGAACACTTAAGCGAACTTGGAATACAAACTATAGTCGACCTGCCTGTAGGCTACAACCTTCAAGACCATGTAACCTTTTCGGGTAATGCGTTTATTGTCAATACCACTGGACTCTGTGTAAACGATATGATAGCTGCATCTCCAGCATCAGCTGTGTCATATATGTTGGGAGGCGGTCCATTAACCATACCGGGGGGTGCCACCGGACTTGCCTTCATACAAACGGACTACGCAAAAGACATGAATGGAAGGCCCGATATAGAAATGGTGATGGGCGCTGGATCCCTGGCAGGAGATCTGCTCGGAATTATACGGTCTATGCTTGGTGTAACTGATGAATGGTACCGAGAAGTTTACGGTTCTCTCCCACTCAATGAGAGACAGCAGTCGTTCGCTTTGAACCCGGTTTTAATTCGACCTAGAAGCGTCGGCCGTATGAAACTTAGTTCATCAAACTTCACAGATCAACCAAGAATACAACCGAACTATTTTGAACATCCCGACGATTTACAAGCCATTAAGGAGGGAGTGAGATTTGCACAAAAAATTATACAAACAAAAGCGTTCCAACGATACGGGACGCGACTCCACAATACACCATTCCCAAATTGCCGACACTTGACCTTCGACTCGGACGAGTATTGGGAGTGCGCCATCGAACAGACCTCCATCACGCTAGATCACCTGGCCGGGACCTGCAAAATGGGGTCACAAGGAGACCCATCAGCGGTGGTGTCTCCGCGTTTACTGGTTCATGGAATTCATGGTCTGAGGATAGCTGACGCCTCCATAATGCCTCGCATACCAGCGTCCCATACACATGCACCCGTCGTCATGATAGCCGAAAAAGCTGCCGATATCATTAAGCAGGATTGGAAGCAACCAATTCAACAATTATGA

Protein sequence:

>DPOGS204388-PA
MNWGYVSEPQQKACRNLRDHVCYMPRGKVLGGSSVLNFLIYQRGHPEDYNDWVRMGNEGWSYNEVLPYFKKSENIHIKELLNSTYHGKGGYLDIDYSSFSTPLNDAFKNAGHELGYEWNDPNGENVIGFSKPQATIRKGRRCSSSKAFLEPVRYRRNLKVSKFSTATKILIDPLTKRANGVEFIKNNKIKRIYARREVVLAGGTIGSAQLLMLSGVGPKEHLSELGIQTIVDLPVGYNLQDHVTFSGNAFIVNTTGLCVNDMIAASPASAVSYMLGGGPLTIPGGATGLAFIQTDYAKDMNGRPDIEMVMGAGSLAGDLLGIIRSMLGVTDEWYREVYGSLPLNERQQSFALNPVLIRPRSVGRMKLSSSNFTDQPRIQPNYFEHPDDLQAIKEGVRFAQKIIQTKAFQRYGTRLHNTPFPNCRHLTFDSDEYWECAIEQTSITLDHLAGTCKMGSQGDPSAVVSPRLLVHGIHGLRIADASIMPRIPASHTHAPVVMIAEKAADIIKQDWKQPIQQL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: