MonarchBase - Protein-coding gene

DPOGS202485
Transcript	DPOGS202485-TA	2310 bp
Protein	DPOGS202485-PA	769 aa
Genomic position	DPSCF300463 - 39392-49120
RNAseq coverage	22x (Rank: top 78%)

Annotation
*Heliconius*	HMEL004252	0.0	64.23%
*Bombyx*	BGIBMGA013789-TA	0.0	66.60%
*Drosophila*	CG9518-PA	3e-122	41.86%
EBI UniRef50	UniRef50_E2BJK2	7e-151	50.84%	Glucose dehydrogenase [acceptor] n=9 Tax=Endopterygota RepID=E2BJK2_HARSA
NCBI RefSeq	XP_394222.2	8e-156	51.96%	PREDICTED: similar to CG9517-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|66499225	2e-154	51.96%	PREDICTED: glucose dehydrogenase [acceptor] [Apis mellifera]
NCBI nr blastx	gi\|66499225	4e-152	51.96%	PREDICTED: glucose dehydrogenase [acceptor] [Apis mellifera]

Group
Gene Ontology	GO:0016614	1.8e-60	oxidoreductase activity, acting on CH-OH group of donors
	GO:0050660	1.8e-60	flavin adenine dinucleotide binding
	GO:0055114	1.8e-60	oxidation-reduction process
KEGG pathway	dme:Dmel_CG9518	3e-120
	K00108 (E1.1.99.1, betA, CHDH)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[232-504] IPR000172	1.8e-60	Glucose-methanol-choline oxidoreductase, N-terminal
	[610-755] IPR007867	3.5e-32	Glucose-methanol-choline oxidoreductase, C-terminal
Orthology group	MCL10891		Insect specific

Nucleotide sequence:

>DPOGS202485-TA
ATGTATTTGTCTCTAGTTATGCGATTGTTTGGTGGAGTTAATTATAGCGTAAATTATCCCAGACGGAATCCATACTCGACTCTTCAATATACACATTCGTCGTCAATTGATAAAAATCCATTGCGCAATTCTCTGTCTGAATATTATCCCGGTCCATATCTGAACCCGGCGTATTCCCGATTAAATTACAATTCATATCCTCATGAAACACATTTTGATCGCAGTTTTAATTACAATCCTTTTCAACCATGGGACTCGATTGGTGGAGAGTCGAAAGTAGAAATAAAAAAAGAAAAGAACAAAGGAAAGGATGGAGGAAAGTCAAGAAGGAAAAGGAATGCTAAGGAATATGATTTTATTATTGTCGGGGCTGGATCGGCGGGCTGTGTGTTGGCGAATAGATTGTCAGAAGTCAAAAAATGGAGGGTGCTCTTGTTGGAAGCCGGTCCTGAAGAGCCAGACGTAACGATGGTGCCTTCATTAGCGACGATTCTAAGACAATCTTCTATTGACTGGCGGTATGAAACACAACCCGAACCCTTGACCTGTAGGTCTTATAGAAGCCGATCCTGTCCATGGACCAGAGGTAAAACAATGGGTGGTTCCAGTGCCATAAACTATTTAGTTTACATGAGAGGTAACAGATATGATTATGATAACTGGGCTAATTTAGGAAACCCTGGCTGGAGTTATAATGAGGTGCTCTTGTTGGAAGCCGGTCCTGAAGAGCCAGACGTAACGATGGTGCCTTCATTAGCGACGATTCTAAGACAATCTTCTATTGACTGGCGGTATGAAACACAACCCGAACCCTTGACCTGTAGGTCTTATAGAAGCCGATCCTGTCCATGGACCAGAGGTAAAACAATGGGTGGTTCCAGTGCCATAAACTATTTAGTTTACATGAGAGGTAACAGATATGATTATGATAACTGGGCTAATTTAGGAAACCCTGGCTGGAGTTATAATGAGTTGCTGCCTTACTTTAGAAAATCTGAAAACAACCGTGATGTTGAATCTTATGACAATTTCCTTCATGGAGTAGGGGGACCTATTACTGTGGAGAGATTTCCATATGTTGATATCAATACTGCTAAATTAGTAGCAGCATTTCAAGATAAAGGGCTTCCATTAATAGATTTGACGTCAGAAAATAACTTAGGTACAAATATAGGACTATCAACTTCCAGAGATGGGCGAAGGATGTCTATAAATGTGGCATATATCAAGCCCATACGTGATGTTAGACCAAACATTGATATAGTGGTCAACGCATTTGCTACTACGTTAATAATAGACCCCCAAACAAAAATGGTTCTTGGGGTTACATATATAAAGAATGGTGTTACATATAACGTTTTTGCAAAGAAAGAAGTAATAGTAAGTGCTGGGACAATAAATTCTCCAAAATTACTTATGCTTTCTGGGATCGGCCCAAAAGAGCATTTGCAAAGCTTGAATATACCAATAATATCGGAATTGGCAGTCGGCCAAAATTTACAAGATCACACAACCACTGACGGACTAACTATTGCTTTATCAAATAAGACATCTACCTTAGTGAGTACTGAGACACTCCTTAATGAAGTACAGAATTACCACCAACAGGACCCTAAAAAAGATGGACCTTTGGCGACAACTAATACTCTTAATGCCATTGCTTTTATCAAAACTAAATATGCGACTGTAAATGCACCAGATATACAATTTCATTTTGATGGAAGAAATGTTGAAGACTTTTACGCAGATCCTCAAACATATTTGGAAACCAACATTTGGCCTTTAGCTTTTTATAATGGTTTATCAGCAAGACCACTTCTGCTTACCCCCAAAAGTAGGGGAGTTATTTTACTAAACCATACTGATCCTATCTTTGGCACACCTTTAATATACCCACGCTTTTTCACAGTCAAGGAAGACTTAGATGCGTTAATCGAAGGATTACGTTTTGCTGTAAGTTTAGAGGAAACTGAAACATTTAAAAGCATTGGTGCACATTTTGTTAGAGTTCCTGTTAAGAATTGTGAAAATCATATTTGGGGTTCTTATAATTATTTTGCGTGTTTACTTATTGAGTATACTTCAACAATTTACCATCCAGTTGGTACTTGTAAGATGGGTCCCGCTTGGGACAAAGATGCTGTTGTTGACTCAAGATTGCGAGTGTATGGGGTTAAACGATTAAGAGTAATTGACGCATCCATAATGCCAGAAATAGTTAGAGGGAACACAAATATCCCAACTGTCACCATAGCAGAACGTGCATCAGATATGATAAAGGAAGAATATTTGACAAAACAACATTTATAA

Protein sequence:

>DPOGS202485-PA
MYLSLVMRLFGGVNYSVNYPRRNPYSTLQYTHSSSIDKNPLRNSLSEYYPGPYLNPAYSRLNYNSYPHETHFDRSFNYNPFQPWDSIGGESKVEIKKEKNKGKDGGKSRRKRNAKEYDFIIVGAGSAGCVLANRLSEVKKWRVLLLEAGPEEPDVTMVPSLATILRQSSIDWRYETQPEPLTCRSYRSRSCPWTRGKTMGGSSAINYLVYMRGNRYDYDNWANLGNPGWSYNEVLLLEAGPEEPDVTMVPSLATILRQSSIDWRYETQPEPLTCRSYRSRSCPWTRGKTMGGSSAINYLVYMRGNRYDYDNWANLGNPGWSYNELLPYFRKSENNRDVESYDNFLHGVGGPITVERFPYVDINTAKLVAAFQDKGLPLIDLTSENNLGTNIGLSTSRDGRRMSINVAYIKPIRDVRPNIDIVVNAFATTLIIDPQTKMVLGVTYIKNGVTYNVFAKKEVIVSAGTINSPKLLMLSGIGPKEHLQSLNIPIISELAVGQNLQDHTTTDGLTIALSNKTSTLVSTETLLNEVQNYHQQDPKKDGPLATTNTLNAIAFIKTKYATVNAPDIQFHFDGRNVEDFYADPQTYLETNIWPLAFYNGLSARPLLLTPKSRGVILLNHTDPIFGTPLIYPRFFTVKEDLDALIEGLRFAVSLEETETFKSIGAHFVRVPVKNCENHIWGSYNYFACLLIEYTSTIYHPVGTCKMGPAWDKDAVVDSRLRVYGVKRLRVIDASIMPEIVRGNTNIPTVTIAERASDMIKEEYLTKQHL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: