MonarchBase - Protein-coding gene

DPOGS215935
Transcript	DPOGS215935-TA	1086 bp
Protein	DPOGS215935-PA	361 aa
Genomic position	DPSCF300308 - 73841-78371
RNAseq coverage	1029x (Rank: top 12%)

Annotation
*Heliconius*	HMEL022253	2e-143	93.28%
*Bombyx*	BGIBMGA001865-TA	3e-124	87.18%
*Drosophila*	Gale-PB	3e-113	53.76%
EBI UniRef50	UniRef50_E0VSA5	8e-146	69.16%	UDP-glucose 4-epimerase, putative n=1 Tax=Pediculus humanus corporis RepID=E0VSA5_PEDHC
NCBI RefSeq	XP_393006.1	9e-149	70.55%	PREDICTED: similar to Probable UDP-glucose 4-epimerase (Galactowaldenase) (UDP-galactose 4-epimerase) [Apis mellifera]
NCBI nr blastp	gi\|307197296	2e-148	71.51%	UDP-glucose 4-epimerase [Harpegnathos saltator]
NCBI nr blastx	gi\|307197296	7e-146	71.51%	UDP-glucose 4-epimerase [Harpegnathos saltator]

Group
Gene Ontology	GO:0006012	1.4e-168	galactose metabolic process
	GO:0003978	1.4e-168	UDP-glucose 4-epimerase activity
	GO:0005488	5.1e-69	binding
	GO:0044237	4.6e-55	cellular metabolic process
	GO:0003824	4.6e-55	catalytic activity
	GO:0050662	4.6e-55	coenzyme binding
	GO:0005975	1.1e-05	carbohydrate metabolic process
	GO:0016857	1.1e-05	racemase and epimerase activity, acting on carbohydrates and derivatives
KEGG pathway	ame:409499	3e-148
	K01784 (galE, GALE)	maps->	Galactose metabolism
			Amino sugar and nucleotide sugar metabolism
InterPro domain	[5-352] IPR005886	1.4e-168	UDP-glucose 4-epimerase
	[5-192] IPR016040	5.1e-69	NAD(P)-binding domain
	[7-272] IPR001509	4.6e-55	NAD-dependent epimerase/dehydratase
Orthology group	MCL17525		Insect specific

Nucleotide sequence:

>DPOGS215935-TA
ATGCCACGCTTCAAGACGATCATGGTAACGGGAGGGGCTGGTTACATTGGAAGCCACTGTGTGGTAGATCTGCTTGAGGCGGGTTATGAAGTAGTTGCCATAGACAATTTCGCTAATGCCGTCGGCGACGAAGAAGGTTCTCCAGCATTACAAAGAGCTGAGGAGATAACTGGCAAGCAGATCACGTTCTACAAAGCCGACCTGTTAGACAAGCAGCAGATAAACAATATATTTGATAAGCATATAGTGGATTGTGTTATCCACTTTGCCGCCTTAAAGGCGGTTGGCGAGTCAATGCAACAGCCCCTACTCTACTACCAGAACAACCTCTTAGGAATGCTAAATTTATTAGAGGTCATGCGCTCTCACAACTGCTACCAAATGGTGTTTTCGTCTTCCTGTACCGTGTACGGCGAGCCGGATCAGCTCCCCATAACGGAGACACATCACACTGGCAACATTACCAACGTGTACGGCCGGACTAAATACTTCATAGAGGAAATGCTTAAGGACCTCAGTGCGGCCGATGAGAAATGGAACATTATCTCTCTAAGGTATTTCAATCCCGTGGGCGCTCATCCTTCCGGTCTAATCGGTGAAGATCCTACCAAAGAGTTCACAAATCTAATGCCTTTTATGGCGCAGGTGGCACTTGGAAAGAAACCTGTGCTCACTATTTTTGGCAATGATTACAATACCCCTGACGGAACTGGTATTCGGGATTACATCCACGTTATGGATTTGGCGGGAGGTCATGTGGCCGCTCTCAATCTCCTGAGTGAAAATCACGTGCGACTCAAGGTATTTAATCTAGGCACTGGTAAGGGCGTATCAGTGAAAGAGCTGGTGAATGTATTCGAACGTGTGACCGGAACAAACATTCCAGTAAAATATGTATCGAGGCGGCTTGGAGATATAACGGCTATGTGGGCGGACGCCACGCTCGCTAAAAACGAACTAGGATGGACGACCAAACGTACCGTTGAGGAAATGTGTACAGATTTTTGGAGATGGCAAACCATGAATCCTGATGGCTATCCCAAGAAGAATAAAACAACCGTCATTGTAGTCAATGGAAAAAGTTAA

Protein sequence:

>DPOGS215935-PA
MPRFKTIMVTGGAGYIGSHCVVDLLEAGYEVVAIDNFANAVGDEEGSPALQRAEEITGKQITFYKADLLDKQQINNIFDKHIVDCVIHFAALKAVGESMQQPLLYYQNNLLGMLNLLEVMRSHNCYQMVFSSSCTVYGEPDQLPITETHHTGNITNVYGRTKYFIEEMLKDLSAADEKWNIISLRYFNPVGAHPSGLIGEDPTKEFTNLMPFMAQVALGKKPVLTIFGNDYNTPDGTGIRDYIHVMDLAGGHVAALNLLSENHVRLKVFNLGTGKGVSVKELVNVFERVTGTNIPVKYVSRRLGDITAMWADATLAKNELGWTTKRTVEEMCTDFWRWQTMNPDGYPKKNKTTVIVVNGKS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: