MonarchBase - Protein-coding gene

DPOGS210580
Transcript	DPOGS210580-TA	1113 bp
Protein	DPOGS210580-PA	370 aa
Genomic position	DPSCF300168 - 583775-589407
RNAseq coverage	1288x (Rank: top 10%)

Annotation
*Heliconius*	HMEL008296	0.0	82.31%
*Bombyx*	BGIBMGA013631-TA	8e-179	80.16%
*Drosophila*	CG5854-PA	3e-98	47.01%
EBI UniRef50	UniRef50_G6DIV3	0.0	100.00%	UDP-galactose 4-epimerase n=10 Tax=Endopterygota RepID=G6DIV3_DANPL
NCBI RefSeq	NP_001040224.1	7e-176	80.22%	UDP-galactose 4-epimerase [Bombyx mori]
NCBI nr blastp	gi\|114052166	1e-174	80.22%	UDP-galactose 4-epimerase [Bombyx mori]
NCBI nr blastx	gi\|114052166	4e-169	80.22%	UDP-galactose 4-epimerase [Bombyx mori]

Group
Gene Ontology	GO:0005488	8e-27	binding
	GO:0044237	2e-18	cellular metabolic process
	GO:0003824	2e-18	catalytic activity
	GO:0050662	2e-18	coenzyme binding
KEGG pathway	tag:Tagg_1211	6e-09
	K01784 (galE, GALE)	maps->	Galactose metabolism
			Amino sugar and nucleotide sugar metabolism
InterPro domain	[218-265] IPR016040	8e-27	NAD(P)-binding domain
	[13-246] IPR001509	2e-18	NAD-dependent epimerase/dehydratase
Orthology group	MCL16019		Insect specific

Nucleotide sequence:

>DPOGS210580-TA
ATGTCGGATTCCACCGGTGATAATTCAAAATCTCGAGTTATAGTTTTAGGAGGGTGCGGCTTCATCGGTCGGAATCTGGTGGATTATTTAATTAGCAATGACTTAGTTAGTCACTTGCGTGTAGTGGATAAAACTCCTCCACAATTGGCCTTCCTGAATCCTACACACTCGAAGGCCTTCGAGGACCCCCGCGTTGAATACAAAAGCGCAAACCTCATAAATCCAGTATCATGCGCCAGTGCCCTCGAACCGTCCGAGCAACCCTGGTCCTTGGTGGTGAACTGCGCGGGCGAGACTCGCTTTGGTCAGACGGAAGCGGTCTACGCCGAGGGCATCCACAACCTCAGCGTCACAGTGGCCAAGCAATGTGCCCTCATGAAACTACGGCTCATTGAAATATCCAGCGGATGCATGTACAGCAGCGACAAGCCGCAGAAAGAGGACTGTCCCGTGGAACCGTGGACTGTGGAGGGTAGGATGAAGGCCAGAGTTGAAGAGGAGTTGAAGAACATGGATCTAGACTACACCATCATAAGACCAGCCATAGTATACGGAGTAGGAGATAGGAGGAGTCTCACGCCCCGTCTTCTATATGGTGGTATATACAAACACCTGGGAGAAACCATGAAGCTGTTATGGACAGCGGACCTCAAGATGAACACGGTCCACGTGTTAGACGTCTGTCGGGCCGTGTGGACCCTCGCCAGGAGAAACGACGCGATCAGACAGACATACAACCTGGTGGATGACGCCAACAGCACTCAAGGCAATCTCGCAGAGATCGTCTCGGAGATATTCAATATAAACCACGATTACTACGGAACTGCGATATCCACATTGGCTAAGAACGACATAGCCTCAGTAGCTGAAGAGGCGAACGACAAACACCTTACCGCGTGGGCGGATATCTGCCGGAAGTATTCGTTGGAGCACAGTCCCCTGGAACCGAGCGCTGGAGCTGAGCTATTACTGAACAAACAGCTGTGTCTGGACGGAAGCAAACTGAAGGAAATCATGACAATGGACGTGCCCGCGCCCACGGCCTCCGCCCTACTTGAGGTGCTGCAAGATTATGCCTCAATGAATCTATTCCCAAAGGAGCTTCTGATGTGA

Protein sequence:

>DPOGS210580-PA
MSDSTGDNSKSRVIVLGGCGFIGRNLVDYLISNDLVSHLRVVDKTPPQLAFLNPTHSKAFEDPRVEYKSANLINPVSCASALEPSEQPWSLVVNCAGETRFGQTEAVYAEGIHNLSVTVAKQCALMKLRLIEISSGCMYSSDKPQKEDCPVEPWTVEGRMKARVEEELKNMDLDYTIIRPAIVYGVGDRRSLTPRLLYGGIYKHLGETMKLLWTADLKMNTVHVLDVCRAVWTLARRNDAIRQTYNLVDDANSTQGNLAEIVSEIFNINHDYYGTAISTLAKNDIASVAEEANDKHLTAWADICRKYSLEHSPLEPSAGAELLLNKQLCLDGSKLKEIMTMDVPAPTASALLEVLQDYASMNLFPKELLM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: