MonarchBase - Protein-coding gene

DPOGS201756
Transcript	DPOGS201756-TA	1050 bp
Protein	DPOGS201756-PA	349 aa
Genomic position	DPSCF300279 + 27461-30580
RNAseq coverage	1320x (Rank: top 10%)

Annotation
*Heliconius*	HMEL006713	0.0	92.55%
*Bombyx*	BGIBMGA002651-TA	0.0	91.98%
*Drosophila*	Sas-PA	2e-79	43.73%
EBI UniRef50	UniRef50_Q9NR45	1e-98	50.14%	Sialic acid synthase n=70 Tax=Coelomata RepID=SIAS_HUMAN
NCBI RefSeq	XP_973182.2	4e-103	53.78%	PREDICTED: similar to CG17754 CG17754-PC [Tribolium castaneum]
NCBI nr blastp	gi\|45592938	6e-103	53.13%	sialic acid synthase [Danio rerio]
NCBI nr blastx	gi\|189234957	2e-103	53.78%	PREDICTED: similar to CG17754 CG17754-PC [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	2.9e-102	metabolic process
	GO:0003824	2.9e-102	catalytic activity
	GO:0016051	8.1e-75	carbohydrate biosynthetic process
KEGG pathway	dre:322780	9e-104
	K05304 (NANS, SAS)	maps->	Amino sugar and nucleotide sugar metabolism
InterPro domain	[7-295] IPR013785	2.9e-102	Aldolase-type TIM barrel
	[38-275] IPR013132	8.1e-75	N-acetylneuraminic acid synthase, N-terminal
	[296-348] IPR006190	1.2e-08	Antifreeze-like/N-acetylneuraminic acid synthase C-terminal
Orthology group	MCL17079		Patchy

Nucleotide sequence:

>DPOGS201756-TA
ATGCTCGAAGTTAAGATAACAGAGGACATTAGAATAGGCGGTAAAAATCCTTGCTTCATTATAGCTGAAGTTGGACAAAATCACCAAGGTGACATTGAAGTAGCGAAAAAATTGATCAAAGCAGCAAAGGACGCGGGGGCTAACTGCGTTAAATTTCAAAAGACTTGTCTGAATGAAAAATTTACGAAAAAGTATTTGGAGAAGCCTTACGATAGCCCGAACTCTTGGGGGAAAACTTACGGTGAACATAAGAGACATTTAGAATTTTCGGAAAGTCAATACAGAGAATTGTTTAAATATGCTCAAGAGGTCGGAATACTCTTCACAGCTTCAGCAATGGACATGGTATCTTTCGACTTTCTGGTGAACATAAAAGTGCCTTTCATAAAAATCGGATCCGGTGACTCCAACAATTTATTATTCTTGAAATATGCCGCATCCAAAAAGATCCCTCTTATAATATCCACGGGCATGGTGGACAAGCAGGCAGTGAAAACTATATACGACATTATTGCTGCTCAACACAAACAATTCTGCTTGTTACATTGTATATCAGCGTACCCTGTGCCCTTCGAGGACTGTAATCTGACCGTCCTACAAGACTACAAGAACACTTTTGACATCCCGGTCGGATATTCTGGTCAAGAAGTTGGCACCGCCGTTGCTTTAGGTGCAATAGCACTGGGAGCTAAGGTCCTGGAGAAGCATATAACATTAGACAAAGGTCTCCGGGGCACCGACCACGTGTGTTCTTTAACACCGACAGAGTTCCAACAGCTGGTGCGCGATGTGCGAGTCATTGAGGCCTCGCTTGGTACACCCATTAAAAAAGTTGTTACTTCAGAAATTCCTTGCATCGATAAATTGCAAAAGTCGCTGGTGATGGGCTGCACTAAAAATAAAGGCGAGATTCTTTATCCGGGAGATGTAAAGATCAAAGTCGCTGAACCGAAAGGTCTGAACGCGTTGCACTTCGAGGACGTTATATATAAAACACTTGTCTACGATAAGAAGGAAGATGAACCACTCAACGAGGGAGATTTCTGTTGA

Protein sequence:

>DPOGS201756-PA
MLEVKITEDIRIGGKNPCFIIAEVGQNHQGDIEVAKKLIKAAKDAGANCVKFQKTCLNEKFTKKYLEKPYDSPNSWGKTYGEHKRHLEFSESQYRELFKYAQEVGILFTASAMDMVSFDFLVNIKVPFIKIGSGDSNNLLFLKYAASKKIPLIISTGMVDKQAVKTIYDIIAAQHKQFCLLHCISAYPVPFEDCNLTVLQDYKNTFDIPVGYSGQEVGTAVALGAIALGAKVLEKHITLDKGLRGTDHVCSLTPTEFQQLVRDVRVIEASLGTPIKKVVTSEIPCIDKLQKSLVMGCTKNKGEILYPGDVKIKVAEPKGLNALHFEDVIYKTLVYDKKEDEPLNEGDFC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: