MonarchBase - Protein-coding gene

DPOGS215041
Transcript	DPOGS215041-TA	1167 bp
Protein	DPOGS215041-PA	388 aa
Genomic position	DPSCF300208 - 495822-502459
RNAseq coverage	228x (Rank: top 44%)

Annotation
*Heliconius*	HMEL002013	1e-98	62.16%
*Bombyx*	BGIBMGA005670-TA	5e-45	65.52%
*Drosophila*	CG5288-PA	7e-22	24.50%
EBI UniRef50	UniRef50_E4X964	3e-95	50.55%	Whole genome shotgun assembly, reference scaffold set, scaffold scaffold_16 n=1 Tax=Oikopleura dioica RepID=E4X964_OIKDI
NCBI RefSeq	XP_001187174.1	7e-106	51.57%	PREDICTED: similar to galactokinase 1 [Strongylocentrotus purpuratus]
NCBI nr blastp	gi\|260831607	1e-105	51.69%	hypothetical protein BRAFLDRAFT_90953 [Branchiostoma floridae]
NCBI nr blastx	gi\|260831607	7e-102	51.70%	hypothetical protein BRAFLDRAFT_90953 [Branchiostoma floridae]

Group
Gene Ontology	GO:0046835	3.3e-140	carbohydrate phosphorylation
	GO:0005524	3.3e-140	ATP binding
	GO:0006012	3.3e-140	galactose metabolic process
	GO:0004335	3.3e-140	galactokinase activity
	GO:0008152	2.8e-39	metabolic process
	GO:0016301	2.8e-39	kinase activity
	GO:0016773	2.8e-39	phosphotransferase activity, alcohol group as acceptor
	GO:0005737	2.8e-39	cytoplasm
	GO:0016310	2.4e-10	phosphorylation
KEGG pathway	bfo:BRAFLDRAFT_90953	2e-106
	K00849 (galK)	maps->	Galactose metabolism
			Amino sugar and nucleotide sugar metabolism
InterPro domain	[6-387] IPR000705	3.3e-140	Galactokinase
	[32-209] IPR014721	1.1e-58	Ribosomal protein S5 domain 2-type fold, subgroup
	[12-213] IPR020568	1.5e-54	Ribosomal protein S5 domain 2-type fold
	[34-58] IPR006206	2.8e-39	Mevalonate/galactokinase
	[18-65] IPR019539	2.8e-19	Galactokinase galactose-binding domain
	[288-368] IPR013750	4.2e-15	GHMP kinase, C-terminal
	[125-190] IPR006204	2.4e-10	GHMP kinase
Orthology group	MCL15012		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215041-TA
ATGTCGGAAGCGGTCCCTAAAGGTGAAGAAGTTCTGCTTAAAGAGGCAGTCTCTAAGTTCGTCTCCACATACAATCGCAAGCCGCTAGCGGCAGCTGCTGCCCCTGGTAGGGTCAATCTCATTGGAGAGCACGTTGACTATTGTGAAGGATTCGTGCTACCTGTGGCGTTACCATTTTTCACTGTAGTGGTGGGTGCATACAATTCCACTGATGAGTGCATGGTGCTGTCAATCCTTGCCAGTGGACAAGAGGTCCAGACCAGCTTCTCTTCTACAGAATCATCTTCTTTGCAACCCGGGGAGCCAGGGTGGGCTAACTATGTAAAGGGTGTGCTGGCCAATTTTCCAGAAAAGGTGAAAGGTCTCGATGCGGTTATTGTATCAGACGTGCCAATGGGGTCCGGCGTCTCCAGCAGCGCTTCATTGGAAGTAGCATTCTTCACGTTCCTTGAGGACCTCACTAAGATCACGGTTGATCCAGTCAAAAAAGCTCAGTTGTGTCAGAAAGCTGAGCATGATTTTCCCGGAATGCCGTGCGGTATTATGGACCAGTTCATAGTGACTCTTGGAAAAAAAGATCACGCATTACTAATAGATTGCAGGTCATTGGAGTCCAAACAGGTGCCAATGAAGTGTTCAGACGTCGTGCTGTTGGTTGTGAATTCTAGTGTGAAGCATCAGCTAACCGGAAGCGAATACCCTCAGAGACGAGCGCAGTGTCAGCAAGCGGCTGATGAATTGGGGAAACCCTCTTTAAGGAGCGCCACCATTCAAGATCTTTCAAAACTGAAATGCGAGGAATTAGTTCTGAAACGTGCTAAGCATGTGGTCGAAGAGATCACCCGGACCGAGTTAGTCGCACAGCTTTTAGAGAGGAAAGATTATAAGGAGGTAGGGCGACTGTTCTATCAGTCCCACGAGTCCCTGAGCAAGCTGATGGAGGTTTCCTGTCCCGAGTTAGACCAACTGGTTGATATCATGAGGTCATCGGACGGAGTGTTCGGCGCCAGAATGACGGGCGGCGGCTTCGGGGGATGCGTCATAGCCTTAATAAAGAAGGAATGCTTGGCGTCTTTAAAGAGCAAGGTCCGGTCGGAGTACAAAGGTAACCCAGTGTTCTTTGAGTGCGAGCCGAGTGACGGAGCGAGAATATTAAAGATAGGATAA

Protein sequence:

>DPOGS215041-PA
MSEAVPKGEEVLLKEAVSKFVSTYNRKPLAAAAAPGRVNLIGEHVDYCEGFVLPVALPFFTVVVGAYNSTDECMVLSILASGQEVQTSFSSTESSSLQPGEPGWANYVKGVLANFPEKVKGLDAVIVSDVPMGSGVSSSASLEVAFFTFLEDLTKITVDPVKKAQLCQKAEHDFPGMPCGIMDQFIVTLGKKDHALLIDCRSLESKQVPMKCSDVVLLVVNSSVKHQLTGSEYPQRRAQCQQAADELGKPSLRSATIQDLSKLKCEELVLKRAKHVVEEITRTELVAQLLERKDYKEVGRLFYQSHESLSKLMEVSCPELDQLVDIMRSSDGVFGARMTGGGFGGCVIALIKKECLASLKSKVRSEYKGNPVFFECEPSDGARILKIG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: