MonarchBase - Protein-coding gene

DPOGS208958
Transcript	DPOGS208958-TA	975 bp
Protein	DPOGS208958-PA	324 aa
Genomic position	DPSCF300009 + 773061-779662
RNAseq coverage	72x (Rank: top 66%)

Annotation
*Heliconius*	HMEL015775	1e-101	56.95%
*Bombyx*	BGIBMGA002431-TA	8e-22	58.44%
*Drosophila*	CG14721-PA	5e-47	38.49%
EBI UniRef50	UniRef50_D6W952	8e-53	45.34%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6W952_TRICA
NCBI RefSeq	XP_975470.2	2e-53	45.34%	PREDICTED: similar to thiamin pyrophosphokinase 1 [Tribolium castaneum]
NCBI nr blastp	gi\|332373478	2e-54	44.31%	unknown [Dendroctonus ponderosae]
NCBI nr blastx	gi\|332373478	3e-54	42.91%	unknown [Dendroctonus ponderosae]

Group
Gene Ontology	GO:0004788	1.8e-46	thiamine diphosphokinase activity
	GO:0006772	1.8e-46	thiamine metabolic process
	GO:0005524	1.1e-35	ATP binding
	GO:0009229	1.1e-35	thiamine diphosphate biosynthetic process
KEGG pathway	mmu:29807	1e-45
	K00949 (E2.7.6.2, THI80)	maps->	Thiamine metabolism
InterPro domain	[86-318] IPR006282	1.8e-46	Thiamin pyrophosphokinase
	[83-210] IPR007371	1.1e-35	Thiamin pyrophosphokinase, catalytic domain
	[236-322] IPR007373	8.5e-26	Thiamin pyrophosphokinase, vitamin B1-binding domain
Orthology group	MCL15289		Single-copy universal gene

Nucleotide sequence:

>DPOGS208958-TA
ATGTTTTGCAAGTCCATGTTTGATAAACACTCGTATTCACGATATTTATTACTGTATAAATATTTATCGGCGTATGAAAAAAGTTACAGGTTGGACTCAAACAATATATTGTCAAATTTAAATAGGATAATGACTAGGAATTTAGCATTGACTAAGGTGTCAGAAAATCATAGCGATTTATCAAATAATATCATAAAATGCTGGAAATGGAATGTAAATAAAATACTTAATGTACAGGAAAATAAGAAATATGCAATATTAATACTGAATTGTAGAATAACACAGAAGAAAGACATCATTAAACGATTTTGGAATGAAGCATCATTGAGAATAACTGTTGATGGTGGAACCTCACATTGGGATAAGTTTTTGAATCATTTATCACACGATGAACAAAAATCAATGAAATGCCCCGATCTTGTGACTGGAGACTTTGATTCTATAAGTGAAGAGATGTTGCAGAAATATAAAGACAAACATTGTAAGATAATAAGCACACCTGATCAGGATTTCACAGATTTTACAAAGGCTATCATAGAATTGAATAATTACTGTGAAGAGAATAAAGTACAGATGGACTATGCCGTTGTGATGGCTCAGAATTCAGGTCGCCTTGATCAAATACTGGGAAACATTCAAACACTGCATCTTATTAAGGAAAACAGGTTACTGCATCCGCAGACTAGAGTGTACATGTTGTCAGATGACTCTATATCCTGGCTTCTACATCCCGGAGACCACATCATAGAAATTCCGCTTGCAAGTAGGAATGGCAATGCATGGTGTTCGCTAATACCAGTAGGAGAGCCATGTATAAGCGTCACAACCAGTGGACTTAAATGGAACTTAGATAATCAAAAATTGAATTTTGGTGGTCTTATAAGCACATCGAACACATTCGACGGATCCGACCAGGTTAAAGTTAAATGTAGTCACACGTTGTTGTGGTCTATGGAAATACCAACTCTGATGTAG

Protein sequence:

>DPOGS208958-PA
MFCKSMFDKHSYSRYLLLYKYLSAYEKSYRLDSNNILSNLNRIMTRNLALTKVSENHSDLSNNIIKCWKWNVNKILNVQENKKYAILILNCRITQKKDIIKRFWNEASLRITVDGGTSHWDKFLNHLSHDEQKSMKCPDLVTGDFDSISEEMLQKYKDKHCKIISTPDQDFTDFTKAIIELNNYCEENKVQMDYAVVMAQNSGRLDQILGNIQTLHLIKENRLLHPQTRVYMLSDDSISWLLHPGDHIIEIPLASRNGNAWCSLIPVGEPCISVTTSGLKWNLDNQKLNFGGLISTSNTFDGSDQVKVKCSHTLLWSMEIPTLM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: