MonarchBase - Protein-coding gene

DPOGS209035
Transcript	DPOGS209035-TA	1869 bp
Protein	DPOGS209035-PA	622 aa
Genomic position	DPSCF300102 - 113836-119869
RNAseq coverage	6312x (Rank: top 2%)

Annotation
*Heliconius*	HMEL006098	84.30%
*Bombyx*	BGIBMGA014211-TA	83.58%
*Drosophila*	CG8036-PC	68.78%
EBI UniRef50	UniRef50_Q9H0I9	58.62%	Transketolase-like protein 2 n=226 Tax=cellular organisms RepID=TKTL2_HUMAN
NCBI RefSeq	NP_001040158.1	82.96%	transketolase [Bombyx mori]
NCBI nr blastp	gi\|114050833	82.96%	transketolase [Bombyx mori]
NCBI nr blastx	gi\|114050833	82.96%	transketolase [Bombyx mori]

Group
Gene Ontology	GO:0008152	3.9e-31	metabolic process
	GO:0003824	3.9e-31	catalytic activity
KEGG pathway	aag:AaeL_AAEL004434	0.0
	K00615 (E2.2.1.1, tktA, tktB)	maps->	Pentose phosphate pathway
			Biosynthesis of ansamycins
			Carbon fixation in photosynthetic organisms
InterPro domain	[13-272] IPR005474	9.3e-81	Transketolase, N-terminal
	[315-479] IPR005475	4.4e-44	Transketolase-like, pyrimidine-binding domain
	[490-620] IPR015941	3.9e-31	Transketolase-like, C-terminal
	[486-622] IPR009014	1.4e-29	Transketolase, C-terminal/Pyruvate-ferredoxin oxidoreductase, domain II
	[494-612] IPR005476	6.8e-24	Transketolase, C-terminal
Orthology group	MCL10524		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209035-TA
ATGAAGGGTGAAAAGAACGTTGATATACAAGCTTTAAAAGATATCGCCAATAAGCTGAGGATCGACAGCATCGTTGCTACAAATGCATCAAAATCCGGTCACCCCACGTCATGTGCGTCCATGGCGGAGATCATGTCCGTGCTGTTCTTCCACACTATGAGGTACAAGGTCTCCGCACCCAAGGACCCCTCGGCCGACAGATTCATACTCTCTAAGGGTCACGCAGCGCCAATCCTATACGCCGCCTGGGCGGAGGCCGGCCTGTTCCCTCTGGACGACCTGAAGAACCTCCGCAAATTGACCTCCGACCTCGAGGGTCACCCCACGCCCAGGCTGAACTTCGTAGACGTCGGCACCGGCTCGCTGGGTCAGGGGCTGGCGGTCGCCGCCGGTATGGCGTACGTCGGGAAATACTTCGACCAGGCGCCGTACAGGGTGTACTGTCTGGTGGGTGACGGCGAGGCGGCCGAGGGCAGTGTGTGGGAGGCGCTGCACTTCGCAGGTCACTACAAGTTGGACAACCTGGTCGTGGTGTTCGACGTCAACCGCCTGGGACAGTCCGAGCCCACCTCGCTCCAGCATCAGATGGATGTGTACAAGGCTCGCCTCCAAGCGTTCGGATCTCACACGCTGGTCGTGGACGGACATGACGTCACGGAGCTCGTGAAGGCCTTCGACGAAGCCGCCAACACCAGCGGACGACCCACTGCCATCGTCGCCAAGACATACAAAGGAAAAGGGTTCCCCGGGATAGAGGATAAGGACAACTGGCACGGGAAGGCGCTAGGAGCTGACGGAGAGAAGATCATTAAGCACCTCCAGTCGCTGATGAAGTCCCAGTCCGTATCGTTGAAGCCCCGGGCTCCGCTAGCGGCCGCGCCCCGGGTCCACCTGGAGGACCTTACGCTGTCCTCTCCGCCAGCATACAAGCTCGGGGAGCTGGTCGCCACCCGCCTGGCTTACGGACACGGACTCAAGAAACTCGCCGACAATAACCAGAGAGTAATCGCCTTGGACGGGGACACCAAGAACTCCACATTCAGTGACAAACTTCGTAACGCCTACCCCGACAGATATATCGAATGTTTCATCGCGGAGCAGACGCTCGTGGGTGTGGCGACCGGCGCCGCGTGTCGAGACCGCGCCGTGGTGTTCGCCTCCACCTTCGCCGCCTTCTTCACTAGGACCTTCGACCAGATCCGCATGGGCGCCATCAGTCAGAGCAACATGAACCTGGTGGGGTCTCACTGTGGCGTAAGCATCGGAGAGGACGGACCCTCGCAGATGGGGCTCGAGGACCTGGCCATGTTCCGCGCCGTTCCCACCGCCACTGTCTTCTATCCCTCTGACGCGGTGAGCACGGAGCGCGCGGTGGAGCTGGCGGCCGGCACGCGCGGCATCTGTTACATCCGCACCTCGAGACCGAACACGCCGGTTCTGTACGAAAACGACGCCGTCTTCAAGGTGGGCGAGGCCCGCGTGGTGGTGCAGTCTGCCGCGGACCAGGCGCTCGTCATCGGAGCAGGCGTCACCTTACACGAGGCGATGGCGGCCGTGGAGTCTCTCCGGGCGGAAGGTGTGTCGGTGCGCGTGATGGATCCCTTCACCATCAAGCCGCTGGACGAGGCGGCGGTGCGCGCGCACGCGGCGGCGGTCGGCGGACGAGTGGTGGTGGTCGAGGATCACTACCAGGCCGGTGGTCTGGGCGAGGCGGTGATGTCGGCCCTGGCTCTGGTCCGAGGGTCGGTGGTCCGTCACCTGTGTGTCCGCGAGGTTCCTCGCTCGGGCGCTCCTCAGGAGCTGTTGGACCACTACGGCCTGTCCGCCAGACACGTGGCCGCCGCCATCAGGGAGATATTGAAGGCTTAG

Protein sequence:

>DPOGS209035-PA
MKGEKNVDIQALKDIANKLRIDSIVATNASKSGHPTSCASMAEIMSVLFFHTMRYKVSAPKDPSADRFILSKGHAAPILYAAWAEAGLFPLDDLKNLRKLTSDLEGHPTPRLNFVDVGTGSLGQGLAVAAGMAYVGKYFDQAPYRVYCLVGDGEAAEGSVWEALHFAGHYKLDNLVVVFDVNRLGQSEPTSLQHQMDVYKARLQAFGSHTLVVDGHDVTELVKAFDEAANTSGRPTAIVAKTYKGKGFPGIEDKDNWHGKALGADGEKIIKHLQSLMKSQSVSLKPRAPLAAAPRVHLEDLTLSSPPAYKLGELVATRLAYGHGLKKLADNNQRVIALDGDTKNSTFSDKLRNAYPDRYIECFIAEQTLVGVATGAACRDRAVVFASTFAAFFTRTFDQIRMGAISQSNMNLVGSHCGVSIGEDGPSQMGLEDLAMFRAVPTATVFYPSDAVSTERAVELAAGTRGICYIRTSRPNTPVLYENDAVFKVGEARVVVQSAADQALVIGAGVTLHEAMAAVESLRAEGVSVRVMDPFTIKPLDEAAVRAHAAAVGGRVVVVEDHYQAGGLGEAVMSALALVRGSVVRHLCVREVPRSGAPQELLDHYGLSARHVAAAIREILKA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: