MonarchBase - Protein-coding gene

DPOGS210330
Transcript	DPOGS210330-TA	1464 bp
Protein	DPOGS210330-PA	487 aa
Genomic position	DPSCF300025 - 621774-624872
RNAseq coverage	81x (Rank: top 64%)

Annotation
*Heliconius*	HMEL013847	1e-117	57.30%
*Bombyx*	BGIBMGA011967-TA	1e-99	64.52%
*Drosophila*			%
EBI UniRef50	UniRef50_Q4T049	2e-58	30.59%	Xylose isomerase n=4 Tax=Chordata RepID=Q4T049_TETNG
NCBI RefSeq	XP_001633389.1	1e-60	33.84%	predicted protein [Nematostella vectensis]
NCBI nr blastp	gi\|340377122	3e-70	33.73%	PREDICTED: xylose isomerase-like [Amphimedon queenslandica]
NCBI nr blastx	gi\|340377122	3e-67	33.73%	PREDICTED: xylose isomerase-like [Amphimedon queenslandica]

Group
Gene Ontology	GO:0005975	1.3e-17	carbohydrate metabolic process
	GO:0009045	1.3e-17	xylose isomerase activity
KEGG pathway	cin:100179799	2e-65
	K01805 (xylA)	maps->	Pentose and glucuronate interconversions
			Fructose and mannose metabolism
InterPro domain	[21-253] IPR013022	6.9e-60	Xylose isomerase-like, TIM barrel domain
	[110-132] IPR001998	1.3e-17	Xylose isomerase
Orthology group	MCL25906		Lepidoptera specific

Nucleotide sequence:

>DPOGS210330-TA
ATGTCCCACGTCCAAGCCGGGAAAAGACAGAAAACTAGGGATGTAAGGGCTGAAAACATTGACTACTTTCAAGGCATAGACAGAATAGAGTACAACAACATGGCCACTGTAACAGACACGGCTTACTATCGCCATTACAACAGCGGAGAGAAAATACTGTCCAAAGATATGGAAGAATGGCTTAAATATAGTGTATCCTTCACAGAATTTAAATATGACGGTTCAGATGCTCAAGGAAGACCTACTTTTAACCGGCAATGGGATGATCACACAAACACTATAGATAATTGCAAACGTTGTATCAGAGCTTTCTACGACTTCTGTACAAAGCTCGGAGTGAAGTACTGGACCGCGTTTGATAATGATCTAGTGCCACAAACAGACAACTGGGATGAAAACAAAAGTAATTGGGATGAAATCACTGATTATATAACGGAAATGGCGCAAAAAACACAGATCAAATTGTTATGGATGGCGCCCGACTTGCATTCCCATCAGAGATATTCGTCAGGAGCTTTCACGAGTAACGAAGCGACAACTTTCTTGCAAGCAGCCAGTCAGGTCAAGAAATGTCTGGAAGTGTCTCAGCGTCTGAACGCCGAATGCTTCCTCCTCTGGCCGTACAGGGAGGGCTACGACGCTGTGTTCCAAACAGACGTCGCCAGAGAGATCAAATTGTTCGCTAAACTTTTAAAGATAACAGCGGAATACAGGGACAGGTTGAGTTATAAATGTCAGCTGCTGCTGATGCCGTACCCGAGCTTTGGTAAGAACTTCAGAAGTACGGAGATATGGCGACCGAGATGTGACTTTGATAGCGATACACTGAATAGGTACATGTGGGACGTGACCAGCTGCTTGTACTTCCTGAAGTTCCATAGTTTAGATCGCTATTATAAAGTGTGCTCTCCTCCAGGACAACATGTCTATTTAGCTGGAGTTTACAACGCGTTCGGAGGAGTGACAATGACTAATACATTCGATCCCTCGGACATTAAGACTATAACGCTCATGTTGAAATGTATTATTGATCAAGGTTCCGCCCCCCCGGGTGGGATATCCCTGCGAGTGTCGTGTCCCCGCGGCGGTACCATCCGTGACCAGCTAGCGATGTACATTAATTATATCGACGAGTGCGCCAGAGGACTCAGGGTCGCAGCCGCTGTGCTCGCAGAACAGGTGTTCGTGAAGCATGTACAGCAACGTTACTCCTCATACTACAGCGGCTTCGGAGCTCGACTAGTGAGCGGAGACGTGTCTATGGAAGAGTGTAAGCATGTACAGCAACGTTACTCGTCATACTACAGCGGCTTCGGAGCTCGACTCGTGAGTGGAGACGTGTCTATGGAAGAGTGTGAAGAATTATACAAGAAAAATCAAGCGCAAACTGAAATACAAAGCGGGAGGCGCGGGAACTACGAATTGGTCTTCCAACGATACCTAGACGCGTGCGACCACGTGTGA

Protein sequence:

>DPOGS210330-PA
MSHVQAGKRQKTRDVRAENIDYFQGIDRIEYNNMATVTDTAYYRHYNSGEKILSKDMEEWLKYSVSFTEFKYDGSDAQGRPTFNRQWDDHTNTIDNCKRCIRAFYDFCTKLGVKYWTAFDNDLVPQTDNWDENKSNWDEITDYITEMAQKTQIKLLWMAPDLHSHQRYSSGAFTSNEATTFLQAASQVKKCLEVSQRLNAECFLLWPYREGYDAVFQTDVAREIKLFAKLLKITAEYRDRLSYKCQLLLMPYPSFGKNFRSTEIWRPRCDFDSDTLNRYMWDVTSCLYFLKFHSLDRYYKVCSPPGQHVYLAGVYNAFGGVTMTNTFDPSDIKTITLMLKCIIDQGSAPPGGISLRVSCPRGGTIRDQLAMYINYIDECARGLRVAAAVLAEQVFVKHVQQRYSSYYSGFGARLVSGDVSMEECKHVQQRYSSYYSGFGARLVSGDVSMEECEELYKKNQAQTEIQSGRRGNYELVFQRYLDACDHV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: