MonarchBase - Protein-coding gene

DPOGS215737
Transcript	DPOGS215737-TA	948 bp
Protein	DPOGS215737-PA	315 aa
Genomic position	DPSCF300041 + 652798-671496
RNAseq coverage	538x (Rank: top 23%)

Annotation
*Heliconius*	HMEL004071	2e-165	99.28%
*Bombyx*	BGIBMGA003610-TA	6e-128	95.48%
*Drosophila*	CG9008-PA	2e-136	79.78%
EBI UniRef50	UniRef50_Q9V3D1	2e-134	79.78%	CG9008, isoform A n=28 Tax=Pancrustacea RepID=Q9V3D1_DROME
NCBI RefSeq	XP_002428429.1	2e-144	85.51%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|242015576	3e-143	85.51%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastx	gi\|242015576	2e-142	85.51%	conserved hypothetical protein [Pediculus humanus corporis]

Group
Gene Ontology	GO:0030246	1.2e-77	carbohydrate binding
	GO:0005975	1.2e-77	carbohydrate metabolic process
	GO:0003824	1.2e-77	catalytic activity
	GO:0016853	1.5e-43	isomerase activity
KEGG pathway	phu:Phum_PHUM380460	5e-144
	K01792 (E5.1.3.15)	maps->	Glycolysis / Gluconeogenesis
InterPro domain	[6-275] IPR014718	1.2e-77	Glycoside hydrolase-type carbohydrate-binding, subgroup
	[8-275] IPR011013	4.4e-55	Glycoside hydrolase-type carbohydrate-binding
	[6-274] IPR008183	1.5e-43	Aldose 1-epimerase
Orthology group	MCL12659		Insect specific

Nucleotide sequence:

>DPOGS215737-TA
ATGGCAGCGACGAGTGTTGTCGTTCTGGACAGAGGCAACAATACAACTTGTACCGTAAATCTTTTCGGTGCTACAGTGGTATCATGGCGGGTTAATAATCAAGAACAATTATTTGTAAGTAAACAGGCCGTATTCGATGGGAAGAGGGCGATACGAGGAGGAATACCATTCGTATTTCCTCAATTCGGTCAATGGGCGTTCGGACCCCAGCATGGGTTCGCGCGCGTGGCTCGCTGGCACGTCGAGAAGATGCCAGAGAGACTGCCGTCTGGAGACGTGGAAGCTGTCTTCAGTCTCATGGATGACGACTTCACTAGATCCATGTGGCACTTCCAGTTCAGATTGACTTACCGGCTCATACTCCGCGAGAAGGAGTTGCACTTCAACATCGGCGTGTACAACCCCAGCAAGGAGTTGACCTTCAGCTGTCAACTGTTACTGCACACGTACTTCAAGGTGCCGGACGTGAGGCGCTGTCAGATAACCGGCATGCACGGCTGTATGTTTATTGATAAGACCCGTGAAGGCGCCGTGTACCAGGAAACCCGCGAGGTGGTCACCATCAATGAGTGGACGGACCGCGTGTATCAGAACACGATGCAGGAGCACATCATCACCAACGTGGTCAGCGGCCGGAAGATGAGGATACAGAAGTACAACTTCCCAGATACAGTGATTTGGAATCCTTGGGCGGAGTTCGCTAAGGAGATACCTGATTTCGGTGACGACGAGTTCCCGAACATGGTGTGTGTGGAAGCGGGCCGGGTCGCTGCACCCATTGTGCTGCTCCCAGGGACGGCCTTCGAAGCCTCACAGATATTACAGGTTTGGAGAGAAATAGGATTGGCTAGCCTCTCACTGCCATTATTTTGCTACCAGAAATATCTCAAGGATGTATTAGACTGCATTGTTGTCATGGAAGACAATTGTCCAACATGTAGAAGTTGA

Protein sequence:

>DPOGS215737-PA
MAATSVVVLDRGNNTTCTVNLFGATVVSWRVNNQEQLFVSKQAVFDGKRAIRGGIPFVFPQFGQWAFGPQHGFARVARWHVEKMPERLPSGDVEAVFSLMDDDFTRSMWHFQFRLTYRLILREKELHFNIGVYNPSKELTFSCQLLLHTYFKVPDVRRCQITGMHGCMFIDKTREGAVYQETREVVTINEWTDRVYQNTMQEHIITNVVSGRKMRIQKYNFPDTVIWNPWAEFAKEIPDFGDDEFPNMVCVEAGRVAAPIVLLPGTAFEASQILQVWREIGLASLSLPLFCYQKYLKDVLDCIVVMEDNCPTCRS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: