MonarchBase - Protein-coding gene

DPGLEAN22373 in OGS1.0

Genomic Position	scaffold5345:+ 9469-15495
	See gene structure
CDS Length	1488
Paired RNAseq reads	1437
Single RNAseq reads	3467
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA005785 (5e-171)
Best Drosophila hit	CG9701 (2e-121)
Best Human hit	lactase-phlorizin hydrolase preproprotein (1e-105)
Best NR hit (blastp)	similar to CG9701-PA [Papilio xuthus] (0.0)
Best NR hit (blastx)	similar to CG9701-PA [Papilio xuthus] (0.0)
GeneOntology terms	GO:0043169 cation binding GO:0005975 carbohydrate metabolic process GO:0004553 hydrolase activity, hydrolyzing O-glycosyl compounds
InterPro families	IPR001360 Glycoside hydrolase, family 1 IPR018120 Glycoside hydrolase, family 1, active site IPR017853 Glycoside hydrolase, superfamily IPR013781 Glycoside hydrolase, subgroup, catalytic core
Orthology group	MCL10077

Nucleotide sequence:

ATGAACCGTTTAAGTTTCATCTTAATCAGTTCTATCACATTCGGTGTGAGTTCAAACTTA
GTTGCGTGTTCCGTTTGCTTTCCTGAAAATTTTATTTTCGGCGTTGCGACCGCTGCTTAC
CAGATTGAAGGAGCGTGGAATGTCTCAGGCAAAGGTGAGAGTATTTGGGACAGGTTCACC
CATCAGCGGCCCGACCTGATCTTCGATCACAAAAATGGAGACGTGGCAGCCGATTCATAC
CACAGGTTCAAAGAAGACGTGAGGCTCATGAAGAGAATTGGTGCATCGTTCTACCGATTC
TCAATATCCTGGCCGAGGATATTACCCGATGGATTGTCCAACGAAGTGAACGCGGACGGA
ATCAGGTACTATACTGAGCTTCTCGAAGAGCTTCGTCGTAATGACATCAAGTCGTTGGTA
ACGATGTATCACTGGGACCTGCCTCAAGCCCTGCAAGACCTGGGCGGCTGGACCAATCCC
ATTATAGCTGATTACTTTGTGGATTACGCCAGGGTGCTGTTCGATAGTTTCGGTGATTTA
GTGACGGCGTGGTTGACGTTCAACGAGCCGTACTCGTTCTGTCGAGACGGGTACGGAGGC
CTGGAGGCGCCGGGGGCTGCGGCCAGCGGACTCGAGGACTATATGTGTGGACACACCGTG
TTACGAGCTCACGGAATGGTCTACAGGATGTACAAACAAGAGTACAGGCATCGAGTTGGA
GCTGTCGGTATCACATTGGACTTCTCTTGGCTCGAGGCAGCCACAACCTCTAGCGAAGAT
CAGATCGCGGCCGAAACTGTCAGACAGTTTAATTTCGGTTGGTTCGCTCATCCTATATTC
TCTAAGACTGGCGACTATCCGCCCGTCATGAGGAAAAGGGTGGACTCTATATCAAGGAGA
CAACATTTCACGCGATCTCGTCTTCCGACGTTCACGGAAGACGAGATCGAGATGATAAAG
GGTTCTTCAGACTTCCTGGGCCTGAACCACTACACCACCTACCTGGTCACTAAGAATAAA
TCCAAGATATCAATGACCCCGTCCTTCGAAGCCGACACGGGCGGTATTCTATCGCAAAAA
GCCGAATGGCCGAAATCAAACTCAACATGGCTAAAGGTCGTGCCGTGGGGTTTCAGGAAA
GCTCTGAACTGGATAAAGAACAAATACGACAATCCAATAGTGTTCATAACAGAGAACGGC
ATAGCGCTAGAGAGAGGTCTCACAGACAGACGCCGCGTCAACTACATCGACGCTTACCTC
AGAGCGTTACACGCCGCCATCTTGAAAGACAACTGTCAAGTGATTGGTTACACATATTGG
AGTCTTATTGACAACTTCGAGTGGACGCGGGGTTACTCAGAACGTTTCGGATTGTTTGAA
GTCGACTACGAGTCCCCGAATAAGACTCGAACGGCGCGACTGTCCGCGGCTTACTTCAGC
CGACTCGCGCGGGACAGGTGCTTGCCAAACATGGACTTTACGGACTAG

Protein sequence:

MNRLSFILISSITFGVSSNLVACSVCFPENFIFGVATAAYQIEGAWNVSGKGESIWDRFT
HQRPDLIFDHKNGDVAADSYHRFKEDVRLMKRIGASFYRFSISWPRILPDGLSNEVNADG
IRYYTELLEELRRNDIKSLVTMYHWDLPQALQDLGGWTNPIIADYFVDYARVLFDSFGDL
VTAWLTFNEPYSFCRDGYGGLEAPGAAASGLEDYMCGHTVLRAHGMVYRMYKQEYRHRVG
AVGITLDFSWLEAATTSSEDQIAAETVRQFNFGWFAHPIFSKTGDYPPVMRKRVDSISRR
QHFTRSRLPTFTEDEIEMIKGSSDFLGLNHYTTYLVTKNKSKISMTPSFEADTGGILSQK
AEWPKSNSTWLKVVPWGFRKALNWIKNKYDNPIVFITENGIALERGLTDRRRVNYIDAYL
RALHAAILKDNCQVIGYTYWSLIDNFEWTRGYSERFGLFEVDYESPNKTRTARLSAAYFS
RLARDRCLPNMDFTD