MonarchBase - Protein-coding gene

DPOGS201064
Transcript	DPOGS201064-TA	1869 bp
Protein	DPOGS201064-PA	622 aa
Genomic position	DPSCF300185 - 371156-374869
RNAseq coverage	103x (Rank: top 60%)

Annotation
*Heliconius*	HMEL009847	0.0	79.70%
*Bombyx*	BGIBMGA007153-TA	0.0	74.47%
*Drosophila*	tobi-PA	7e-165	51.80%
EBI UniRef50	UniRef50_Q19P00	0.0	78.31%	Glycosyl hydrolase family 31 protein (Fragment) n=2 Tax=Obtectomera RepID=Q19P00_BOMMO
NCBI RefSeq	XP_002073831.1	9e-172	53.48%	GK14321 [Drosophila willistoni]
NCBI nr blastp	gi\|103058158	0.0	78.31%	glycosyl hydrolase family 31 protein [Bombyx mori]
NCBI nr blastx	gi\|103058158	0.0	78.31%	glycosyl hydrolase family 31 protein [Bombyx mori]

Group
Gene Ontology	GO:0004553	4.9e-185	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	4.9e-185	carbohydrate metabolic process
	GO:0008152	1.3e-19	metabolic process
	GO:0003824	1.3e-19	catalytic activity
KEGG pathway	dme:Dmel_CG11909	6e-163
	K01187 (E3.2.1.20, malZ)	maps->	Starch and sucrose metabolism
			Galactose metabolism
InterPro domain	[43-616] IPR000322	4.9e-185	Glycoside hydrolase, family 31
	[215-555] IPR017853	2.1e-75	Glycoside hydrolase, superfamily
	[341-511] IPR013785	1.3e-19	Aldolase-type TIM barrel
Orthology group	MCL10426		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201064-TA
ATGAAGTGGTTTGTGCTTATAACAGTTCTGGCGGTGGCGCTGGGAGCCGTGCCACGAAAACCAACAGCCCGTGACTTCTTCTTAGAAGAAGCGGATAACGATGCTTTTACCCTGATTGTTTTAACAGAGGGCAGGCGGGTTGTGCTTGGTGAAATCGGAAGAAAAGTTTCCTTAAACCATGACGACATTAGTTTTGAGATGTACGAAGAGCGAGATGAGGAGAGTGGCGGCTACCATGTAACGATCTCGTGGGAGGGGCCGAGCTCGGTCGTCTTCGAGGATTGTTTAGATTTTGGTGACAGACAATGGTACGGAGGCCCAGAGCAGAAAGAACAGTACTGGCCCATTCAAAAATCTAAACTCGAGAAGTACTCCATCATATCCAAAGAAGCAGATAACGCAGCTGTGTCTGAAAGGTACTGGGTGAACTCCGCCGGCTGGTACGTCTACATTCAACCAGAGGTACCGCTTTTTGTTGATCATCACAACATCCTCGATAACCACATTTGTTTTGTGGCCGAGGTTGCCGATCCCTACTCCAGCAAACGCCCGAGGAACGTCCTGAAATATGACCTATGGTTCTTCGATACTCCTAAAGATGCTCACATGCACGCTGTACATACCTATTTAGGAAAACCATCAGGAGTTCCCGATTACAGAATGATCCAATACCCAGTTTGGTCGACGTGGGCGAGGTACTCTAGGGAGATTGACCAAGAAAATCTATGGACTTTCGCAAACGAAATTAAGGACAGTGGTTTCCCCAACGCACAATTCGAAATCGATGATCTATGGGAAGTTTGTTACGGTTCTTTGACGGTCGATGAAAGGAAATTGCCTGATTTCAAACAGCTTATACAAGACATAAAAGCTCTAGACTTCAGGGTGACCATATGGGTACATCCGTTTATCAATAAAGATTGTGAACCATGGTATTCAGAGGCATTAGGAAAAGGCTATCTAGTCCTCAACGAGGAAGGCAGTCCTGACTCGAGCTGGTGGAACAACAACGGCTCCGTTCCTGGATACATCGACTTCACCAACCCTGACGCTGCAGAGTGGTACAGCTCCAGGATCCGGAATCTTATTGAAACATACGACATCGACAGCTTGAAATTTGATGCCGGAGAGTCGAGCTGGTCGCCTCAGATTCCAGTACAAAATGGGGACATAGAACTCCATCCAGGTCACATCGTTCAATCTTACGTGAGGACAGTCGCCCAGTTCGGACCCATGATTGAGATACGATCTGGGATGAGAACTCAAGATCTGCCAGTGTTCATTCGTATGGTGGACAAGGATACCCTATGGGACTTCAACAACGGCCTGGCGACTCTGGTCACCACTCTCCTACAGATGAACATGAACGGCTACGGCCTGGTGCTGCCCGACATGATCGGGGGCAACGGGTACAACGAGAAGCCCAGCAAGGAGCTGTTCGTGAGGTGGCTTCAAGCCAACGTATTCATGCCAACGCTGCAATACTCATTCGTCCCTTGGGACCATGATGAAGAAGCGGTCGAGATCTGTCGTCGCTACACCCAGCTGCACGCGGAGTACTCCCCACTGATTCTGGAGGCGATGGAAGCGGCCGTAGAGCGCGGGGAACCGGTCAACGCACCAATCTGGTGGCTCGACCCTCAGGACAAGGACGCCCTGGAGATATGGGATGAATTCCTACTCGGTGAAAGTGTTTTGTCGGCCCCTGTGTTAGAAGAGGGGGCGGTGTCCCGAGACATCTACCTGCCCAAGGGTCTCTGGAGGGACGGTAACAGTGGTGAGATGATCACCGGCCCCCAGTGGCTGCGGGATTACCCCGCACCGCTAGACGTGTTGCCATACTTCGTCTTGGAAGAGAAACACGTCTAA

Protein sequence:

>DPOGS201064-PA
MKWFVLITVLAVALGAVPRKPTARDFFLEEADNDAFTLIVLTEGRRVVLGEIGRKVSLNHDDISFEMYEERDEESGGYHVTISWEGPSSVVFEDCLDFGDRQWYGGPEQKEQYWPIQKSKLEKYSIISKEADNAAVSERYWVNSAGWYVYIQPEVPLFVDHHNILDNHICFVAEVADPYSSKRPRNVLKYDLWFFDTPKDAHMHAVHTYLGKPSGVPDYRMIQYPVWSTWARYSREIDQENLWTFANEIKDSGFPNAQFEIDDLWEVCYGSLTVDERKLPDFKQLIQDIKALDFRVTIWVHPFINKDCEPWYSEALGKGYLVLNEEGSPDSSWWNNNGSVPGYIDFTNPDAAEWYSSRIRNLIETYDIDSLKFDAGESSWSPQIPVQNGDIELHPGHIVQSYVRTVAQFGPMIEIRSGMRTQDLPVFIRMVDKDTLWDFNNGLATLVTTLLQMNMNGYGLVLPDMIGGNGYNEKPSKELFVRWLQANVFMPTLQYSFVPWDHDEEAVEICRRYTQLHAEYSPLILEAMEAAVERGEPVNAPIWWLDPQDKDALEIWDEFLLGESVLSAPVLEEGAVSRDIYLPKGLWRDGNSGEMITGPQWLRDYPAPLDVLPYFVLEEKHV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: