MonarchBase - Protein-coding gene

DPOGS205833
Transcript	DPOGS205833-TA	5004 bp
Protein	DPOGS205833-PA	1667 aa
Genomic position	DPSCF300081 - 112017-124024
RNAseq coverage	1146x (Rank: top 11%)

Annotation
*Heliconius*	HMEL009929	61.22%
*Bombyx*	BGIBMGA010888-TA	67.13%
*Drosophila*	CG9485-PB	54.22%
EBI UniRef50	UniRef50_E2BPT9	56.74%	Glycogen debranching enzyme n=18 Tax=Coelomata RepID=E2BPT9_HARSA
NCBI RefSeq	XP_394961.3	55.54%	PREDICTED: similar to CG9485-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|383864755	57.03%	PREDICTED: glycogen debranching enzyme [Megachile rotundata]
NCBI nr blastx	gi\|383864755	57.03%	PREDICTED: glycogen debranching enzyme [Megachile rotundata]

Group
Gene Ontology	GO:0004135	0	amylo-alpha-1,6-glucosidase activity
	GO:0005978	0	glycogen biosynthetic process
	GO:0003824	2e-47	catalytic activity
	GO:0043169	1.2e-30	cation binding
	GO:0005975	1.2e-30	carbohydrate metabolic process
KEGG pathway	ame:411488	0.0
	K01196 (AGL)	maps->	Starch and sucrose metabolism
InterPro domain	[44-1665] IPR010401	0	Amylo-alpha-1,6-glucosidase
	[1204-1656] IPR008928	2e-47	Six-hairpin glycosidase-like
	[483-572] IPR013781	1.2e-30	Glycoside hydrolase, subgroup, catalytic core
	[198-580] IPR017853	4.2e-24	Glycoside hydrolase, superfamily
Orthology group	MCL13992		Single-copy universal gene

Nucleotide sequence:

>DPOGS205833-TA
ATGCTCGCAAGAGAGATGACCGAGTACGCGAGGAAGGCGGAAAAAATCGCCATCGAAAAGAGGCAGATGGCAGTGGAGAGTCGCGAGGCGGAGGGGGGGTCGGCGCCCGAGGCCAGCGGCGAGGGGGCGGGGGAGGGGCAGGTCGTCCGTGCGATCACGCTCAATCACGGAGAACATCAAGACGCTACTCTCTATAGGTTTGAAAAAGGATGCCGTTTACAGTTCAGCCCCGGTCCGAGCATGCTCGGTCGGAAGGTGTTCCTCTACACAAATTATGTCGTCTCAGAAAATTCGGAAGACAAGAGCGAGCCAGCGTTCGTACGCAACCAGTACTATGCTCTCGAGTGGAGGAAGGACGAGGATTCGGAGTCTCTCGGTACCGGCCTCCTGGTCACTGACACGGAGTTCTACTGCGAGCTGAAACTGGCTAAGGCTGGCTCATTCCACTACTACTTCGTTTACGACAGCCCCGAGTCCCGGGTGGGTCCTCAAGGCTCGGGCTGGTTCCACGTGGCTCCGAGCCTCTCCGCGGGGGGAGTTCAGGTTCCGCTGGACGGCGTCATGTGTCAGACGGTGCTGGCCAAAAGTTTGGGACCCCTGTCACGGTGGATGAAAACCCTGAGAGTGGCTCACGAAGCTGGTTTCAACATGATACACTTCACTCCCGTTCAGGAGCTGGGCGCGTCTAATTCAAGCTACAGCCTGGCGAACCAGCTCAAGCTGAACCCTCGCTTCAACGACATCAATTCTGGCAGGGATGCCACTTTCGCTGACGTGGAAAACATCATCGCCAAAATGCGCAACGATTGGAAGATGCTGTCGATATGTGACGTCGTGTTGAACCACACGGCCAATGAGAGTGAATGGCTGACGTCACATCCGGAAGCCACTTATAATTGCATCACATGTCCCCACCTGAGGCCCGCCGCCCTCCTCGATGCTGTACTGGCCAAGTTGGGGGAAGACATCGCATCGGGACGGGAAACTCGCCTGCCCACTAAGATTAACACACATCAACAAATTGAGATGATCCGCGACATCCTGCTGAACGAGCGTCTCCCGGAAGCGAAGCTGCACGAGATGTACATCTGTAACGTGGACGAGACGGTCGAGAGGTTCTACCACATGGCGAGGAATAAGGCCGACTGCTACGACGAGGATGCTCGTGTGAAGCGTTGCTGTGAGGAGTTCCGCGTGAAACTGGAACAGTTGAACGAGGCCGCCATACACACCGTCAACGATCACCTGAGAGCCGCTGTGCAGAACTGTGTAGCGGGAATGAGTTACTTCCGTCTTCAGTCAGACGGCCCTAAGATAGAGGAAGTTAGCGAGAAAAATCCTCTCGTACCAAGATATTTCACGTTCCCTGGTCCGCTGGGTGGTGTCGCGGACATGGAAGGCGTGATATACGGCGAGGCGGGCCGCCTGGTGATGGCGCACAACGGCTGGGTCATGAACTCCGACCCGCTGCAGGACTTCGCTGACAAGGAACACGACGGACGGGTTTACTTCAGGAGGGAACTCATCGCTTGGGGAGACAGTGTCAAACTCAGGTACGGCGAGAAGCCGGAAGACAGTCCATTCCTTTGGCGCCACATGCGGCAATACGTAGAACTAACAGCCGAGGTCTTCGATGGAGTCAGACTGGACAACTGTCACTCAACGCCATTACATGTTCACGGCCCTAAGATAGAGGAAGTCAGCGAGAAAAATCCTCTCGTGCCAAGATATTTCACGTTCCCTGGTCGGCTGGGTGGTGTCGCGGACATGGAAGGCGTGATATACGGCGAGGCGGGCCGCCTGGTGATGGCGCACAACGGCTGGGTCATGAACTCCGACCCGCTGCAGGACTTCGCTGACAAGGAACACGACGGACGGGTTTACTTCAGGAGGGAACTCATCGCTTGGGGAGACAGTGTCAAACTGAGGTACGGTGAGAAGCCGGAAGACAGTCCATTCCTGTGGCGCCACATGCGGCAGTACGTAGAACTAACAGCCGAGGTCTTCGATGGAGTGAGACTGGACAACTGTCACTCAACGCCATTACATGTCGCGGAGTACATGCTGGACTGTGCTCGGAACGTCAAACCCGACTTGTATGTAGCGGCGGAGCTGTTCACTAACTCCGACCACGTCGACAACATATTTGTCAATAGACTTGGTATAACGTCGCTGATACGAGAAGCCCTATCAGCATGGGACTCCCACGAGCAGGGTCGACTGGTCCATCGTTTCGGAGGTCGCGCCGTGGGGTCGTTTTTCACCCCTCAAGTGACCCGCGCCCAACCTCAAGTGGCCCACGCTTTGTTCCTTGACCTCACACACGACAACCCATCGCCGATCGATAAGAGGAGCGTGTTCGATCTACTCCCGTCCGCGGCGCTGGTGTCGATGGCCAGCTGCGCGATCGGTTCCACTAGAGGATACGACGAGCTCGTGCCCCACCATATCCACGTGGTGGACGAGGCTCGTTTGTACGCGGAGTGGGAGGAGGGGGAGGGGGAGGGGGTGAACGCGTCCACCGGCCTTATAGCAGCTAGGCGGGCGCTCAACGATCTACATTTACATCTAGCAGCCTCCGGATACTCGGAGGTGTACGTCGATCAAATGGATGCTGACGTGGTGGCTGTGACGAGACACGAACCACATTCGAGAAAGTCTGTTATTTTGGTCGCCTTCACCGCCTTCAAGGCCCCCGACGAGTCTTCCACCGGCCGCTACGTGAAGCCGTTACGGTTCGAGGGACAACTGGAGGAAATTATTTTGGAGGCGGTGCTGAGACACAAGGACCACAGAAGCACGGGTCGCCCGTTCCAGACGTGCGGAGGGTTCTCTCGTCACCCGCAGCACATCAACGGTCTCAGCGACTACGAGGCCAGCGTCCGCTGCGGCGTTCCGTTGGCGCAGTCCAACGTGTTTGTTAGTGAACGCCGTGACGGTCCCTATACTGTGCTGGAGTTCGGCGTGCTACCCCCCGGGACGGTGGTCGCGGTGCGTGTGGCTCCACATTCCTCGCAAGCGGGAGCGTTGGCGGCTCTCAGACGAGTGACCTGCCAGCATCCAGCCACAGATCCCCTGGGTCTATCGCCGGCACTCACTGACCTCGATCTAGGAGATTTCAACGCGTTGCTATATTGCTGTGACGCGGAGGAACGTGAGCGCTGTGGGGGCGGAGTGTACGACGTGCCCGGTCACGGTCCGCTCGTATACGCTGGGCTGCAGGGCGTGGCTTCACTGCTGGAGGAAGTCGCCCCACGTGACGACCTCGGACACGCGCTATGTGACAACCTCCGCGCTGGCGACTGGCTGCTCGACTACCAATGGCGGCGCTTAGAGTCTGACCCGCGACTGTCCGCCCTGGCGACGATCTATAGAGAAGCGTTGAGGCCGGTCGGTGAATTACCGCGTTTTCTGGTGCCGGCCTACTTCGAGGTCACCGTCCGTTGTATGATAGCTGCCGTGAAGCGCGCGGCCCTGGCTCGTCTGGGAGGCGTCGCGTTGAGTTCGGGAGTCGCTCGTGAGTTGTCACTGACCGGGGTCCAGCTGGCCGGTGCGGTGTCGTCCGCTCGTTTGCCGGCCATGTCTCCCTCTCTGCCGATGCTCCGCCCGGCTCGTCCTTTGTCCCTGTCGGCCGGTCTGCCTCACTTTGCCGTGGGCTACATGAGATGCTGGGGTCGAGACACCTTCATCGCTCTGAGAGGGATGTTCCTACTCACGGGCCGTTATCAAGACGCGCGCTTCCATATACTAGGATTCGCTGCTTGTTTAAGACACGGTCTGATACCTAATTTATTGGACGGAGGCCGCAACGCTAGATTCAACTGTCGCGATGCGGTGTGGTGGTGGCTGCAGAGCATCAAACAGTACTGCACGGAGGCCCCTCAAGGCTACTCTATCCTGACGGACCCGGTGTCTCGTATATTCCCGAAAGACGACAGTGAGCCTGCACCCCCAGGGGCTGCGGACCAACCGCTGCATGACGTTATGCAGGAAGCCTTGGACGTTCACTTTCAGGGTCTCGTCTTTCGTGAGCGCAACGCCGGCCGACAGATAGACGCACACATGTCCGACAAGGGTTTCAACATCCAGATCGGCGTGGACCCCGAGACCGGGTTCCCGTTCGGAGGAAACGAAGCCAACTGCGGGACGTGGATGGATAAGATGGGTTCGTCGGAGACGGCCGGCACGCGGGGGAAGCCCGCCACGCCGCGCGACGGCAGCGCGGTGGAGCTCGTCGCGATGGCGTACTGCGTCGCGTCCTGGCTGGCGGCACAGCATCGCTCCGCTAAGTATCCGTACCCGGGCGTGGCGAGGCGGCACCGAGACGGATCCCTCACCGCCTGGACGTACTCCCAGTGGGCGGATCGAATACGACGCTCCTTCGAACGACACTTCTGGGTCCCGGCCGCGCCCTCGGCCGCCGACCAGCGCCCAGACCTCGTGCACCGCCGCGCCATCTACAAGGACACGCACGGCGCCTCGCAGCCCTGGGCCGACTATCAACTGCGCTGCAACTACGTCGTCGCCATGGCTCTGGCGCCGGAATTGTTCGACCCGCGACACGCCTGGCTCGCCCTGGACAATGTCGAGAAACTGCTGGTCGGGCCTCTCGGTCTCAAAACCCTCGACCCCGAGGACTGGGCCTACCGTCCCAACTACGACAACTCGGACAACAGCTCGGACCCGAGCGTTGCACACGGCTTCAACTACCACCAGGGCCCGGAGTGGACGTGGCCGCTCGGCTTCTACCTCAGAGCGCGGCTCGCCTTCGCTCACGACAACGGTCAGTTCTCCAAGACCGTGGCGGCGGCATACGCGGCCCTCGCCCCGCTTGTGGCAGAGATGCGTTCGTCCCCGTGGCGCGGCCTGCCCGAGCTGTCCAATGCCGGAGGCGCATTCTGTAAGGACTCGTGTCGCACCCAGGCCTGGAGTTCGTCCTGCATGCTAGAGGTGCTCCATGATCTCGAGCTGTCGCGCCGAGCTCGACCGCTCCCTCTCGACTGA

Protein sequence:

>DPOGS205833-PA
MLAREMTEYARKAEKIAIEKRQMAVESREAEGGSAPEASGEGAGEGQVVRAITLNHGEHQDATLYRFEKGCRLQFSPGPSMLGRKVFLYTNYVVSENSEDKSEPAFVRNQYYALEWRKDEDSESLGTGLLVTDTEFYCELKLAKAGSFHYYFVYDSPESRVGPQGSGWFHVAPSLSAGGVQVPLDGVMCQTVLAKSLGPLSRWMKTLRVAHEAGFNMIHFTPVQELGASNSSYSLANQLKLNPRFNDINSGRDATFADVENIIAKMRNDWKMLSICDVVLNHTANESEWLTSHPEATYNCITCPHLRPAALLDAVLAKLGEDIASGRETRLPTKINTHQQIEMIRDILLNERLPEAKLHEMYICNVDETVERFYHMARNKADCYDEDARVKRCCEEFRVKLEQLNEAAIHTVNDHLRAAVQNCVAGMSYFRLQSDGPKIEEVSEKNPLVPRYFTFPGPLGGVADMEGVIYGEAGRLVMAHNGWVMNSDPLQDFADKEHDGRVYFRRELIAWGDSVKLRYGEKPEDSPFLWRHMRQYVELTAEVFDGVRLDNCHSTPLHVHGPKIEEVSEKNPLVPRYFTFPGRLGGVADMEGVIYGEAGRLVMAHNGWVMNSDPLQDFADKEHDGRVYFRRELIAWGDSVKLRYGEKPEDSPFLWRHMRQYVELTAEVFDGVRLDNCHSTPLHVAEYMLDCARNVKPDLYVAAELFTNSDHVDNIFVNRLGITSLIREALSAWDSHEQGRLVHRFGGRAVGSFFTPQVTRAQPQVAHALFLDLTHDNPSPIDKRSVFDLLPSAALVSMASCAIGSTRGYDELVPHHIHVVDEARLYAEWEEGEGEGVNASTGLIAARRALNDLHLHLAASGYSEVYVDQMDADVVAVTRHEPHSRKSVILVAFTAFKAPDESSTGRYVKPLRFEGQLEEIILEAVLRHKDHRSTGRPFQTCGGFSRHPQHINGLSDYEASVRCGVPLAQSNVFVSERRDGPYTVLEFGVLPPGTVVAVRVAPHSSQAGALAALRRVTCQHPATDPLGLSPALTDLDLGDFNALLYCCDAEERERCGGGVYDVPGHGPLVYAGLQGVASLLEEVAPRDDLGHALCDNLRAGDWLLDYQWRRLESDPRLSALATIYREALRPVGELPRFLVPAYFEVTVRCMIAAVKRAALARLGGVALSSGVARELSLTGVQLAGAVSSARLPAMSPSLPMLRPARPLSLSAGLPHFAVGYMRCWGRDTFIALRGMFLLTGRYQDARFHILGFAACLRHGLIPNLLDGGRNARFNCRDAVWWWLQSIKQYCTEAPQGYSILTDPVSRIFPKDDSEPAPPGAADQPLHDVMQEALDVHFQGLVFRERNAGRQIDAHMSDKGFNIQIGVDPETGFPFGGNEANCGTWMDKMGSSETAGTRGKPATPRDGSAVELVAMAYCVASWLAAQHRSAKYPYPGVARRHRDGSLTAWTYSQWADRIRRSFERHFWVPAAPSAADQRPDLVHRRAIYKDTHGASQPWADYQLRCNYVVAMALAPELFDPRHAWLALDNVEKLLVGPLGLKTLDPEDWAYRPNYDNSDNSSDPSVAHGFNYHQGPEWTWPLGFYLRARLAFAHDNGQFSKTVAAAYAALAPLVAEMRSSPWRGLPELSNAGGAFCKDSCRTQAWSSSCMLEVLHDLELSRRARPLPLD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: