MonarchBase - Protein-coding gene

DPOGS202980
Transcript	DPOGS202980-TA	3735 bp
Protein	DPOGS202980-PA	1244 aa
Genomic position	DPSCF300068 - 627859-631995
RNAseq coverage	7x (Rank: top 86%)

Annotation
*Heliconius*	HMEL009536	0.0	58.33%
*Bombyx*	BGIBMGA012267-TA	1e-164	33.02%
*Drosophila*	alpha-Man-IIb-PA	1e-154	32.21%
EBI UniRef50	UniRef50_O18497	2e-166	32.76%	Alpha-mannosidase II n=1 Tax=Spodoptera frugiperda RepID=O18497_SPOFR
NCBI RefSeq	XP_001602695.1	0.0	35.00%	PREDICTED: similar to ENSANGP00000010944 [Nasonia vitripennis]
NCBI nr blastp	gi\|156551605	0.0	35.00%	PREDICTED: alpha-mannosidase 2-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156551605	8e-179	34.91%	PREDICTED: alpha-mannosidase 2-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0003824	5.2e-72	catalytic activity
	GO:0030246	5.2e-72	carbohydrate binding
	GO:0005975	5.2e-72	carbohydrate metabolic process
	GO:0004559	7.2e-58	alpha-mannosidase activity
	GO:0015923	1.4e-44	mannosidase activity
	GO:0006013	1.4e-44	mannose metabolic process
	GO:0004553	5.5e-08	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0008270	5.5e-08	zinc ion binding
	GO:0043169	7.7e-08	cation binding
KEGG pathway	nvi:100118809	0.0
	K01191 (E3.2.1.24)	maps->	Other glycan degradation
InterPro domain	[693-1244] IPR011013	5.2e-72	Glycoside hydrolase-type carbohydrate-binding
	[238-589] IPR011330	5.9e-62	Glycoside hydrolase/deacetylase, beta/alpha-barrel
	[239-583] IPR000602	7.2e-58	Glycoside hydrolase, family 38, core
	[728-1066] IPR011682	1.4e-44	Glycosyl hydrolases 38, C-terminal
	[595-667] IPR015341	5.5e-08	Glycoside hydrolase, family 38, central domain
	[728-794] IPR013780	7.7e-08	Glycosyl hydrolase, family 13, all-beta
Orthology group	MCL34474		Lepidoptera specific

Nucleotide sequence:

>DPOGS202980-TA
ATGGTGCAGAGACCTTACCACTACCACCTCAGCTTCACCAACGACTCTCGACCCATGCAACAACATTTCGTGTACCCAGGTTTTACACAAATGAAATCTATTATACATAAAATGCAGCGTCCAAAAATGTCAACAATCCTAGCGTCACTGGACACGGGAAGAAGTAAATCAACGTACTCAGGAATGAATATTGCCAAAAAATCCGGAATCCATCCGTTCGAGCTGAGACTCACAAGAAATACCTTTAGTAACACCTCCAACCTTCCTCGCAATAAAGACGGTCATTTAATTTTTCCTGATTTAAACACTCTTGAACATTTCAATTATAACAATAGTAATCCGGTAGATACTTATGAGAACCACATTGGCTCGGTTCCAACCTCTAACTTTTTTCCCCTCGTTCAAAACAACCCTTCACGGACTACTGCACCAGAAGCTAGCGTAAGCGTCTTTCCTCTAGTAACTTCGTCGACCACGGATGTAACCGAGGATAGCGGTCTACTTATCAAAAGTATCTACAACTCTAGCACTAATAAAACCGCTAATGATTTCGAAGTCCCGAAACAAAAATACACGATAGTAGATTTCGATCCGCAAGAAGAAAAAGCGGACTTTTTAATAGAGGAACGTCCCATCGAGACGCTGGTGTCATCCCACAATTACAATACGAGTATGTCGACAGCACCCTTCATTTGTACACATAACTATGAGGCTAAAGCTGACATAGATGCTCAAGAAAAATTTTCTGAATTTAACATAGAGGTGATACTGGTTCCGCGGTCGGACGTTCATTCGATTTGGAAAAAACCATTTGAAAAGTTACATAAAAATTCCGTCAGATTTATTATATCAAATATAGTAAAAAAATTACAGTTTTATCCAAATCTAACATTTACTTGGAACGAGGTATCACACCTTAGTCAATGGTGGAAAAGTGCTCGTCAAAAAAGTCGCACCGCACTTCGTAAACTAGTAAAAGAAGGAAGATTAGAAATTACAACAGGCGCCTGGGTAGAAACAGACGAGGCTACCTCACACTTGTTTGGGATTGTTCACCAATTGATGGAAGGGCACCAGTGGTTGCAGTATAACTTAAATTATTCGCCCGACGTGGCGTGGCTTACGAATAGCGTAACCCACAGCCCCACTCTGCCCTATCTTCTATCAGCATCCGGGATAACCAGTTTGGTTGTAACAAATTTACATTTCGCTTGGCAGCAATATTTAACAGAGTATCAAGAAACCAACTTCATGTGGATTCAAAACTGGGATACCGACAAAACGACTCAGACAACTCTTAACGAAGCCCTTAAAAAAATAGGCAACGACCGGTTCCAAAAACATTCTGTTTTAACACACTATCTACCATTTAATTCTGCCGGAGTCAGAGCTTCTTGTCCTCAAGGTGATATTTGCAGCGAGGAATTTAATTTTGTGAATTCCGACAACCATCTGGATATCAATTCTTTCAACGTTAAAGAAAGGTCTGAGAAAATACTTGAACAGTATTCTAAAACTGGAACAACGTCATCTCACAACGTGGTGCTGGCGCCTATAGGCAGCTCCTTCAGTTATGAATTGCAATCCGAATTTGACTTACAGTATAATAATTACCAGAAAATTTCGGAATTTGTGAATGCGAATCAAGATATTTATAAAGCAACGATTGATTTTGGAACACCGAAAAATTATTTTGAAAGTTTGTTTTCTAGTCCAACATCTTATCCCACTTTAAAAGGAGACTTCTTGAATTTTGCTGATATCAGTGACGGCAGCCCAGCTTACTGGACGGGGTTCTTTACCACTAGACCTCAATTTAAGATTTTGCTGAGACGTCTTCAGGCAACATTACGCAGCTCAGAAATTTTATTTACCTTCGCAATGAGCTATAACGTGTTGAAAAAAAATGACGTGTCTACATTGTTCGGCCGATTGGTGAATGCTCGCGAAACTGTAGCCCGTCTCCAGGACAGGAACGTCGTCGGCGGCACTTTAAAGGCAGTGGCGCTGCGATACGCTCACAGAGAGATAGTTAAGACAGCACAAGACTGCTGGTACATACAAGAGGTAGCGGCCAGCTTGCTCAGCTCTAAACCTGACCAAAACACAACGTATCTGAAAAAATACGTCTATAGAGAGGGAGAATTTATTTCTTCTTTTAAGTCCGTCACGTCAGGAGATCAAATATATATATTTAATTCTCTCAGTCACGAAAGAACTGAAATAGTAGAATTGGTAAGTAGGTACTCTGGCATAAGAATTTTGGATCACAATAAGAAAGACGTTAGCCTTCAAATAAAACCAACCTTTAAGTATGGCTTTCAAAATGTCGTTAAGATATCCAAGCATTTTTTTCGTATCATATTTGTTGCTGTCATTCCTCCGTTTTCATTTCAACTTTTTAAGATAAAAGATACCTTTGATACGACACAGAGTCTCTCTACTTTATATTGTACGGCTTGCGTTGCCGAGGAGGACGATGTCACTCCACTGTCTCCATTCACCTTGCATCCGGTCGAGACGGGAGACGTACAGCTGGAGAACTATAAGTATCGTCTTATTTTTGATGAATACACAGGTTTTTTTAAGACGGTCACTGATAAGTCTACTAATATTGAAAAACAAATTTCGATTGAGTTCGGTGCTTTCAGAAGTTCACATATAAACTCTGGTATGTTTTTATTTAATACAAATGTTTCAAAACCACTGGAGGATATCTTATCTTCTTATAAACGAAATAATGGTTCAAAAGTTGTGATGATCATATCCGGATTCATTACCACCGAATTCATATTATTTTATGGCAAATTTTTATACCATAGTGTTACAATTTATAATTTAGTGCACAGTCCTTTGTCCAGCGCTATAAGAGTAGAAACAAAAATCGATTACGACCTGTCACCGAAACATCGGGAACTGGAGGTGTTTATGTCGATACAGACAGATATAAACAACGGCAACCCTCCGGAGATCGTTATTGATAATAATGGTTTTCAATACACTGCACGAACTATCAACATGAGCAGAAGGGTGGAATCCAACATGTACCCTATGACGAGTATGGCCTTTATACAGGATCACAAAAATCGTTTAACTATTATAACTGATCACGCACAAGGTGTGACAGCGTTTCAAGAAGGTCAACTGATAATTATGATGGATCGAAGAATACTCTTCGACGACGGTCGAGGGTCGAATGAAGGCCTCGCAGACAACACCGCCGCCTGGCAGACACATTACATACTGCTGGAGACCTTTACCGCACCTTACACCAGCTATCAAAAAGAAGAATTGAAGATGTCCTTGATGTTACCCAGCTTTTCAGCAATATATTTAGCCAACATTTTAAATTTTTTGATAGATATATACTTTATAGATAATAACAGAACTCATTCTTGTCAATTTGCATTCTTGCCACTGGTTAAGATATCATTTCCTTGTGACGTCACTGTCCTTAATTATAGAGCGATTCTAAATAGAGGAACTCCCGATTATTATATACCCAATATTGCATTATTGACACTACACAAACAAAGCTTCTCATGTCTAATAGAACACAATAGTTTTATTGATTGCAACGGGGATAGTTCGTTTATTTTGCAACAGATTTTACGTAATGCCAAAGCTGTTTACCAGACCAACTTAGTGGGTACATCGGAGGGTGTACCTATAAGTATTTTAAATAAAGCCAACTTTCCACCCATGGAAATTTCAACTTTTAGAATACACTTTTAA

Protein sequence:

>DPOGS202980-PA
MVQRPYHYHLSFTNDSRPMQQHFVYPGFTQMKSIIHKMQRPKMSTILASLDTGRSKSTYSGMNIAKKSGIHPFELRLTRNTFSNTSNLPRNKDGHLIFPDLNTLEHFNYNNSNPVDTYENHIGSVPTSNFFPLVQNNPSRTTAPEASVSVFPLVTSSTTDVTEDSGLLIKSIYNSSTNKTANDFEVPKQKYTIVDFDPQEEKADFLIEERPIETLVSSHNYNTSMSTAPFICTHNYEAKADIDAQEKFSEFNIEVILVPRSDVHSIWKKPFEKLHKNSVRFIISNIVKKLQFYPNLTFTWNEVSHLSQWWKSARQKSRTALRKLVKEGRLEITTGAWVETDEATSHLFGIVHQLMEGHQWLQYNLNYSPDVAWLTNSVTHSPTLPYLLSASGITSLVVTNLHFAWQQYLTEYQETNFMWIQNWDTDKTTQTTLNEALKKIGNDRFQKHSVLTHYLPFNSAGVRASCPQGDICSEEFNFVNSDNHLDINSFNVKERSEKILEQYSKTGTTSSHNVVLAPIGSSFSYELQSEFDLQYNNYQKISEFVNANQDIYKATIDFGTPKNYFESLFSSPTSYPTLKGDFLNFADISDGSPAYWTGFFTTRPQFKILLRRLQATLRSSEILFTFAMSYNVLKKNDVSTLFGRLVNARETVARLQDRNVVGGTLKAVALRYAHREIVKTAQDCWYIQEVAASLLSSKPDQNTTYLKKYVYREGEFISSFKSVTSGDQIYIFNSLSHERTEIVELVSRYSGIRILDHNKKDVSLQIKPTFKYGFQNVVKISKHFFRIIFVAVIPPFSFQLFKIKDTFDTTQSLSTLYCTACVAEEDDVTPLSPFTLHPVETGDVQLENYKYRLIFDEYTGFFKTVTDKSTNIEKQISIEFGAFRSSHINSGMFLFNTNVSKPLEDILSSYKRNNGSKVVMIISGFITTEFILFYGKFLYHSVTIYNLVHSPLSSAIRVETKIDYDLSPKHRELEVFMSIQTDINNGNPPEIVIDNNGFQYTARTINMSRRVESNMYPMTSMAFIQDHKNRLTIITDHAQGVTAFQEGQLIIMMDRRILFDDGRGSNEGLADNTAAWQTHYILLETFTAPYTSYQKEELKMSLMLPSFSAIYLANILNFLIDIYFIDNNRTHSCQFAFLPLVKISFPCDVTVLNYRAILNRGTPDYYIPNIALLTLHKQSFSCLIEHNSFIDCNGDSSFILQQILRNAKAVYQTNLVGTSEGVPISILNKANFPPMEISTFRIHF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: