MonarchBase - Protein-coding gene

DPOGS206161
Transcript	DPOGS206161-TA	3087 bp
Protein	DPOGS206161-PA	1028 aa
Genomic position	DPSCF300028 + 1846328-1854271
RNAseq coverage	4x (Rank: top 89%)

Annotation
*Heliconius*	HMEL010746	3e-127	44.19%
*Bombyx*	BGIBMGA001728-TA	1e-138	43.16%
*Drosophila*	CG9463-PA	3e-129	32.17%
EBI UniRef50	UniRef50_Q8MS44	3e-123	30.82%	RE08556p n=30 Tax=Sophophora RepID=Q8MS44_DROME
NCBI RefSeq	XP_002047646.1	6e-134	31.87%	GJ11812 [Drosophila virilis]
NCBI nr blastp	gi\|195473147	9e-125	31.16%	GE10763 [Drosophila yakuba]
NCBI nr blastx	gi\|195146682	2e-93	36.54%	GL19134 [Drosophila persimilis]

Group
Gene Ontology	GO:0003824	3.4e-74	catalytic activity
	GO:0030246	3.4e-74	carbohydrate binding
	GO:0005975	3.4e-74	carbohydrate metabolic process
	GO:0015923	3e-58	mannosidase activity
	GO:0006013	3e-58	mannose metabolic process
	GO:0004559	1.3e-56	alpha-mannosidase activity
	GO:0043169	1.7e-19	cation binding
	GO:0004553	3.3e-05	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0008270	3.3e-05	zinc ion binding
KEGG pathway	dvi:Dvir_GJ11812	2e-133
	K12311 (MAN2B1, LAMAN)	maps->	Lysosome
			Other glycan degradation
InterPro domain	[416-1026] IPR011013	3.4e-74	Glycoside hydrolase-type carbohydrate-binding
	[417-1019] IPR011682	3e-58	Glycosyl hydrolases 38, C-terminal
	[2-290] IPR000602	1.3e-56	Glycoside hydrolase, family 38, core
	[2-295] IPR011330	5.2e-53	Glycoside hydrolase/deacetylase, beta/alpha-barrel
	[402-496] IPR013780	1.7e-19	Glycosyl hydrolase, family 13, all-beta
Orthology group	MCL26410		Lepidoptera specific

Nucleotide sequence:

>DPOGS206161-TA
ATGAAACAAATCCTGGATTCCACTATTAGTGAGCTGTGGGCCTACAAAGAGAGGAGGTTCATTATAGCAGACAGTGAACTGCCATATTTTTTTCACTGGTGGTCCAAAAGGGACGGGACAGTACGTAGAATGGTGTACGAGCTGGTCCGCCAGGGTCGGCTCGTGATCGTGGGCGGAGGCTGGGGCCTGCAGGACGAGACCACCACGTACTACCAGTCCGTCATAGACAGCTACACGTACTCCCTCAGGAAGATCAACGCTACCTTCCTGGAGTGCGGCCGGCCGCTGGTCGCGTGGCAGGCTGATAACTTCGGCCACTCCCGGGAGTTCGCGTCCCTGGTCGCCCTCATGGGCTTCGACGGACTCTTCATCAACCCCATCAGCTTCGACGACGAACTCATCAGGATGGAGAGGAAGGGACTCGAGTTCCTGTGGAGGGGCAGCGACGACCTGGGCGATAACCCGCTCCCCGCAGGCCCGGAGACTGACATATTCACCCACAAGCTGTTCGACGGCTACTGGTCGCCCCCCGGCTTCTGCTTCGGCAGCATGTGCTCGGACCCGCTGCTCGTCACCAGCGATACGCTTTTTAATAACGCTAAAGAGAGGGCCCAGCTGTTCATTGAGAAGATCCGTTTCCGCCAAGCTCCTAACTATCAGACCAAGCAGGTGATGGTGATGATGGGTCAGAGGATGGGCTACGCGGACTCCAAGCTCTGGTTCAATAACATCGAGAAACTTATAAGTTATGTCAACGAGGAAGCGTTCGAAGATAAAATGTACGCCATGTACTCGACTCCGATGTGCTACTTGCAGGCGGCCTACCAAGAGAACCCAATTTTGGAAACGAAACAGGACGACTTCATACCGTTCGCGTACGACCAGGACTCCTACATGACCGGCCTCTTCACCTCCAGACCTAGCTTCAAGTACTTGGTTAGAGAGGCCAACGTGTTCCTACAGATAGCGAAACAGTTGCAAGTCTTGACCAACTTGAGAAACAACGACGGAATATTCGAAGACTTCATTCCAGGCGTGGCGCAGGACCACAATATCATAACGGGCGCCATGCGGCCCTACGCCAAGAACTACTACACTAAGTACCTCAGCATCGCCATACAGAAGTCCACCATCGTCGCGAAGCAGGCCTTCAACAAAGTGCGCGCCAACAACCCTTCGCTGCTCACCGACTACACGCTGTGTTACCTGAACGAGTCTTCGTGTCCCAACACTAAGGTCCCGTATTTTTATATAACGGTATACAATCCCTTGGCTTGGAACGTCACGATGCCTGTGAGGGTGCCGGCCTTCAAAAGAAGATACAACGTCTACGATCCTCACGGTGAAGTAGTCCCCTCGGCGTTAATGCGAATACCGCAGCAGGTCCTGAGCATACCCGGCAGGTTCGCAGAACACGACCTGGAGCTGGTCTTCATCGCTCCAGAACTTCCAGCGCTCGGCTTCAGGTCCTACTACATAGAGGAGGTGAAGAGAAACAAACGATCACTCATCAAGAAGATCGGCAAGAACAAACAGAAGTACTTCATAAGACAAGCGCCGAGGACAGACAACGCCACGCTCCTAGACGATCCCGCGTACGACGAGGCTGAGACTCAGCCGGAAGACATCGGAGAAAATAGGGCTGAGGGCTCCGAGGACGGGCACGACGCCACGAGAAGACCGGAAGTGACGTACGAGGAGCTGGAACACACGGACGGTACGGCCGACACCACACCCACCACCACACGCACCACCACCAGAGAGACGCGGACAGGCGGCGACAGCAGCTGGGTGGAGTCGAGCGACACCTACATCGGAAACAAGTACATACGAATAAGCCTGGACAGTCACCGCAAAGTGTCGTCTATGAGTCTGGCCAACGGAGTCAACACGTCGCTGGACATACAATATTACTTCTACGTGTCCGACGACCCCGACACGGTCGAAAACCAGAAGCGACGGCCCGGAGCCTACATCTTCAGACCTCTGGACGTCAAGCCGGAGGCGATCATAGACTACATCGACACCAAGGTCTACAAGAGCGGCGAGGTGCAAGAGATACATTCCAGGTACTCGGAGCACGCGTCGTTCGTGTTGCGCTTGTACAGAGACAGCGTCGTGTGCGAACTGGACTGGATCCTCGGCCCGCTGCCCGCGGACGGGCTGGGCCGGGAGCTCTTCATACGGTACACCACCGACCTCGAGAACGACGGAGTGTTCTACACGGACGCGAACGGCAGGCAGGTCGTCAAGAGAATCAGACACACGAGACCCTTGTACCGACCGTACCACCTGGACCCTGTCGCAGGCAACATCTATCCCGTCACAACAAGAATATATATAGAAGATTTACGGAAGAATCTCCGCTTGTCCATATTCAATGACAGGTCACAAGGAGGGACCTCGCTCCTCGAGGGGTCGGTGGACCTCATGTTGGACAGACTCATCTACACCGACGACAGCGGAGTACAGACCTTCCTCAACGAGACCGTCGACGGCAAGGGAATAGTCGTCCGCGGAACGCATTACCTGTACCTCACCAGAGCCAGCCACAGACCTAATAGAGTCTTCGAAAAGAGATTCTCAAAGGAAATAGAACTGAAACCTCAGATATTCTTTTCACGAATCCGTCAAATGGTGAGGAAGGATCGCTGGCTCGGCAGGAGGAATGAGTACTCGGCCCTCAAGACGAAGCTGCCCATCGGCGTCCACATCCTGACGATACAGGAGTGGAACGAGAGGACTCTGCTGATACGGCTCGAGAACTACTTAGAGAAAGTCGACGTCATCAAGAGCGGCGTCAAGGAAGTGCAGCTGAAAGATTTGTTCGTGAACATAGTCCCGGACGAGGCGGTCGAGATGAAGCTGGCCGCGAACATCCGCCTGAAGGATTGGACGCAGATACAGTGGCAGAGGAACGGCTCGTTCGTGAGCAACTTCAACGACCACTACGGAACCACGAAGACCGCGGAATTCAGCTACGAGCGCATGAAGCCCTTGAAGAAGGTCGACGTCCGCGCCGGCATCCTGCTGTACCCGCAACAAATACGGACCTTCGTCGTGTCTTACCGCGCACTCCAGCCGTGA

Protein sequence:

>DPOGS206161-PA
MKQILDSTISELWAYKERRFIIADSELPYFFHWWSKRDGTVRRMVYELVRQGRLVIVGGGWGLQDETTTYYQSVIDSYTYSLRKINATFLECGRPLVAWQADNFGHSREFASLVALMGFDGLFINPISFDDELIRMERKGLEFLWRGSDDLGDNPLPAGPETDIFTHKLFDGYWSPPGFCFGSMCSDPLLVTSDTLFNNAKERAQLFIEKIRFRQAPNYQTKQVMVMMGQRMGYADSKLWFNNIEKLISYVNEEAFEDKMYAMYSTPMCYLQAAYQENPILETKQDDFIPFAYDQDSYMTGLFTSRPSFKYLVREANVFLQIAKQLQVLTNLRNNDGIFEDFIPGVAQDHNIITGAMRPYAKNYYTKYLSIAIQKSTIVAKQAFNKVRANNPSLLTDYTLCYLNESSCPNTKVPYFYITVYNPLAWNVTMPVRVPAFKRRYNVYDPHGEVVPSALMRIPQQVLSIPGRFAEHDLELVFIAPELPALGFRSYYIEEVKRNKRSLIKKIGKNKQKYFIRQAPRTDNATLLDDPAYDEAETQPEDIGENRAEGSEDGHDATRRPEVTYEELEHTDGTADTTPTTTRTTTRETRTGGDSSWVESSDTYIGNKYIRISLDSHRKVSSMSLANGVNTSLDIQYYFYVSDDPDTVENQKRRPGAYIFRPLDVKPEAIIDYIDTKVYKSGEVQEIHSRYSEHASFVLRLYRDSVVCELDWILGPLPADGLGRELFIRYTTDLENDGVFYTDANGRQVVKRIRHTRPLYRPYHLDPVAGNIYPVTTRIYIEDLRKNLRLSIFNDRSQGGTSLLEGSVDLMLDRLIYTDDSGVQTFLNETVDGKGIVVRGTHYLYLTRASHRPNRVFEKRFSKEIELKPQIFFSRIRQMVRKDRWLGRRNEYSALKTKLPIGVHILTIQEWNERTLLIRLENYLEKVDVIKSGVKEVQLKDLFVNIVPDEAVEMKLAANIRLKDWTQIQWQRNGSFVSNFNDHYGTTKTAEFSYERMKPLKKVDVRAGILLYPQQIRTFVVSYRALQP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: