MonarchBase - Protein-coding gene

DPOGS201579
Transcript	DPOGS201579-TA	2412 bp
Protein	DPOGS201579-PA	803 aa
Genomic position	DPSCF300152 - 369434-377704
RNAseq coverage	251x (Rank: top 42%)

Annotation
*Heliconius*	HMEL008106	70.92%
*Bombyx*	BGIBMGA012142-TA	64.59%
*Drosophila*	CG1597-PB	49.44%
EBI UniRef50	UniRef50_A9UNC0	49.56%	RE03215p n=26 Tax=Neoptera RepID=A9UNC0_DROME
NCBI RefSeq	XP_972740.1	52.18%	PREDICTED: similar to CG1597 CG1597-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91091700	52.18%	PREDICTED: similar to CG1597 CG1597-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91091700	50.92%	PREDICTED: similar to CG1597 CG1597-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0004573	2.9e-263	mannosyl-oligosaccharide glucosidase activity
	GO:0009311	2.9e-263	oligosaccharide metabolic process
	GO:0003824	8.4e-48	catalytic activity
KEGG pathway	tca:661492	0.0
	K01228 (GCS1)	maps->	Protein processing in endoplasmic reticulum
			N-Glycan biosynthesis
InterPro domain	[54-803] IPR004888	2.9e-263	Glycoside hydrolase, family 63
	[331-799] IPR008928	8.4e-48	Six-hairpin glycosidase-like
Orthology group	MCL15204		Single-copy universal gene

Nucleotide sequence:

>DPOGS201579-TA
ATGGTCAAACATAGGAAGACTGTCCAGTATAAACATGCCAACAACGAGTCCAGCAGCAGTTCCGGGGCAAGCGATACATCTATTGCAGGACGTGCATTTCACTTGTTATCAGTATGGAAGACTGGTGCCGGCTTCATATGTCTCGCGATAGCTGTGTACGTGGGCACCCTGGGTTACCTGGAAACGAGGGTCAATACTCCGCTCGATGAGGAGAAGGTGGTTCAAGAAACGGGACTGTCGGTCCCAGAGCGTTACTGGGGTTCCTATAGGCCGGGGGTATACTTTGGAATGAAGTGCCGGGAGCCTCGTTCTCCAGTTTTCGGAATGATGTGGTATGAACTAGCGGCAGCAGCTCATAAGGGGATCAGGCATTTGTGCGAACAGAATGATAACCTGCCAACGTACGGCTGGCTGCGTCACGATGGTTTGACCTTCGGTGAGCAGCTGATATCAGATCCGCCCCACCAGATACACACATCCTTCATCAAGACCCCGGGGGGAGAACACGGTGGACATTGGACGGCCAGAATTAATATCACAGCAACGGGTAAATCCGCGCCGCCATTAGTTCTGATCTGGTACGCAGCCCTGGACGAGTCTCTGGGGTCGGGATCTCATTCCCGTCTCTGGGCGGAGCGTGGCACCCTGATGGGGCACACCCCCGCCCTGGGGAGATTCAGGGTGCATCTGGTGCCGCATTCTGGCATACTCATCCACTCGTCGCTCTCGGAGGCTCATTCCGCTGGTCTCCACCTCCTCAAGGAGAAGTTCTACTCGCTGCTGAGGATCGAGGACCAGCCGTACCTTGGAAGGCTGGCTGTGCTGGGGCCGGATGAAGAGATTGCTGATTCGGACAAGGAGGTGAATTTCGTGCCTATCCAGATGTTGGTGGAGACGCCGTTCGTTCTGGACGTGGTGTACACCACCGAGGACCTGCCGACACCGCCTGTCCGAGGAGACGAGTACACCAAAACCATGGAGAAGCTGAAGATGGGTTATGATGAGGAATTCGAGAGGATCTTCAACCTGGAGAAGAAGGGTTATAGCGCCCAGGATATATCGATAGCAAGGGCTGCGCTGTCTAACATGGTGGGGGGTATGGGCTACTTCTATGGCGCGAGCAGGGTGCAGTCCAAGTACACCAGGGAACCGGTCCCGTACTGGAGAGCTGCGCTTCATACGGCTGTACCCAGCAGATCGTTCTTCCCGCGCGGGTTCCTGTGGGATGAGGGTTTCCACCTGCTGCTGGTGTCGTGGTGGTCGGCTGACCTGGCCCTGGACGTGGCCGCTCACTGGCTGGACCTCATCAACGTGGAGGGTTGGATACCGCGGGAACAGATACTAGGAGTCGAGGCGTTGGCGAGGGTGCCCAAGGAGTTCGTGGTGCAGCACAATTCTGCTGCAAACCCTCCAATGCTGCTGCTGTCTCTGGCCAGGCTGGTGAGGTCCAGGCCGCATCTGTTCACCGAGACGCCCTACAGACAGACCTTGGACAGAATGTTCCCTAGGCTGCAGGCGTGGTACCAGTGGTTCCTGACGACTCAGAAGGGAGACGAGCCCACCACGTACAGGTGGCGCGGCCGGGAGGATGACGGGTTCCAGCTCAACCCGAAGACCTTGACGTCTGGACTCGACGATTACCCCAGGGCGTCTCATCCCAGCAGTATCGAGCGCCACGTGGATCTCCGCTGCTGGATGTACGCTGCCGCGGATGCTATGGCGGTCATAGCGCGCGCCCTGGACCGGGATACTGACAAGTTCGAGGATATGAAGGAGCAGCTGGGTAACGAAGACCTGCTGAACGAGTTGCACTGGTCGCCGCACACGCAGACATACGCCGACTACGGTCTACACACGGACGGCGTGAGGTTCGTCCGCCAGCAGGCCAGGGACCCTCAGGAGGGAGCCAGGGTCGTGAGGAGCGTCACCATAGCGCCGCAGCCGAGGCTGGTGACGTCTGCGTTCGGGTACGTGTCACTATTCCCCATGCTGATGAAAGTTCTCAAACCCGAGAGCGACAAGCTGGGGAATATCCTGGAAATGCTGGACAAGCCCGACCTGCTGTGGTCTCCGTACGGACTGAGATCTCTATCCAAGCTGTCTCCGCTGTACATGAAGAGGAACACAGAGCACGACCCCCCGTACTGGCGGGGTCAAGTGTGGATCAACATTAACTACCTGGCCATATCAGCCCTCCACCACTACTCGGTCTCTGGGGGACCACACGCTGCGAGGGCGAAGTCCCTGCACCAGAGACTAAGAGATAATGTTGTCAGTAATATCCTGTCGGAGTACAAAAGAACTGGTTACCTCTGGGAGCAGTACTCGGGTGAGGATGGCAAGGGCAGTGGGTGTAGACCGTTCACAGGGTGGACGGCGTTGGTCGTGCTGTTGATGGCTGATGAGTACTAG

Protein sequence:

>DPOGS201579-PA
MVKHRKTVQYKHANNESSSSSGASDTSIAGRAFHLLSVWKTGAGFICLAIAVYVGTLGYLETRVNTPLDEEKVVQETGLSVPERYWGSYRPGVYFGMKCREPRSPVFGMMWYELAAAAHKGIRHLCEQNDNLPTYGWLRHDGLTFGEQLISDPPHQIHTSFIKTPGGEHGGHWTARINITATGKSAPPLVLIWYAALDESLGSGSHSRLWAERGTLMGHTPALGRFRVHLVPHSGILIHSSLSEAHSAGLHLLKEKFYSLLRIEDQPYLGRLAVLGPDEEIADSDKEVNFVPIQMLVETPFVLDVVYTTEDLPTPPVRGDEYTKTMEKLKMGYDEEFERIFNLEKKGYSAQDISIARAALSNMVGGMGYFYGASRVQSKYTREPVPYWRAALHTAVPSRSFFPRGFLWDEGFHLLLVSWWSADLALDVAAHWLDLINVEGWIPREQILGVEALARVPKEFVVQHNSAANPPMLLLSLARLVRSRPHLFTETPYRQTLDRMFPRLQAWYQWFLTTQKGDEPTTYRWRGREDDGFQLNPKTLTSGLDDYPRASHPSSIERHVDLRCWMYAAADAMAVIARALDRDTDKFEDMKEQLGNEDLLNELHWSPHTQTYADYGLHTDGVRFVRQQARDPQEGARVVRSVTIAPQPRLVTSAFGYVSLFPMLMKVLKPESDKLGNILEMLDKPDLLWSPYGLRSLSKLSPLYMKRNTEHDPPYWRGQVWININYLAISALHHYSVSGGPHAARAKSLHQRLRDNVVSNILSEYKRTGYLWEQYSGEDGKGSGCRPFTGWTALVVLLMADEY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: