MonarchBase - Protein-coding gene

DPOGS206782
Transcript	DPOGS206782-TA	1578 bp
Protein	DPOGS206782-PA	525 aa
Genomic position	DPSCF300001 - 5681267-5688110
RNAseq coverage	340x (Rank: top 34%)

Annotation
*Heliconius*	HMEL003844	1e-131	79.93%
*Bombyx*	BGIBMGA000564-TA	0.0	84.58%
*Drosophila*	CG11874-PA	6e-165	61.10%
EBI UniRef50	UniRef50_E2BM44	2e-170	61.87%	Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase n=8 Tax=Formicidae RepID=E2BM44_HARSA
NCBI RefSeq	XP_971080.1	0.0	66.81%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|91078826	2e-180	66.81%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastx	gi\|91078826	2e-177	65.67%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	1.5e-272	membrane
	GO:0005509	1.5e-272	calcium ion binding
	GO:0004571	1.5e-272	mannosyl-oligosaccharide 1,2-alpha-mannosidase activity
KEGG pathway	tca:659709	0.0
	K01230 (MAN1)	maps->	High-mannose type N-glycan biosynthesis
			Protein processing in endoplasmic reticulum
			N-Glycan biosynthesis
InterPro domain	[27-522] IPR001382	1.5e-272	Glycoside hydrolase, family 47
Orthology group	MCL14464		Single-copy universal gene

Nucleotide sequence:

>DPOGS206782-TA
ATGGCTAGCTTAGATACAAGGATAGACCTAGGAGGTCAACAAAATTCCTGGAATGGATCTGATGGCTCCTTAAAACATTCCGAACACTTAATCTCACATAGAAAAATAGTTAGGGAGTTGTCAAACGCTTCGTCACTTGTAACCGATCCCCCACCAAATGCATCGCCCCTGAAAAAAATTAATATTGACAGTGAAATTATACAAAAGCCATTATTCACAGGTCCGGGTAACGCTCGTCAGTATGCAGTAGTTGAATCATTCAAGCACGCATGGAAAGGCTATAAGGAACACGCTTGGGGTCACGACAACTTAAAACCAGTCTCCGGCATGGCATTTGATTGGTTTTCACTGGGTTTGACCATAGTCGATGGATTGGACACGGCTTACATCATGGGACTGAATGAAGAATTCCAAGAAGGCAAGGAGTGGATCAACAACGAGCTGATATTCACAAAGCAGAAGGACGTTAATTTCTTTGAAGTGACCATTAGAGTGCTGGGTGCTCTTCTAACTAATTATCACTTTACAGAAGATAAAATGTTTTTAGATAAAGCGAAGGATCTCGGTGAGCGACTGATGTCAGCGTTCTCATCTCCGTCCGGGATCCCGTACTCAGACGTGAACCTCGGCTCGCGGACGGCTCACGCCCCTGAGTGGGCTCACTACAGCACCACCGCTGAGGCCACCACGATACAACTAGAGTTCAGGGAGCTGTCTAGATCATCAAACAATCCTGTATTCGAGGATGCTGCAGCTGCGGTGTCTGAAAAGATTCATCAACTGCCAAAAAAGCACGGCCTGGTGCCCATCTTCATCAACCCTAACACTGGTCAGTTTGCACCTCACGCCACCATCACGTTGGGGGCACGTGGAGACAGCTATTACGAATATCTATTGAAGCAATGGCTTCAAACCGGAAAGACTATAACTTATCTGGTGGATGATTACATGACTGCTATAGAGGGCGTGAGAGAGTACCTCGCTAAACGTTCATCGCCAAACAAAAGATTATTTATCGGCGAATTATCCTCTGGTTCTGAGGCATTCAATCCCAAAATGGACCATTTAACATGTTTCCTCCCCGGTACGTTGGCGCTGGGTCATATGAACGGTCTACCCGACTGGCACATGACCATGGCCGAAGAATTGCTTTACACCTGCTACCTGACTTACGCTGCCCACCCTACGTTCCTAGCCCCGGAGATCACACATTTTAATATGGTGAGTACGACAGAGGACATGTACACAAAGACAGCTGATGCTCATAATCTACTGAGGCCCGAATTCGTCGAAAGCTTATGGTATATGTATCAAATAACTGGCAACACCACATATCAAGACTGGGGATGGCAGATATATCAGAGTTTCGAGAAATACGCGAAAGTACCAAATGGATACACATCCCTTAACAATGTGAAATCTGAGAAACCAGTACTAAGGGACATGATGGAATCATTTTTTCTCTCTGAAACACTCAAATATCTGTACCTTCTGTTTAGTGATGATAGATTTATAATTGATTTGAATAAATACGTCATCACTTCTGAAGCACATCCATTGCCAATACACAAGAATTAG

Protein sequence:

>DPOGS206782-PA
MASLDTRIDLGGQQNSWNGSDGSLKHSEHLISHRKIVRELSNASSLVTDPPPNASPLKKINIDSEIIQKPLFTGPGNARQYAVVESFKHAWKGYKEHAWGHDNLKPVSGMAFDWFSLGLTIVDGLDTAYIMGLNEEFQEGKEWINNELIFTKQKDVNFFEVTIRVLGALLTNYHFTEDKMFLDKAKDLGERLMSAFSSPSGIPYSDVNLGSRTAHAPEWAHYSTTAEATTIQLEFRELSRSSNNPVFEDAAAAVSEKIHQLPKKHGLVPIFINPNTGQFAPHATITLGARGDSYYEYLLKQWLQTGKTITYLVDDYMTAIEGVREYLAKRSSPNKRLFIGELSSGSEAFNPKMDHLTCFLPGTLALGHMNGLPDWHMTMAEELLYTCYLTYAAHPTFLAPEITHFNMVSTTEDMYTKTADAHNLLRPEFVESLWYMYQITGNTTYQDWGWQIYQSFEKYAKVPNGYTSLNNVKSEKPVLRDMMESFFLSETLKYLYLLFSDDRFIIDLNKYVITSEAHPLPIHKN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: