MonarchBase - Protein-coding gene

DPOGS207148
Transcript	DPOGS207148-TA	1608 bp
Protein	DPOGS207148-PA	535 aa
Genomic position	DPSCF300001 + 4105659-4120979
RNAseq coverage	372x (Rank: top 32%)

Annotation
*Heliconius*	HMEL010548	2e-99	57.89%
*Bombyx*	BGIBMGA000584-TA	4e-103	52.60%
*Drosophila*	PGRP-LF-PA	1e-28	26.78%
EBI UniRef50	UniRef50_UPI000203B05E	4e-27	40.48%	UPI000203B05E related cluster n=1 Tax=unknown RepID=UPI000203B05E
NCBI RefSeq	XP_001601870.1	3e-28	38.15%	PREDICTED: similar to peptidoglycan recognition protein [Nasonia vitripennis]
NCBI nr blastp	gi\|354498472	1e-31	27.18%	PREDICTED: peptidoglycan recognition protein 4 [Cricetulus griseus]
NCBI nr blastx	gi\|156553125	9e-27	38.15%	PREDICTED: peptidoglycan-recognition protein SA-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0008745	1.3e-41	N-acetylmuramoyl-L-alanine amidase activity
	GO:0009253	1.3e-41	peptidoglycan catabolic process
	GO:0008270	1.9e-26	zinc ion binding
KEGG pathway
InterPro domain	[341-508] IPR002502	1.3e-41	N-acetylmuramoyl-L-alanine amidase domain
	[90-278] IPR015510	6.5e-36	Peptidoglycan recognition protein
	[130-268] IPR006619	1.9e-26	Peptidoglycan recognition protein family domain, metazoa/bacteria
Orthology group	MCL21785		Lepidoptera specific

Nucleotide sequence:

>DPOGS207148-TA
ATGTGGAGAAGCAGGGAGGATACGGGACAGACGGTTGCACAGAGTAGGGTCCCCGCGGAGTTGTCCGTGATAGACGAAAGTGCAATCGCCTCGGCCATACCCTCACCCGCGGTCGCCAACCTCAATATAAGCAAGTCTTCCAAGGTCCACATCGGTCCCAAGTTCGTCTCCGTCACTCAAAATGTACAAAATGCTGAAACTCTTAAAGGCCGTTTCTTGGGCCTCGAATTGGTATCAACCAAACAGGCGCGGAGGTTGCGTTGCAGCGTCGCAGTATTTGTATGTTGGGCGCTTGTAGTAGCCTCCGCGCTTGTCATCTATCTCGTCTATGTGGCGTTGCCAAACCAACAATTTCGTCTTGATATAGGTCTAAATGAAACGTGGTACTTACGTCGGGGTGACTGGCAAGCGATGAATCCTTATAACGTACGTTTCTTGCATCTGCCTGTTCCTAAAGTCATCATTGGTCATTCAGCGGCCAATTATTGTAACCAAAGGTACAGATGCATAGAACAGATGATCATCATCCAACAAGACCATTTAAGACGAGAGCTATCTGACATCGGTCCAAATTTCCTCGTCGGTGGCAACGGCTTCATTTTTGAGGGTAGAGGCGCTAACGTCCACGGGGCTATGGTAGGCTCTCTTAACTCTAGAGCTATATCGATCATGTTTATGGGAAATTACATCCATGACCAGCCAGACTCGAAGCAATTTGAACATTTAAACGTTCTTCTGGACGTTTTGGTTAGAGAGGGCGTTCTACGACAAGATTATACGTTGGTCGGCCATTGTCAGGTTAACTTCGATACGATCAGTCCTGGTCCCCATATAATGACCCAGCTAGAGCTGCCCTTGCCGAAGTACCTATGGCAGGTGATAAAGAATAGTTCGCGCACGGAGCGACTATCCTGTGCTGCAGCGCTTATCGTGTTGATTGTCTGCGTTGCCCTCATCGCCTACTTTTCAGTTATGACGAGCAAAACTAAGGAAGAGGACAGAGCTCCACACGAATGGAGAATCACTCGTGAAATGTGGCTCGCACGGCCGTATAACTACACGTATTATACATATGATTTTGAACCGTTGTTGTTGGTCGTGATACAAAACACAGTCGGCCCACAATGTCATCGCTTCCAAGCCTGTGCAGCCGAACTCCGAAATTTGCAAGGCTGGTTCATCAATGACATGGGCTATGACATCCCTTACAATTTTGCGGTTGGTAACGATGGGCGTGTGTATGAAAATCGTGGCTGGTCAGTTGAAGGCGCACATACACGTGGTTATAATCGATGCTCTATGGGCATCGGGTTCCTTGGTGACTACAGAGGAGAGATGGAAAATCACGCAGTTGTAACTCCCGAACAAGAAAACCGAACTCAATTAATACTGGCAGAGGGTGTGAAGCTCGGTTACTTGCGGCGAGATTTCCTAGTAGTAGGAGCCAAAGATATTTCTGACTCGGCCAGTCCTGGCTCCAACCTCTACAATGCAATCCGTCGGTGGCCCAACTACGACCATCAAAACAGGTTCAAAGGACTTTCATGCGAACAGATTCACGAAAAGTACAAGGACACACCTTTATACGAAGTCCCCAAAGATATATAG

Protein sequence:

>DPOGS207148-PA
MWRSREDTGQTVAQSRVPAELSVIDESAIASAIPSPAVANLNISKSSKVHIGPKFVSVTQNVQNAETLKGRFLGLELVSTKQARRLRCSVAVFVCWALVVASALVIYLVYVALPNQQFRLDIGLNETWYLRRGDWQAMNPYNVRFLHLPVPKVIIGHSAANYCNQRYRCIEQMIIIQQDHLRRELSDIGPNFLVGGNGFIFEGRGANVHGAMVGSLNSRAISIMFMGNYIHDQPDSKQFEHLNVLLDVLVREGVLRQDYTLVGHCQVNFDTISPGPHIMTQLELPLPKYLWQVIKNSSRTERLSCAAALIVLIVCVALIAYFSVMTSKTKEEDRAPHEWRITREMWLARPYNYTYYTYDFEPLLLVVIQNTVGPQCHRFQACAAELRNLQGWFINDMGYDIPYNFAVGNDGRVYENRGWSVEGAHTRGYNRCSMGIGFLGDYRGEMENHAVVTPEQENRTQLILAEGVKLGYLRRDFLVVGAKDISDSASPGSNLYNAIRRWPNYDHQNRFKGLSCEQIHEKYKDTPLYEVPKDI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: