MonarchBase - Protein-coding gene

DPOGS206910
Transcript	DPOGS206910-TA	1230 bp
Protein	DPOGS206910-PA	409 aa
Genomic position	DPSCF300001 - 1570635-1578554
RNAseq coverage	502x (Rank: top 25%)

Annotation
*Heliconius*	HMEL009426	9e-83	74.32%
*Bombyx*	BGIBMGA012866-TA	2e-36	55.20%
*Drosophila*	PGRP-LB-PD	3e-49	55.28%
EBI UniRef50	UniRef50_A7BIV1	4e-76	63.24%	Peptidoglycan recognition protein-D n=4 Tax=Obtectomera RepID=A7BIV1_SAMCR
NCBI RefSeq	XP_969556.1	1e-55	60.62%	PREDICTED: similar to putative peptidoglycan recognition protein [Tribolium castaneum]
NCBI nr blastp	gi\|154240658	1e-75	63.24%	peptidoglycan recognition protein-D [Samia cynthia ricini]
NCBI nr blastx	gi\|315507103	1e-75	69.73%	peptidoglycan recognition protein D [Ostrinia nubilalis]

Group
Gene Ontology	GO:0008745	4.9e-86	N-acetylmuramoyl-L-alanine amidase activity
	GO:0009253	4.9e-86	peptidoglycan catabolic process
	GO:0008270	2e-65	zinc ion binding
KEGG pathway
InterPro domain	[226-387] IPR015510	4.9e-86	Peptidoglycan recognition protein
	[224-389] IPR002502	3.5e-70	N-acetylmuramoyl-L-alanine amidase domain
	[225-368] IPR006619	2e-65	Peptidoglycan recognition protein family domain, metazoa/bacteria
Orthology group	MCL17883		Insect specific

Nucleotide sequence:

>DPOGS206910-TA
ATGGCAGCTTGTGGTAGCGAATTATTATTGGTGCTAGTGACGATTAGCGTCTGTTTAGTGGACAGCAATCCAAACGTATACGGTTTAGCTCGAACCCAATCTTACGTGTACTACACGAAAAGCGACTGGGGTGGTCTGCCGTCGACCGACGTTCGGCCGTTGGAGACCCCGGTGCCCTACGTTGTGATCCACCACACGTACATACCAGGAGCTTGCGGCACCCCTGAACAATGTAAAGCAGATATGAGATCAATGCAAAACTATCACATCAGTATGGGCTGGGGAGATATCGGATACAATTTCTGCGTTGGCAGCGACGGCGGCGTTTACGAAGGCCGAGGTTGGGACAACATCGGGATACACGCGGGTCGTGCTAATAATAACAGTATAGGGATTTGTCTCATAGGGGATTGGAGGGTTGAGGATCCACCAGAAGCTATGTTGGAGAGCACTAAAGCTCTAATCAGAACCGGAGTATTAAACGGCAAAGTCAGCACCGCGTACAAGCTGGTGGGTCACAGACAGGTCATGGCGACGGAGTGTCCCGGGAACGCAATAATGACGATTTATATCGAACTCCTAGTTTGTGCGTATATAGTGGATATAGCGAGCAGCGGCGCTGTATTCCGTGGGCAAGATGCTGATGATGACAACGAGGTGTCAAGTTACGACTTTCCCTACGTGACCCGTTCCATGTGGCACGCTAGACCTCCAAAAGAAAAGATACCCTTGCAATCACCAGTACCATATGTAGTCATACATCACTCCTATTCGCCACCGGCCTGCTATGACGGTGTAACCTGCCGTCAAGCTATGAGGTCCATGCAGAACTTCCACATGGACTCTAGAGGCTGGTGGGACATAGGTTACAATTTCGCCGTCGGCAGCGATGGAGCAGCGTACGAAGGCAGAGGATGGACCGTGCTAGGAGCGCACGCTCTCCACTTCAATAACATTAGCATTGGAATATGTCTGATTGGGGATTGGAGATTCTTAGTGCCGCCTTCAAATCAACTGAAGTCAGCCAAAGCTCTAATAAATGCGGGAGTAGAACTGGGATACATCAAAAGCGACTATAAGCTTGTTGGTCATAGACAAGTCCGGGAGACTGAATGCCCTGGTGACGCCCTGTTCCACGAGATACAAACTTGGGACCATTGGTCATCCTTCCCCGCCTCTTATAAGGATTTAGATAAAATTGACTTGACTGGATCTCAGAATAAAAGTTAA

Protein sequence:

>DPOGS206910-PA
MAACGSELLLVLVTISVCLVDSNPNVYGLARTQSYVYYTKSDWGGLPSTDVRPLETPVPYVVIHHTYIPGACGTPEQCKADMRSMQNYHISMGWGDIGYNFCVGSDGGVYEGRGWDNIGIHAGRANNNSIGICLIGDWRVEDPPEAMLESTKALIRTGVLNGKVSTAYKLVGHRQVMATECPGNAIMTIYIELLVCAYIVDIASSGAVFRGQDADDDNEVSSYDFPYVTRSMWHARPPKEKIPLQSPVPYVVIHHSYSPPACYDGVTCRQAMRSMQNFHMDSRGWWDIGYNFAVGSDGAAYEGRGWTVLGAHALHFNNISIGICLIGDWRFLVPPSNQLKSAKALINAGVELGYIKSDYKLVGHRQVRETECPGDALFHEIQTWDHWSSFPASYKDLDKIDLTGSQNKS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: