MonarchBase - Protein-coding gene

DPOGS201501
Transcript	DPOGS201501-TA	2121 bp
Protein	DPOGS201501-PA	706 aa
Genomic position	DPSCF300006 + 904448-911609
RNAseq coverage	1045x (Rank: top 12%)

Annotation
*Heliconius*	HMEL015505	75.33%
*Bombyx*	BGIBMGA002593-TA	80.81%
*Drosophila*	CG5355-PA	61.47%
EBI UniRef50	UniRef50_Q9VKW5	61.47%	CG5355 n=29 Tax=Neoptera RepID=Q9VKW5_DROME
NCBI RefSeq	XP_395364.2	64.81%	PREDICTED: similar to prolyl endopeptidase isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|383857012	65.62%	PREDICTED: prolyl endopeptidase-like [Megachile rotundata]
NCBI nr blastx	gi\|383857012	65.81%	PREDICTED: prolyl endopeptidase-like [Megachile rotundata]

Group
Gene Ontology	GO:0004252	6.5e-118	serine-type endopeptidase activity
	GO:0070008	6.5e-118	serine-type exopeptidase activity
	GO:0006508	6.5e-109	proteolysis
	GO:0008236	3e-60	serine-type peptidase activity
KEGG pathway
InterPro domain	[1-703] IPR002470	0	Peptidase S9A, prolyl oligopeptidase
	[5-411] IPR004106	6e-146	Peptidase S9A/B/C, oligopeptidase, N-terminal beta-propeller
	[74-422] IPR023302	6.5e-118	Peptidase S9A, oligopeptidase, N-terminal
	[478-701] IPR001375	3e-60	Peptidase S9, prolyl oligopeptidase, catalytic domain
Orthology group	MCL11829		Single-copy universal gene

Nucleotide sequence:

>DPOGS201501-TA
ATGACCTTCGACTATCCAGAGGCGAGGAGGGATGAGACGGTGGTCGACAACTATCATGGTACCAACGTATCAGACCCATACCGCTGGTTGGAGGATCCAGATTCAGACGAGACCAAAGCGTTTATAGAAGCCGAAAACAATATAACTCGTCCGTTCTTAGACTCGTGTCCCGTTAAAACCGATATAAACAGTAGGCTCACAGAGCTCTGGAACTATCCCAAATACTCCTGTCCATTCAGAAGAGGAGATAGATACTTCTTCTTCAAGAACACCGGACTGCAGAATCAGAATGTGCTATACGTCCAAGATAGTTTGGACGGCGAGCCGCGCGTGTTCCTCGATCCGAATACGTTGTCTGAGGACGGTACGATCGCTTTGTCCGGGAGTCGCTTCACCGAGGACGGTTCAACCTTCGCGTACGGTCTGTCAGCCAGCGGATCGGATTGGATAACGATCCATTTGAAGGATGTTGCTACTGGCGTAGACTATCCCGAGGTTTTAGAGAAAGTTAAGTTCGCCTCAATGTCGTGGACAAAGGACAATAAGGGACTCTTTTATTCTCGGTATCCAGAGCAGACCGGCAAGACGGATGGTTCGGAGACGGACGTGAACAGAGATCAGAAGCTGTGCTACCACAGGCTGAACACGCCGCAGGAGGATGACGTCATCGTGGTAGAATTCCCCCAGGAACCTCTGTGGAGGATCGGTGCGGAGGTGTCGGACTGCGGCAGGTATCTCCTCGTGAGTCCGGTGAGAGACTGTCGCGACAACCTGCTGTTCTTCGCCGACCTGTCCTCCGCCTCGCTCACAGGACACCTCCAACTAACACAGATCGTGCACAAGTTCGAAGCCGACTATGAGTACATAACGAACGAGGGTTCCGTATGCATATTCCGGACAAACAAGAACGCACCCAACTACAGACTCATAAAAATCGACCTGAATAACCCAGCTGAGGAAAATTGGGAAACTTTAATAGCGGAACATCCCACTGATGTCCTGGACTGGGCTTCTGCGGTCGACAAAGATAAGTTAGTCATACACTACATAAGGGACGTTAAGAGCGTACTGCAGTTACACAGTATGAAGACGGGTGATTTGATGCAAAACTTCGATTTAGGTGTTGGCTCCATAGTGGGGTTCTCGGGGAAGAAAGAACAGAGCGAAATATTCTATCACTTCATGTCATTCCTTACACCCGGCGTCATCTATCACGTGGACTTCAAGAAACAACCGTACGCACCAACCATATTCAGAGAAGTTAAAGTGAAAGGCTTCGACGCTTCGCAGTATGAAGCCAAACAAGTTTTCTATAGCAGCAAAGATGGCACGAGAGTTCCTATGTTCATAGTATCTAAGAAAGGTTTACCGCGTGATGGGTCCCGCCCGGCGCTGCTCTACGGCTACGGCGGGTTCAACATCAACGTCCAGCCGAGCTTCAGCGTGACGCGGATCGTGTTCATGCAGCACTTCGAAGGTTCCGTAGCGGTTCCGAACATCAGAGGCGGCGGTGAATACGGCGAGCGGTGGCACAACGCCGGCAGACTGCTGAACAAGCAGAATGTCTTCGATGATTTCATATCCGCCGGCGAGTATTTGGTGCGGGAAGGGTACACCAGACCCGGCCTGCTCGCGGTCCAGGGCGGCTCAAACGGCGGGCTGCTGGTTGCAGCGGTCGCAAATCAGCGGCCCGACCTGCTGGGCGCAGCGATCGTTCAAGTCGGAGTGCTGGACATGCTGCGCTTCCAGAAGTTCACCATCGGACACGCCTGGATATCGGACTACGGCAGCTCAGATAATAAGACACATTTCGAAAACCTGCTTAAGTACTCGCCGCTGCACAACATCCAGTCGCCAGATAACGTAAGCCGTGCCGAGTACCCGGCGACGTTGGTGCTAACTGCGGATCACGATGACCGCGTAGTGCCGCTTCATTCCCTCAAGTATATAGCGACATTACAGCACGCTGTTAGAGGCACGCCGCAAAGACGACCGCTGTTAGCACGGATCGACACGAAGGCTGGTCACGGAGGAGGAAAACCGACCGCGAAAATAATCGATGAACACACAGACATCCTGTGCTTCCTCGCTCAAACCCTGGGACTTAAGTTCCTGAAGTGA

Protein sequence:

>DPOGS201501-PA
MTFDYPEARRDETVVDNYHGTNVSDPYRWLEDPDSDETKAFIEAENNITRPFLDSCPVKTDINSRLTELWNYPKYSCPFRRGDRYFFFKNTGLQNQNVLYVQDSLDGEPRVFLDPNTLSEDGTIALSGSRFTEDGSTFAYGLSASGSDWITIHLKDVATGVDYPEVLEKVKFASMSWTKDNKGLFYSRYPEQTGKTDGSETDVNRDQKLCYHRLNTPQEDDVIVVEFPQEPLWRIGAEVSDCGRYLLVSPVRDCRDNLLFFADLSSASLTGHLQLTQIVHKFEADYEYITNEGSVCIFRTNKNAPNYRLIKIDLNNPAEENWETLIAEHPTDVLDWASAVDKDKLVIHYIRDVKSVLQLHSMKTGDLMQNFDLGVGSIVGFSGKKEQSEIFYHFMSFLTPGVIYHVDFKKQPYAPTIFREVKVKGFDASQYEAKQVFYSSKDGTRVPMFIVSKKGLPRDGSRPALLYGYGGFNINVQPSFSVTRIVFMQHFEGSVAVPNIRGGGEYGERWHNAGRLLNKQNVFDDFISAGEYLVREGYTRPGLLAVQGGSNGGLLVAAVANQRPDLLGAAIVQVGVLDMLRFQKFTIGHAWISDYGSSDNKTHFENLLKYSPLHNIQSPDNVSRAEYPATLVLTADHDDRVVPLHSLKYIATLQHAVRGTPQRRPLLARIDTKAGHGGGKPTAKIIDEHTDILCFLAQTLGLKFLK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: