MonarchBase - Protein-coding gene

DPOGS215364
Transcript	DPOGS215364-TA	2169 bp
Protein	DPOGS215364-PA	722 aa
Genomic position	DPSCF300351 + 63281-75717
RNAseq coverage	759x (Rank: top 17%)

Annotation
*Heliconius*	HMEL005223	2e-124	69.81%
*Bombyx*	BGIBMGA008734-TA	3e-137	75.16%
*Drosophila*	CG3744-PB	1e-148	39.15%
EBI UniRef50	UniRef50_F4X388	1e-158	44.48%	Dipeptidyl peptidase 9 n=10 Tax=Pancrustacea RepID=F4X388_ACREC
NCBI RefSeq	XP_971949.1	8e-174	46.62%	PREDICTED: similar to AGAP003138-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91076698	2e-172	46.62%	PREDICTED: similar to AGAP003138-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91076698	2e-168	46.62%	PREDICTED: similar to AGAP003138-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	2e-52	membrane
	GO:0006508	2e-52	proteolysis
	GO:0008236	2.1e-08	serine-type peptidase activity
KEGG pathway
InterPro domain	[173-567] IPR002469	2e-52	Peptidase S9B, dipeptidylpeptidase IV N-terminal
	[649-693] IPR001375	2.1e-08	Peptidase S9, prolyl oligopeptidase, catalytic domain
Orthology group	MCL10962		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215364-TA
ATGGAGTTAAGGGAGGCTGGTGATGGGGCGGCGGGCGAATATGAACGTCCTCCCAAGAAATATAGCTGGTCGGAAGTCAGGCAGGCGGTTCACGATCTTCGGAAGGAGCTATCGTCATTATCCACCATGGTGCCAATGGCTATATCGTTCAGGAAGCTCAGCAATGGAAAGATGAGGATATATTTCTTACGGACACCTCAAAACGGATGGGAGGTCACGCTTCTGTACACCGACGTGACGCCTTCGCAGACCGCTAGTAATATGAGGTTAGACTGGCGGCCGTTGATTGAGTCCAACGTAGCGCTGGGCGTGTCATCAGGGAAGTGGTCTCGTGAGGAACAGCTGCTATGGGAGCGGCAGAGGGTCGCCGCTTGGGGTATAGCATCTTATGAACTGCACCCCAAGACCGGGAGAGTGCTGTTCCCATGCGCTTCATCTTTGTTTATAGCGGAAGAGGCCCCGAACCAGTCCCCTCCCCTAGTACCAAAGTCGCTCAGCACGGGGTGGGGGGCCCCGCTGACACCAGCGATGTGTCCCGCAATGCCGTCCCTGGTAGCGCACGCTGCCCGTGGTGATGTGTGGCTGGCGGGCGATTCTCTAAGGCGGCCCGCAAGACTTACGTACGCGTGTAAAGGGAGGGAAGAACGCTTATCAGATGATCCTAAGCAGGCTGGGGTGCCGTGCTACGTGACTCAGGAGGAGTTTTCGAGATATACCGGAATATGGTGGCAGCCGCAGTCCACAGATAATGTATTTAGAATAGTGTACGAGGAGGTGGATGAGGGTGAGGTGAAGATATACAGCTTCCCATCATCACAGAGCTCCAGCGGGGAGGTCGAGGAGTTCAGGTTTCCCCGCGCCGGCACCCCTAATGCTAAATCAGTCCTGAAAATGGTGACCTTCAGATTACAGAAAGCTCCCCCCACCACCGTCCTTGATTATTACCAAGAAGGGAACTCTAATACTGTTGCATCAGAGAGCCCCGGGAACAGTTCGGATCCCTTGGAGGTGGTCGATGTAAGATGGTATGAACTGAGACATTCGCTGAAAGAGGTGTTCCCCTGGTTTGAATACCTGGCCAGAGTCGGTTGGACCCCGTGCTCTCAATACGTTTGGGTCCAGGTGTTGGACAGGAAGCAGCAGAGGTTAGAACTGGCCCTGGTGCCGGTTAGTGAGTTCAATGTCCCCGTGAGGTATGAGCAGGGGTCTGATGGAGGAAGACTGGATGAGGAATCTCCAGCTTCAGGGAGTAGACAGGGAGACAGGACACAGATCCAGGTGTTGGTGTCTGAGACGGCTCCCGACGCGTGGGTCAACGTCCACGACATACTGCACTTCCTGCCCTCAGAACCTGGTATTGTGAGGTTCATCTGGGCTTCAGAGGAAACCGGACACCTGCACCTGTATCTCATCACCTGCGCTGTCAACGGACAGAGGGCTATGACAGTAACTGATATAATGGCTGAGGATGAGTCAAATGCTGCAGTCCCTCGGGTGATCAGCAAGGAACCCCTCACTGATGGGGACTGGGAGGTCATGGGAAGAAAGATATGGGTGGACGAGCCGCGCGGTCTGGTGTATTTCGTAGGGCTCCGTGAGACGCCGCTGGAGCGCCACCTGTACGTGGTGTCAATGTCCGCGCCCAGGCAGGTCGTCCTGCTCACTAAGCCGGGACATTCACACAGTGTTGACATGGACGAGTCACCGGAACCTCGTTCGTTCAACGGTTCCTGGGACTGTCGTCCTGATGAGGAGGAGTCGCCCAGCACCCGCCCTCCCCCGGTTCCCCCTCCACAGATACTATCGACTCGTCTGTCTTGCGGAGCCCTAGCATACTGCACACTTTGGCGGAGCGCCGTCCCAGGGCGAAGGCCGACTGTCTTACACGTTTACGGAGGGCCCGAGGTTCAAACGGTCACTAATAGTTACAAGGGTGTACGACAGTTGAGAATGCATATGCTGGCTGCCCGAGGGTTCACAGTGGTGTCCGTGGACTCGAGGGGGTCCAAGCACAGAGGGAGGTTGTGGGAAGCAGCTATCAAAGGAAAGATGGGACAAGTGGAGCTGGACGATCAGGTTTACCCGGGTGAGAGGCATTCGCTGCGAGCTATGCACGCGGCTAAGCATTACGAGGCGACACTGCTGCACTTCCTACACGAGAACCTGTAG

Protein sequence:

>DPOGS215364-PA
MELREAGDGAAGEYERPPKKYSWSEVRQAVHDLRKELSSLSTMVPMAISFRKLSNGKMRIYFLRTPQNGWEVTLLYTDVTPSQTASNMRLDWRPLIESNVALGVSSGKWSREEQLLWERQRVAAWGIASYELHPKTGRVLFPCASSLFIAEEAPNQSPPLVPKSLSTGWGAPLTPAMCPAMPSLVAHAARGDVWLAGDSLRRPARLTYACKGREERLSDDPKQAGVPCYVTQEEFSRYTGIWWQPQSTDNVFRIVYEEVDEGEVKIYSFPSSQSSSGEVEEFRFPRAGTPNAKSVLKMVTFRLQKAPPTTVLDYYQEGNSNTVASESPGNSSDPLEVVDVRWYELRHSLKEVFPWFEYLARVGWTPCSQYVWVQVLDRKQQRLELALVPVSEFNVPVRYEQGSDGGRLDEESPASGSRQGDRTQIQVLVSETAPDAWVNVHDILHFLPSEPGIVRFIWASEETGHLHLYLITCAVNGQRAMTVTDIMAEDESNAAVPRVISKEPLTDGDWEVMGRKIWVDEPRGLVYFVGLRETPLERHLYVVSMSAPRQVVLLTKPGHSHSVDMDESPEPRSFNGSWDCRPDEEESPSTRPPPVPPPQILSTRLSCGALAYCTLWRSAVPGRRPTVLHVYGGPEVQTVTNSYKGVRQLRMHMLAARGFTVVSVDSRGSKHRGRLWEAAIKGKMGQVELDDQVYPGERHSLRAMHAAKHYEATLLHFLHENL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: