MonarchBase - Protein-coding gene

DPOGS207580
Transcript	DPOGS207580-TA	3177 bp
Protein	DPOGS207580-PA	1058 aa
Genomic position	DPSCF300072 + 723542-732661
RNAseq coverage	521x (Rank: top 24%)

Annotation
*Heliconius*	HMEL017146	83.61%
*Bombyx*	BGIBMGA004688-TA	85.74%
*Drosophila*	DppIII-PC	59.04%
EBI UniRef50	UniRef50_Q17GV2	62.46%	Dipeptidyl peptidase iii n=8 Tax=Coelomata RepID=Q17GV2_AEDAE
NCBI RefSeq	XP_001601820.1	62.42%	PREDICTED: similar to dipeptidyl peptidase iii [Nasonia vitripennis]
NCBI nr blastp	gi\|156551692	62.42%	PREDICTED: dipeptidyl peptidase 3-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156551692	62.42%	PREDICTED: dipeptidyl peptidase 3-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0006508	5.9e-185	proteolysis
	GO:0005737	5.9e-185	cytoplasm
	GO:0008239	5.9e-185	dipeptidyl-peptidase activity
KEGG pathway
InterPro domain	[1-618] IPR005317	0	Peptidase M49, dipeptidyl-peptidase III
Orthology group	MCL13483		Single-copy universal gene

Nucleotide sequence:

>DPOGS207580-TA
ATGGAGGATAAGTCGATCTTTCTTTTGCCAAACAGTCAGAAATTTGTTGAACTAGATAGTTCACAGGCATTTACAAAATTAACTAAACAAGAAAAGTTGTATGCTCACTATTTGAGTCAGGCTGCTTGGAATGGTGGTTTAATTGTTCTTCTACAAACAAGTCCAGAATCACCAAGGATTTTTTCACTTTTGCACAGAATTTTTAAATCAGAAGGATTAGCTGATTTAAAAAAAGTTTCCCTTGGAGCTGGTGTATCCGAGGATGATTTTCAGGCCTTCTTAGTTTATGCGGGTGGATTATTTGCTAACAGCGGTAATTACAAAGGCTTTGGTGATACAAAATTCATTCCTAACTTGCCAAAAGAATGTTTTGAAGTTATCGTTAAATCATCAAAAGCATTTAAAAATGATGAAGCACATATAAGTAAACTGTGGGAGAACACTAAAAATGCTATGTACAGTACTGCACCCAGATTAGCCAGCCTTGGTTTAGCCGATAAGGGTATAACAACATATTTCTCAAGTAACTGTACAGAGGCGGACTCGACTCTTGTAAATGACTGGATGAAAACAAAACGCATTGAAGCATACATTTGTAGAACTTTCAAGACAACCGCTGACGATGGATTACCTTTGTATACGATACACCTGGCCAGTGTCGAGAAAAGCTCAAAGCCGCCCCTTACTATGGATAAAGAAAAATACAAAAATGCGTACTTCCAAGTGACTCGGGGAGATTATTCGCCATTATTGAGTTTGGTCAACGAAAATCTTGCAAAAGCTATGGAGTATGCGGCAAATGAGAATGAAAAGAATATGATTAAACATTACATTAACAGTTTTAAAGAGGGAGATTTAAGTGAACATAAAGAAGGCAGCAGGTTCTGGGTGAAGGACAAAGGACCGATTATAGAGACATATCAAGGCTTCATAGAGACATACCGCGATCCCAGCGGACAAAGAGGTGAATTCGAGGGTTTTGTGGCTATGGTCAATAAAGATATGTCAAAAAAGTTTGGGGAACTCGTCCATGGTGCTGAAAACTTCATAAAGCTGTTACCGTGGGGGGAGGGGCTTGAGAAGGATTCCTTCCTCCGACCGGACTTCACTAGTCTAGACGTACTGACGTTCTCAGGGAGCGGTATACCAGCCGGAATTAACATACCTAACTATGATGAGATCCGACAAAATGAAGGCTTTAAGAACGTGTCCCTGGGTAACGTGTTCCCCGCCGCTTATAAGGAGTCCGTTATACCATTCCTCTCTGATAGTGATAAAGTTCTTTTAGAAAAATACAGGGTTGCTGCATTTGAGGTTCAAGTAGGACTTCATGAACTGCTGGGTCATGGCAGCGGGAAGCTTCTCAGACAAAACGCAGACGGGACATTCAACTTCGACAAGGAGAAAGTTAAAAATCCTCTAACTGGCAAGGAGATCGAGTCGTGGTATTCAGAAGGCGAGAATTACGACAGCAAGTTCACCACTTTGGGATCCGCCTTCGAGGAATGCCGGGCGGAGGCTGTTGGATTGTATCTGTCGTTACGACCTGAGATACTCAAAATCTTCGGTTACGAGGGTCAGGAAGCAGAGGACGTGATGTACGTCAACTGGCTCAGTCTACTGTGGAACGGAGCCGCCAAGGCCACGGAAATGTACCAGCCGGCTACGAAAACGTGGCTACAGGCCCACGCGAGAGCTCGTTTTGTTTTAATGAGACTGTTGGAATTGGAAGGTAACGGAATACTAACAGTCACCGAGGTTGATCCCGGCAAGAACCTGTTGCTTACTTTAGACAGGAAACGTTTGGCTACTGACGGAAAACGAATTGTCGTTCTCGAGCTCGCCGAGCTGCGATACGAGTTGGCTGTTCGCGCCGAACTACTTCAACCTTTCTTTTTTGTTTTGGATGTAATTTTTTTAAATGCTGTAATAAGATATCAAGGCTTCATAGAGACATACCGCGATCCCAGCGGACAAAGAGGTGAATTCGAGGGTTTTGTGGCTATGGTCAATAAAGATATGTCAAAAAAGTTTGGGGAACTCGTCCATGGTGCTGAAAACTTCATAAAGCTGTTACCGTGGGGGGAGGGGCTTGAGAAGGATTCCTTCCTCCGACCGGACTTCACTAGTCTAGACGTACTGACGTTCTCAGGGAGCGGTATACCAGCCGGAATTAACATACCTAACTATGATGAGATCCGACAAAATGAAGGCTTTAAGAACGTGTCCCTGGGTAACGTGTTCCCCGCCGCTTATAAGGAGTCCGTTATACCATTCCTCTCTGATAGTGATAAAGTTCTTTTAGAAAAATACAGGGTTGCTGCATTTGAGGTTCAAGTAGGACTTCATGAACTGCTGGGTCATGGCAGCGGGAAGCTTCTCAGACAAAACGCAGACGGGACATTCAACTTCGACAAGGAGAAAGTTAAAAATCCTCTAACTGGCAAGGAGATCGAGTCGTGGTATTCAGAAGGCGAGAATTACGACAGCAAGTTCACCACTTTGGGATCCGCCTTCGAGGAATGCCGGGCGGAGGCTGTTGGATTGTATCTGTCGTTACGACCTGAGATACTCAAAATCTTCGGTTACGAGGGTCAGGAAGCAGAGGACGTGATGTACGTCAACTGGCTCAGTCTACTGTGGAACGGAGCCGCCAAGGCCACGGAAATGTACCAGCCGGCTACGAAAACGTGGCTACAGGCCCACGCGAGAGCTCGTTTTGTTTTAATGAGACTGTTGGAATTGGAAGGTAACGGAATACTAACAGTCACCGAGGTTGATCCCGGCAAGAACCTGTTGCTTACTTTAGACAGGAAACGTTTGGCTACTGACGGAAAACGAATTGTCGGCGACTTCTTAGTAAAGCTGCAGACTATCAAATCTACTGGCGACGTGTCGTCGGGCGAACAGTTGTTCACTCGACTCAGCAGCTTAGAGGAACCCTGGCTGAGGTGGAGGGACATCGTCATGATGCACAAACAGCCACGGAATATATTCGTACAACCCAACACGGTTCTCAAAGATGATGACGTTGTTTTGAAACGCTACGAGGCAAGTGCTTCAGGGATGGTGACGTCATCTGTGGAGCGATACACGCTGGCTATAGACGACGCGCTCGAGTCCCTCGCGGCACAAGACCAACAGTACTTTGAAGAACTCAGCAAACTAGCCATCTGA

Protein sequence:

>DPOGS207580-PA
MEDKSIFLLPNSQKFVELDSSQAFTKLTKQEKLYAHYLSQAAWNGGLIVLLQTSPESPRIFSLLHRIFKSEGLADLKKVSLGAGVSEDDFQAFLVYAGGLFANSGNYKGFGDTKFIPNLPKECFEVIVKSSKAFKNDEAHISKLWENTKNAMYSTAPRLASLGLADKGITTYFSSNCTEADSTLVNDWMKTKRIEAYICRTFKTTADDGLPLYTIHLASVEKSSKPPLTMDKEKYKNAYFQVTRGDYSPLLSLVNENLAKAMEYAANENEKNMIKHYINSFKEGDLSEHKEGSRFWVKDKGPIIETYQGFIETYRDPSGQRGEFEGFVAMVNKDMSKKFGELVHGAENFIKLLPWGEGLEKDSFLRPDFTSLDVLTFSGSGIPAGINIPNYDEIRQNEGFKNVSLGNVFPAAYKESVIPFLSDSDKVLLEKYRVAAFEVQVGLHELLGHGSGKLLRQNADGTFNFDKEKVKNPLTGKEIESWYSEGENYDSKFTTLGSAFEECRAEAVGLYLSLRPEILKIFGYEGQEAEDVMYVNWLSLLWNGAAKATEMYQPATKTWLQAHARARFVLMRLLELEGNGILTVTEVDPGKNLLLTLDRKRLATDGKRIVVLELAELRYELAVRAELLQPFFFVLDVIFLNAVIRYQGFIETYRDPSGQRGEFEGFVAMVNKDMSKKFGELVHGAENFIKLLPWGEGLEKDSFLRPDFTSLDVLTFSGSGIPAGINIPNYDEIRQNEGFKNVSLGNVFPAAYKESVIPFLSDSDKVLLEKYRVAAFEVQVGLHELLGHGSGKLLRQNADGTFNFDKEKVKNPLTGKEIESWYSEGENYDSKFTTLGSAFEECRAEAVGLYLSLRPEILKIFGYEGQEAEDVMYVNWLSLLWNGAAKATEMYQPATKTWLQAHARARFVLMRLLELEGNGILTVTEVDPGKNLLLTLDRKRLATDGKRIVGDFLVKLQTIKSTGDVSSGEQLFTRLSSLEEPWLRWRDIVMMHKQPRNIFVQPNTVLKDDDVVLKRYEASASGMVTSSVERYTLAIDDALESLAAQDQQYFEELSKLAI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: