MonarchBase - Protein-coding gene

DPOGS201318
Transcript	DPOGS201318-TA	3303 bp
Protein	DPOGS201318-PA	1100 aa
Genomic position	DPSCF300176 + 331157-344985
RNAseq coverage	436x (Rank: top 28%)

Annotation
*Heliconius*	HMEL017247	1e-121	65.26%
*Bombyx*	BGIBMGA003110-TA	8e-104	53.77%
*Drosophila*	CG4572-PA	2e-71	36.51%
EBI UniRef50	UniRef50_E2AY01	7e-91	37.03%	Probable serine carboxypeptidase CPVL n=10 Tax=Formicidae RepID=E2AY01_CAMFO
NCBI RefSeq	NP_001152775.1	3e-81	38.24%	venom serine carboxypeptidase [Apis mellifera]
NCBI nr blastp	gi\|307168668	3e-90	37.03%	Probable serine carboxypeptidase CPVL [Camponotus floridanus]
NCBI nr blastx	gi\|307168668	4e-89	37.05%	Probable serine carboxypeptidase CPVL [Camponotus floridanus]

Group
Gene Ontology	GO:0006508	9.1e-103	proteolysis
	GO:0004185	9.1e-103	serine-type carboxypeptidase activity
KEGG pathway
InterPro domain	[603-1024] IPR001563	9.1e-103	Peptidase S10, serine carboxypeptidase
Orthology group	MCL26488		Lepidoptera specific

Nucleotide sequence:

>DPOGS201318-TA
ATGGTGAGAACTGTCGTAATTATTGCATTATTTATATGCAGTGGCCGCGCTAAAGTTATCATTCATGAAGATTTGCCAGACATTACGAAGAATCTAGTGCAGAATGATGTAAAGAACGTCCCCTCAATTGTACTAGATCTGCCGGTGCACAAGGAACTGATAAGTATAATAGCTCCAAAAGATACTTCGAAGAGTGTACCAAAATTGAAAACATCTACGAACACAAATGAAAACGGAAACCAGAAAAGTTGTGCGGGCATAAATGATACTATATCAGATAATTTAATCGATTCAGATGAAAATGTACCTTGTGAGATTCCGTTTAAGATCGACAATGGCTCAGTTCTAATTCTTACGCCTTATATTAAAGATGGCCAAGTCGCAGAAGCGCGTAATGCGAGCTCCGTCAACCCTGATCTGTTTCTGGGGTATGAAAGCTATTCAGGTTTTATAACAGTGAATAAAACTTACGATTCGAACATATTCTTCTGGTATTTTCCTGTTCTCAAAAAACCGTATGGAGCCAATTTGGCTGAAACCGTACACCAGTTCCTTGAAATATTCCCTGAACTCAGGTCAGCCCCGTTATACGTAGCTGGAGAATCATATGCTGGCAAATATGTCCCGGCTCTCTCTATGGAACTCCACAAGCAAAAAGATAACCCGGAATTCAAAGTCAATTTAACGGGTATGATGTTGGGCAACGCATATATAGATCCCAGTATGATAGCGCAAGTGTCGTATCCCTTCTATTATTTTGGACTGCTCAGCAAAGAGCAAATTGATATAGTTGACCCGCTCTTAAAGTCCTTTCAACAGGACATAGCATCGAATAACAGCATCGCTGCTAAAAATAAGTGGAACAGCTTGATCGCCGTGTTGTTGTTTCTAACTCATCAAAAGCAGGCTTACAATTTCCTTAAGGACGATATATCTGTAGGCCACTACGTAAATTTTCTCAAAACATCAGAAGTAAAGAGGGCTCTACACGTAGGAGACATAAGATTCTCTTTTGTAAATCAGACTGTGAATTCAAAGATGGCGCCGGATTTCTTGAGCAGTTCAAAGCCCTTGTTTGAAGAACTTTTGGAACATTATAGAGTGCTGATATACTGTGGACATTTGGACCAGATGTTGCCATGTGTGTTCACGTCAGACAATTTCAGGACATGGACATGGAGTGGATCCAAGGAATTTCAAGAAGCAGCCAGATATCCTTATATTTACAAGGCTAAATTGTCTGGCTACCACAAGACAGGAGGTCAGCTGACGGAGGTCGTGGTACGAGGGGCAGGTCACATGGTACCGGTCGACCAGCCCGGACCTATACAGAACCTAGTGGCTCGCTTCACCCACAACAAACCACTCAGCCAGCGCTTTGGACTCCTCGAGGGATCGTTCATACAGGAGTTCATTAAGAACCAGACGGTTGTATATTTTGGACATTTGGACCAGATGTTGCCATGTGTGTTCACGTCAGACAATTTCAGGACATGGACATGGAGTGGATCCAAGGAATTTCAAGAAGCAGCCAGATATCCTTATATTTACAAGGCTAAATTGTCTGGCTACCACAAGACAGGAGGTCAGCTGACGGAGGTCGTGGTACGAGGGGCAGGTCACATGGTACCGGTCGACCAGCCCGGACCTATACAGAACCTAGTGGCTCGCTTCACCCACAACAAACCACTCAGCCAGCGCTTTGGACTCCTCGAGGGATCGTTCATACAGGAGTTCATTAAGAACCAGACGGTTGTATATTTTATAACACTCGCGGCTGTAGCAGATGCCGTACAAATAGATACACCTCTTTTTCTCACCGCTTTCATTAAAGAGAATAAAACTGCGGAGGCGAGAAACGCGTCTCTCGTAAATGCGGACGAATTTCTAAACGTCACAAGTTATTCAGGTTTTTTAACTGTTGACGATAACTATGATTCTAATTTATTCTTCTGGTACTTTCCCGTTGCTAATAAAGATGTAAAGAGAACTCCATGGATAATTTGGCTCCAAGGAGGTCCGGGAGCTACAAGCTTAGCCGGCCTTTTCGACGAAATGGGTCCATTCGAATTGGATAGCAATTTAAATTTAAAAAAACGCAAGTACACGTGGACGGATGACTTCTCTATGGTATACATAGATAATCCCGTGGGAGCGGGTTTCAGTTTCACGAAACATGATGAGGGTTATCCGAACAATATGGATATGTACACCGAAAGCCTATATAGAGCAGTGAATCAGCTGATCGTATTATATCCAGAGTTAAGTGAGGCGCCTCTGTATGTAGCTGGTGAGTCCTATGCTGGGCGGTACGTGCCAGCTTTAGCCGAGAGAATCATGAAAGATAAGGAGAAAGACGGCCACATTAATTTACAGGGTATCATGCTGGGTAATCCTTTACTAGACCGCGAGAGTGTAATTGATTATACTCGAGCGTTCTACTCTTGGGGACTCATAGACGAGCAGGGCGCTCTAGCAGCAGAACCTCTTCAGAAGCAGTTCCAAAAGGAAATCGATGAAGGGAATGCCCAAGAGGCATATAAGCTGCGTGACGAGCTTCTCGATAAGCTCCAAGGTATAGCGGAGCAGTCGTCTCTATACAACGTCATCACACCTATAGAAGGTTTGGAACACTTCATCAATTTCATCACCAGTTCGAAAATCAGGAACTTGATCCACGCCGGGAATGTGACCTTTCACTTTTCAAACGACAAGGTCCATAAACATCTCGTAGCTGATTTCTTGGCCCCCGTTTCCAGTAAAGTCCTAACTGTTCTCGAACACTACAGGGTTCTTATATACTGCGGCCAGTTGGACCTCACGACTCCCTGTGTTCTGAACAGCGAGGCTCGCAGGAAGAGGTGGATGTGGTCTGGGAGGGAAGAGTTTCTTAGATCACCGCGGACACCATGGTGGTTCAATAATACCGTGGCTGGCTTCGTGAAATCAGGCGGAGGCTTCACGGAGGTTCTCGTAAAGGGGGCCGGACATCTAGTACCCAAGGAAAAACCAGCTGAAGCCAAGGCACTAATATCATACTTCATCAATGGAACAGGTCTACCAACACCACCTTCATACAAAATACATCCGGAAGACACTCCATACTACGAGGAGTACTTTGACCTAAAAACATCAGGAGCTGTCCCGGCGGTGGGGCTAAGGGCTGGCTTAATCGCCAGTGTCGTAGTGAACGTTCTGCTGTTAGCTGGTATCGCTTTAGGAGTCTACAAGTTTCTGAAATGGAAGAGAGAATCCGATTATTTCTATTCGCCCTTAAACGACGGCATTTTAACTATGTCGTAG

Protein sequence:

>DPOGS201318-PA
MVRTVVIIALFICSGRAKVIIHEDLPDITKNLVQNDVKNVPSIVLDLPVHKELISIIAPKDTSKSVPKLKTSTNTNENGNQKSCAGINDTISDNLIDSDENVPCEIPFKIDNGSVLILTPYIKDGQVAEARNASSVNPDLFLGYESYSGFITVNKTYDSNIFFWYFPVLKKPYGANLAETVHQFLEIFPELRSAPLYVAGESYAGKYVPALSMELHKQKDNPEFKVNLTGMMLGNAYIDPSMIAQVSYPFYYFGLLSKEQIDIVDPLLKSFQQDIASNNSIAAKNKWNSLIAVLLFLTHQKQAYNFLKDDISVGHYVNFLKTSEVKRALHVGDIRFSFVNQTVNSKMAPDFLSSSKPLFEELLEHYRVLIYCGHLDQMLPCVFTSDNFRTWTWSGSKEFQEAARYPYIYKAKLSGYHKTGGQLTEVVVRGAGHMVPVDQPGPIQNLVARFTHNKPLSQRFGLLEGSFIQEFIKNQTVVYFGHLDQMLPCVFTSDNFRTWTWSGSKEFQEAARYPYIYKAKLSGYHKTGGQLTEVVVRGAGHMVPVDQPGPIQNLVARFTHNKPLSQRFGLLEGSFIQEFIKNQTVVYFITLAAVADAVQIDTPLFLTAFIKENKTAEARNASLVNADEFLNVTSYSGFLTVDDNYDSNLFFWYFPVANKDVKRTPWIIWLQGGPGATSLAGLFDEMGPFELDSNLNLKKRKYTWTDDFSMVYIDNPVGAGFSFTKHDEGYPNNMDMYTESLYRAVNQLIVLYPELSEAPLYVAGESYAGRYVPALAERIMKDKEKDGHINLQGIMLGNPLLDRESVIDYTRAFYSWGLIDEQGALAAEPLQKQFQKEIDEGNAQEAYKLRDELLDKLQGIAEQSSLYNVITPIEGLEHFINFITSSKIRNLIHAGNVTFHFSNDKVHKHLVADFLAPVSSKVLTVLEHYRVLIYCGQLDLTTPCVLNSEARRKRWMWSGREEFLRSPRTPWWFNNTVAGFVKSGGGFTEVLVKGAGHLVPKEKPAEAKALISYFINGTGLPTPPSYKIHPEDTPYYEEYFDLKTSGAVPAVGLRAGLIASVVVNVLLLAGIALGVYKFLKWKRESDYFYSPLNDGILTMS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: