MonarchBase - Protein-coding gene

DPOGS206129
Transcript	DPOGS206129-TA	3102 bp
Protein	DPOGS206129-PA	1033 aa
Genomic position	DPSCF300028 + 1041061-1051589
RNAseq coverage	303x (Rank: top 37%)

Annotation
*Heliconius*	HMEL002824	69.87%
*Bombyx*	BGIBMGA000719-TA	82.88%
*Drosophila*	S1P-PA	47.85%
EBI UniRef50	UniRef50_Q14703	55.48%	Membrane-bound transcription factor site-1 protease n=81 Tax=Coelomata RepID=MBTP1_HUMAN
NCBI RefSeq	XP_001812491.1	57.99%	PREDICTED: similar to membrane-bound transcription factor protease, site 1 [Tribolium castaneum]
NCBI nr blastp	gi\|270003563	58.20%	hypothetical protein TcasGA2_TC002816 [Tribolium castaneum]
NCBI nr blastx	gi\|270003563	58.31%	hypothetical protein TcasGA2_TC002816 [Tribolium castaneum]

Group
Gene Ontology	GO:0004252	2.8e-69	serine-type endopeptidase activity
	GO:0006508	2.8e-69	proteolysis
KEGG pathway	tca:100142346	0.0
	K08653 (MBTPS1)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[10-742] IPR015500	0	Peptidase S8, subtilisin-related
	[162-466] IPR000209	2.8e-69	Peptidase S8/S53, subtilisin/kexin/sedolisin
Orthology group	MCL14222		Single-copy universal gene

Nucleotide sequence:

>DPOGS206129-TA
ATGGGGCTCGTTCAACTTGTTTATTTGTTTTGGTTAAGTTATTATAATTTTGTGGTTTTTGCTGAGGATACCAATATCCTTTGTAATGTGACGGTTAACGAGCGTTTGGAATATAAATTTGATTCAGATATTGTCAACACTGAACATATAATTACATTCAAAGGATATTATTCCAAAACTACCAGAGAAAACTATGTGAATGCTGCACTGAAAAATGCCCAGGTATCAAATTGGACCATACTCCAGCGTAATAATCCCGCTATGGAATATCCTAGTGACTTCGACGTCATAGTGTTCGGGGAGAAGATAAGGGAGGGGATCGATGCTTTACGTGACCACCCAGCTGTACGCCGGGTAACTGCGCAGCGGCAGGTGCAACGGACCATAAAATACGTGCGCGAGGATGACTGTGGGCCGTCTGGTTGCATGTACTCCGGATGGAGGAACCACCGCCGTTCGAGGGTGCTTCATTCATTACGTAAAACTAGAGAAAATGGAGGCTACACCTCTAGAAAACTTCTCCGTACTGTACCTCGTCAAATAACATCTGTTCTGAAAGCTGATCTGCTGTGGTCTTTGGGAGTAACCGGGGAGGGCATCAAAGTGGCGGTGTTCGATACGGGACTAGCGCGACACCATCCCCACTTCGGGCGGGTTAGGGAGCGTACAGACTGGACCGGCGAGAATACATTGGACGATGCCTTAGGTCACGGCACCTTCGTAGCTGGTGTGATAGCGTCTCGTTCGGACTGCCTCGGCTTCGCTCCGGACGCGGACCTACACATCTTCAGAGTTTTCACAGATAATCAGGTGTCATACACTTCGTGGTTCCTGGACGCATTTAACTACGCCATAATGCGTAAGATAGATGTCCTGAACCTCAGTATTGGTGGTCCAGATTTTATGGACCATCCGTTTGTGGATAAAGTATGGGAACTTAGCGCTAACAAGGTTATAATGGTCTCTGCTATCGGCAATGACGGCCCATTATACGGGACCCTGAACAATCCAGCTGATCAGATGGATGTCATCGGAGTGGGAGGCATCGGGTTTGATGATCGCATCGCCAAGTTCTCGTCGAGAGGCATGACGACCTGGGAATTACCTTATGGCTACGGTAGAATGAAACCAGACATCGTGACCTATGGCAGCGGCGTCCGTGGTTCAAGCGTTAATGGCGGCTGCAGATCACTCAGTGGTACGTCTGTAGCTTCCCCAGTGGTCGCTGGTGCTATAGCACTCCTCGCTAGTGGTGTTCCCCGTCAGAATTTAACACCAGCTGCTGTCAAGCAAGCTTTGTGCATAACAGCACGCCGTTTGCCCGGTTATAATATGTTTGAACAGGGACACGGGAAACTAGACCTTATTAGCGCGTACCAGTTTCTTCGCGAGTACGAGCCGCAAGCGACTTTGAGCCCATCATACATTGACCTCACCGAGTGTCAGTACATGTGGCCGTATTGCACTCAGCCGCTCTACTATAGCGCTCAACCCACCATCGCCAACGTCACCGTTATCAATGGGCTCGGCGTGGTGGGTGAAGTGAAAAAGGTCAGCTGGCATCCTCATTTGCCTCACGGTACAATACTGGCTGTTGGGGCGGACTACAACGAAGTGCTTTGGCCTTGGTCCGGATGGTTGGCACTCAGCTTCACAGTTTTGGAAGCGGGCGCTAACTTCGACGGCGTCGTTGAAGGTCACATGAACATTACGATTGAGAGTTACGACGAGGTCAATGACCGTGTCATGAAAAATACGACTCTCATGCTTCCAATACGTGCTCGCGTTATCCCGGTGCCAGTACGCGGTCGTCGTCTGTTGTGGGACCAGTTCCATAGTCTCCGGTACCCTGGCGGTTACTTCCCGAGGGATGATCTTCGTGCCAAACACGATCCACTCGATTGGCACGCCGACCACGTGCACACCAATTTTAGAGACATGTATAGAAGATTAAGGGAGCATGGATTTTATGTCGAGGTTATGGGTAATCCCCTAACTTGTATCGACACTTCGTTGTATGGAGCGTTGCTGCTCGTTGATCCCGAGGACGAATACTTCCCCGAAGAAATGGCGACTTTGAAGAGGGCTGTAGACTCCGGTCTTTCACTGATTGTTTTTGCGGACTGGTACAATGCTTCCCTGTTGAGACACGTCAAATTCTATGATGAAAATACACGACAATGGTGGATTCCTGAAACTGGTGGTACAAACGTTCCGGCGCTGAACGACCTACTAAGCATGTTTCAAGTAGCGTTTGGTGATCGCGTGTTTGAGGGGTCGTTCAAGTTGGCTGGCCATCCAATGTACTACGCTAGCGGCACACACATACATAGCTTTCCAGAACATGGTGTCTTGGTGTCAGCGAAGCTATCGGATCAGGGGCAGCAGATAATGTCAGGCGAAAAGTCTGGAGGGGGTCAGACTCGTAAGACGGTGGAAGTGCCGATATTGGGATTGCTGCAGACTGACCCTGAAACGCGTGACTACACCAATGACACTAATGATAAACTACCCAAGGCTGGGCGATTGGTTGTTTACGGCGACTCCTCCTGTCTGGAAGGAGGAGCGGCCAGACCTTGTCACTGGTTACTTCTGGCAGCTCTGCAATACGCATTGGTCGGACATATGCCGTCATCGCTCTTGGACGCAACGACATCTACACAACACAGAGACGTTAACATAATACCATCAGATCTCCCGAAGCGTGCTGAAGGTGGTCGTCTCCACGCGTACTCTCGGGTTCTGTCACCAGATGGCAGCGGTCCGAGACCATTGCCCGATTGCGTGGTGACAAACCCCATGGACCCTGAACCCGTACATGCACCACCATCCGCTAGGACCCTTGCACCAAGACACAAACCCACCGACCCCAAGAGCATTGGCGCACCGGAAATCGAAGGCACGGAAGCAGCACCCCGAGCGTGGCGTGGAGCTGGAGTCGCAGCAGCTCGCAGCGTCGAGGCCGATCCCATCCAGACATCATTCATCAGTCGACTCATATCAATATGCTCCGTGTTCGTGATAATATATTGCATTGCTGTATTCTGGAAACGATGTGCCCGTATTATCAAGAGACGCAGACTTGTCTCACTGGCCACCTAG

Protein sequence:

>DPOGS206129-PA
MGLVQLVYLFWLSYYNFVVFAEDTNILCNVTVNERLEYKFDSDIVNTEHIITFKGYYSKTTRENYVNAALKNAQVSNWTILQRNNPAMEYPSDFDVIVFGEKIREGIDALRDHPAVRRVTAQRQVQRTIKYVREDDCGPSGCMYSGWRNHRRSRVLHSLRKTRENGGYTSRKLLRTVPRQITSVLKADLLWSLGVTGEGIKVAVFDTGLARHHPHFGRVRERTDWTGENTLDDALGHGTFVAGVIASRSDCLGFAPDADLHIFRVFTDNQVSYTSWFLDAFNYAIMRKIDVLNLSIGGPDFMDHPFVDKVWELSANKVIMVSAIGNDGPLYGTLNNPADQMDVIGVGGIGFDDRIAKFSSRGMTTWELPYGYGRMKPDIVTYGSGVRGSSVNGGCRSLSGTSVASPVVAGAIALLASGVPRQNLTPAAVKQALCITARRLPGYNMFEQGHGKLDLISAYQFLREYEPQATLSPSYIDLTECQYMWPYCTQPLYYSAQPTIANVTVINGLGVVGEVKKVSWHPHLPHGTILAVGADYNEVLWPWSGWLALSFTVLEAGANFDGVVEGHMNITIESYDEVNDRVMKNTTLMLPIRARVIPVPVRGRRLLWDQFHSLRYPGGYFPRDDLRAKHDPLDWHADHVHTNFRDMYRRLREHGFYVEVMGNPLTCIDTSLYGALLLVDPEDEYFPEEMATLKRAVDSGLSLIVFADWYNASLLRHVKFYDENTRQWWIPETGGTNVPALNDLLSMFQVAFGDRVFEGSFKLAGHPMYYASGTHIHSFPEHGVLVSAKLSDQGQQIMSGEKSGGGQTRKTVEVPILGLLQTDPETRDYTNDTNDKLPKAGRLVVYGDSSCLEGGAARPCHWLLLAALQYALVGHMPSSLLDATTSTQHRDVNIIPSDLPKRAEGGRLHAYSRVLSPDGSGPRPLPDCVVTNPMDPEPVHAPPSARTLAPRHKPTDPKSIGAPEIEGTEAAPRAWRGAGVAAARSVEADPIQTSFISRLISICSVFVIIYCIAVFWKRCARIIKRRRLVSLAT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: