MonarchBase - Protein-coding gene

DPOGS215392
Transcript	DPOGS215392-TA	1992 bp
Protein	DPOGS215392-PA	663 aa
Genomic position	DPSCF300088 - 276169-288747
RNAseq coverage	7x (Rank: top 87%)

Annotation
*Heliconius*	HMEL003674	0.0	69.80%
*Bombyx*	BGIBMGA012439-TA	4e-157	73.77%
*Drosophila*	Fur2-PC	2e-141	43.93%
EBI UniRef50	UniRef50_D6X568	0.0	54.81%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6X568_TRICA
NCBI RefSeq	XP_001809621.1	0.0	54.41%	PREDICTED: similar to prohormone convertase 1 [Tribolium castaneum]
NCBI nr blastp	gi\|270000764	0.0	54.81%	hypothetical protein TcasGA2_TC004402 [Tribolium castaneum]
NCBI nr blastx	gi\|270000764	0.0	54.72%	hypothetical protein TcasGA2_TC004402 [Tribolium castaneum]

Group
Gene Ontology	GO:0004252	1.5e-97	serine-type endopeptidase activity
	GO:0006508	1.5e-97	proteolysis
KEGG pathway
InterPro domain	[11-621] IPR015500	3.5e-188	Peptidase S8, subtilisin-related
	[125-460] IPR000209	1.5e-97	Peptidase S8/S53, subtilisin/kexin/sedolisin
	[456-599] IPR008979	7.1e-36	Galactose-binding domain-like
	[504-588] IPR002884	3.9e-26	Proprotein convertase, P
	[11-81] IPR009020	6.7e-15	Proteinase inhibitor, propeptide
Orthology group	MCL17035		Patchy

Nucleotide sequence:

>DPOGS215392-TA
ATGCACGATGGAAGAGAGACCGCGAACAGTTATGATGGTGAGTGGATCGTTGAAGTGGTAGGTGGTGAGGAGGTGGCGCAGTTGGTGGCGCTGGAACACGGATATAAATACGAAGGACCGGTGCTGGGTTTGGCAAACATGTACGCGTTCCACGCACACGAGCGCAAGGAGCGTCGCACCCCGAGCAAGCACACATCCACACTGCGCAAGGACAGGAGGATTCGATGGGCGGAACAACTCTTTGCAAAAAGTCGCGTGAAGCGATATCCGTACCCTGACCTCGACGGCACATTAAAACGAGTAAAAAGAATAGATGAATACACCAGGGATGCAGACTTTACGAGGAGTTCAACCGTGGAACACGGACGGAGGGAGGTCTTCAATGACGAGCTCTGGGCCTACGAATGGTATTTGCAAGACACTCGTGACAATCCAAACGTACCTCGCCTGGACCTCAATGTGTTATCGGTGTATAATATGGGCTACAACGGACGTGGTGTTCGCGTGTCTATACTCGACGACGGAGTCGAACACAATCACACGGACTTACAGAACAACTACGATCCGGAAATCAGTTGGGATTGCAATGATGGAGACTCGGATCCATATCCGAGGCATGACGATAAAAACCGGAATTCTCACGGCACGAGATGTGCCGGTGAGATAGCGATGACGGCTAACAATAAGAAGTGCGGAGTGGGCGTGGCCTGGGGCGCCAAAGTGGGTGGAGTCAGAATGCTCGATGGACGAATCACTGATCATGTTGAAGGCGAAGCAATAGGATTCGCGTGGGACAAAGTGGACATATACAGCGCTTCATGGGGCCCCAACGATGACGGAGAGACCGTGGAGGGTCCAGGGCGACTCGCCATGGAGGCCTTCAAGAGAGGAGTGCAAATGGGCCGGAACGGTAAAGGGAATATATTCGTGTGGGCCAACGGCAATGGTGGAACACACGACGATAACTGTAACTGCGACGGCTACTCTTCCAGTATGTACACGATATCTATTGCTAGCGCTTCCCAACAAGGCCTGTTTCCTTGGTACGGAGAGATCTGCTCCTCGACTCTAGCAACCGCATACTCCTCTGGTGCTTACAGTGATCAGAAAATTGCCACTACAGACGTAAACGACTCGTGTACACTTGGGCACACGGGCACCTCTGCAGCGGCGCCATTGGCGGCCGGTATTATTGCTTTAATGCTAGATGCCAACCCAAATTTAACTTGGAGAGATGTCCAACATCTGATTGTATGGACTTCGGAATATACACCGCTATCTGATAACCCCGGTTGGCAAGTCAACGGCGCGGGTCTTTATTTCGACGTACGTTTCGGCTTTGGTCTTTTGAACGCCGGATCTCTTGTCAACGCCGCACTCAACTGGACTACAGTACCAAGTGCACTATCGTGTAGAATCGATGCTTCTCCGATCAAAGGCAAAGTCGCCATTTCAGCAATGGAAACTGTAGATATAACAGTAAAAGTATCGGACTGTGAAGTAAATTACTTAGAACACGTCGAACTGTATGTTAATATCGAGTATACGCGAAGAGGTGCTTTGGAAATACACCTAATTTCTCCTCAAGGTACGATGGTTCAACTACTCAGTCCTCGTCCGAGAGATACGTCCAAGGTCGGCTTTGTTAACTGGCCTTTAACCTCAGTAGCGACGTGGGGAGAGAGAGCTAATGGACTTTGGAGGGTCATCGTACAAGACAAGGGGAATAAATGGAACACGGGTTATGTCGGTGAACTGGTTCTCATAGTCCACGGTACAAAGGAAATGCCCGCTCACATGAGGAGTGGTCCGAGGAGATACGACGACACCTTCAGTCGGTACGAGATCGAGTCGTATGAGGATGAGCCGGCGGTACCAGGAGACCATGAGCACGGAGGAGTCGCCAGCGCGCTACTGGACCAGGCGGACACCGAGCTACAGAGGAACTACCACAGCAGGGGGCAGCAGGCTGGCGAGCGACACCGCGATTGA

Protein sequence:

>DPOGS215392-PA
MHDGRETANSYDGEWIVEVVGGEEVAQLVALEHGYKYEGPVLGLANMYAFHAHERKERRTPSKHTSTLRKDRRIRWAEQLFAKSRVKRYPYPDLDGTLKRVKRIDEYTRDADFTRSSTVEHGRREVFNDELWAYEWYLQDTRDNPNVPRLDLNVLSVYNMGYNGRGVRVSILDDGVEHNHTDLQNNYDPEISWDCNDGDSDPYPRHDDKNRNSHGTRCAGEIAMTANNKKCGVGVAWGAKVGGVRMLDGRITDHVEGEAIGFAWDKVDIYSASWGPNDDGETVEGPGRLAMEAFKRGVQMGRNGKGNIFVWANGNGGTHDDNCNCDGYSSSMYTISIASASQQGLFPWYGEICSSTLATAYSSGAYSDQKIATTDVNDSCTLGHTGTSAAAPLAAGIIALMLDANPNLTWRDVQHLIVWTSEYTPLSDNPGWQVNGAGLYFDVRFGFGLLNAGSLVNAALNWTTVPSALSCRIDASPIKGKVAISAMETVDITVKVSDCEVNYLEHVELYVNIEYTRRGALEIHLISPQGTMVQLLSPRPRDTSKVGFVNWPLTSVATWGERANGLWRVIVQDKGNKWNTGYVGELVLIVHGTKEMPAHMRSGPRRYDDTFSRYEIESYEDEPAVPGDHEHGGVASALLDQADTELQRNYHSRGQQAGERHRD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: