MonarchBase - Protein-coding gene

DPOGS213841
Transcript	DPOGS213841-TA	1599 bp
Protein	DPOGS213841-PA	532 aa
Genomic position	DPSCF300183 + 245550-249159
RNAseq coverage	119x (Rank: top 58%)

Annotation
*Heliconius*	HMEL005059	0.0	79.67%
*Bombyx*	BGIBMGA011594-TA	0.0	75.89%
*Drosophila*	Sb-PA	1e-127	76.36%
EBI UniRef50	UniRef50_F4WUW0	4e-136	80.43%	Serine proteinase stubble n=6 Tax=Neoptera RepID=F4WUW0_ACREC
NCBI RefSeq	XP_394101.2	4e-138	82.16%	PREDICTED: similar to Stubble CG4316-PA [Apis mellifera]
NCBI nr blastp	gi\|183979380	4e-161	88.99%	hypothetical protein [Papilio xuthus]
NCBI nr blastx	gi\|183979380	3e-172	89.94%	hypothetical protein [Papilio xuthus]

Group
Gene Ontology	GO:0003824	9.2e-98	catalytic activity
	GO:0004252	7e-91	serine-type endopeptidase activity
	GO:0006508	7e-91	proteolysis
KEGG pathway
InterPro domain	[275-531] IPR009003	9.2e-98	Peptidase cysteine/serine, trypsin-like
	[287-526] IPR001254	7e-91	Peptidase S1/S6, chymotrypsin/Hap
	[320-335] IPR001314	1.2e-14	Peptidase S1A, chymotrypsin-type
Orthology group	MCL14740		Insect specific

Nucleotide sequence:

>DPOGS213841-TA
ATGTCCCGCAAGTCGTGTACGGTCGGCGGCTCGAGAGGGGCTTGTATGTGGGTGCAGGAATGCAACAGAGTTGGAGGAATACACGCGGGAGTCTGTGTAGATGGCTTCATGTTCGGTTCATGCTGCCGAATGCCCGACCGACCTATAACAGAGACGCCGATTCCAACTACAGTTACCGATCGTCCGTCAACAACGCCATCATACACCACGACCAGCGTAACAACTATTACTCCGAGTACTACTCAAACTATACGGCCCTCTTCACAAACGGCACGGCCGTCGTTTATGACCAAACCCATAGATGGCGCTCCCACATCATATAGCTACCGCCCGCCTGAAATAAATCTGCCCTCTGTTAGCAGTTTAGATGCAAATAGCGAGCAAAACAGTGATATAGTTCATAAACTAACTTATAGCAGTGTAAATAAGTACCAAAATGTACATAGGCCAAGCAATGAAATGGAAGCTAGTCCTCACAACAAAATTTCGTCTAGTCTTAGTTTAATGGGCGCGCGCCCTATGGCTGTTTCCGAACAACACTCAGAGAATAGCATTGCTTCAGCTCATATGATGTCGCGCCCAAACAACTTGAACACAATACATTGGCAGGCTACAACTGAGCCAATATTTGTAACAAAACCGAGACCGAATTGGGAGAAACCAGTAGGGAAACCAAAACCCACAAAGAAGTTTACAACGACAACCAGCAAGCCGCATAAGAATTACATAAAACCAAAGGATCCAGCTTTAAACATGATTAACAAAACCGACGAGTCGACGCCCGCTTCCATACAAACAACAGCCGCAACGAATAGTGTCGAATGTGGCACGAGAGCGATGTGGCCACGTCCAGAAACGAGGATAATGGGTGGCAAAGACTCCAGTTTCGGTCGCTGGCCATGGCAGGTGTCTGTTAGACGGAATTCCTTCTTCGGCTTCTCATCGACTCATAGATGTGGAGGTGCTATCATCAACGAGGGGTGGATAGCGACCGCTGGTCATTGTGTAGACGATCTTCTTACTTCGCAAATACGGATAAGAGTCGGCGAATACGATTTCTCAACAGTGTCTGAACAATATCCGTATTCCGAGAGAGGTGTGGCTAGAAAGGCGGTCCATCCGAAATACAATTTTTACACTTACGAATATGATTTGGCGTTGGTGAAGCTGGATTCGCCGGTCCAGTTCGCGCCTCACATATCCCCGATATGTCTTCCAGCGAGCGATGACCTTCTGGTCGGTGAAAATGCCACCGTCACGGGTTGGGGAAGATTATCTGAGGGTGGAGTTTTGCCTTCCGTTTTGCAAGAGGTGCAAGTACCAATAGTGTCGAATGATAGATGTAAGTCAATGTTTCTACAAGCCGGAAGACATGAGTTCATTCCGGACATTTTCCTTTGTGCGGGGCACGAGCGAGGGGGCCACGACTCTTGTCAGGGGGACTCGGGGGGACCTTTACAGGTCAAAGGAAAAGATCAAAAATATTTCCTAGCGGGCATCATAAGCTGGGGTATCGGTTGTGGGGAGGCGAACTTACCCGGCGTTTGCACAAGAATATCTAAGTTCGTCCCGTGGATATTGCAAACTGTTAACTCATAA

Protein sequence:

>DPOGS213841-PA
MSRKSCTVGGSRGACMWVQECNRVGGIHAGVCVDGFMFGSCCRMPDRPITETPIPTTVTDRPSTTPSYTTTSVTTITPSTTQTIRPSSQTARPSFMTKPIDGAPTSYSYRPPEINLPSVSSLDANSEQNSDIVHKLTYSSVNKYQNVHRPSNEMEASPHNKISSSLSLMGARPMAVSEQHSENSIASAHMMSRPNNLNTIHWQATTEPIFVTKPRPNWEKPVGKPKPTKKFTTTTSKPHKNYIKPKDPALNMINKTDESTPASIQTTAATNSVECGTRAMWPRPETRIMGGKDSSFGRWPWQVSVRRNSFFGFSSTHRCGGAIINEGWIATAGHCVDDLLTSQIRIRVGEYDFSTVSEQYPYSERGVARKAVHPKYNFYTYEYDLALVKLDSPVQFAPHISPICLPASDDLLVGENATVTGWGRLSEGGVLPSVLQEVQVPIVSNDRCKSMFLQAGRHEFIPDIFLCAGHERGGHDSCQGDSGGPLQVKGKDQKYFLAGIISWGIGCGEANLPGVCTRISKFVPWILQTVNS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: