MonarchBase - Protein-coding gene

DPOGS213461
Transcript	DPOGS213461-TA	1251 bp
Protein	DPOGS213461-PA	416 aa
Genomic position	DPSCF300100 - 454490-458444
RNAseq coverage	133x (Rank: top 56%)

Annotation
*Heliconius*	HMEL016827	5e-126	58.45%
*Bombyx*	BGIBMGA004487-TA	2e-114	58.15%
*Drosophila*	CG13430-PB	2e-18	32.67%
EBI UniRef50	UniRef50_Q5BAR4	8e-20	27.30%	Serine protease similarity, trypsin family (Eurofung) n=1 Tax=Aspergillus nidulans FGSC A4 RepID=Q5BAR4_EMENI
NCBI RefSeq	XP_002087645.1	1e-22	26.23%	GE15163 [Drosophila yakuba]
NCBI nr blastp	gi\|195470701	2e-21	26.23%	GE15163 [Drosophila yakuba]
NCBI nr blastx	gi\|170038379	5e-18	34.12%	trypsin 2 [Culex quinquefasciatus]

Group
Gene Ontology	GO:0003824	6e-40	catalytic activity
	GO:0004252	3.3e-36	serine-type endopeptidase activity
	GO:0006508	3.3e-36	proteolysis
KEGG pathway	ani:AN2366.2	4e-20
	K01312 (E3.4.21.4, PRSS1, PRSS2, PRSS3)	maps->	Neuroactive ligand-receptor interaction
InterPro domain	[69-266] IPR009003	6e-40	Peptidase cysteine/serine, trypsin-like
	[71-364] IPR001254	3.3e-36	Peptidase S1/S6, chymotrypsin/Hap
Orthology group	MCL25025		Lepidoptera specific

Nucleotide sequence:

>DPOGS213461-TA
ATGAACTGGGTTCTCGTTTTTATGACTCTATCAATGTTTTATAGCTATGTTCTGAGCTATGGAGACCAGGCCTCAGTAGTTAAATTTAAATTCAATCTGGACCCGTATGGAGAGGCTCCGCTCCAAGATGGCCGACGGAGACATCGAGATAACAAAAAATCATTAAGAGTCCGAAACGACTTCCTGTTCAGTTTAAACAAAGACGCTCTCAGGATCCGGGGGGGGAATGCCACGGATACGACCAACTATCCGTACATAGCGGCCATTATAATCAACGGCAGGTTATGGTGCGCCGGCACCATCGTCGACGTCAACTGGGTACTGACAGCGGCGCATTGTCTGAATTACGTGCTTCACGTAGCGCCAATGAAGACCCTGGGGCAGTACGTGAAGGTCAGGGTCGGCAGCGCCCAGGCTCACGAAGGAGGTTTGCTGGTAGACGTCGCGGGGGCCGTGCGACACCCGAAATTCGAAGAGGAACCCGTGCCTCATGCTGATGTAGCTTTATTGAAACTGACTGAAAACCTTGAATTCTCAACTCACATCAATCTGATTAAAATAAACGAAGATATGAGAGAGCCTTACGCGCAGAGTTTCGTGTCTGTAACCGGCTGGGGAGCGACCCGTGGCACAGACACAGCCTTCAGAGAACACACGCCCGACCTGATGACGGCTCGTCTCAAGGTTCGCACGGTCAACTACTGCAGAGACGCGTACCAACTGGTTAGCGGGTTTCAGTTCACCGCAGACTTCTTCTGCGCTTCGTTGAGAAACGGCACCAGAGACGCGTGTTTGGGCACAGACACAGCCTTCAGAGAACACACGCCCGACCTGATGACGGCTCGTCTGAAGGTTCGCACGGTCAACTACTGCAGAGACGCGTACCAACTGGTTAGCGGGTTTCAGTTCACCGCAGACTTCTTCTGCGCTTCGTTAAGAAACGGCACCAGAGACGCGTGTTTGTTCGACGCGGGCGCGCCAGCCACCCAACACAACAAATTAATGGGCGTCATGAGCTTCGGGCCCGAGCGTTGCGGACACGAATACCAACCAGCGGTGTTCATTAAGGCTTTTTATTTCAGGGATTTCGTGAAGCACACTATATCCTCATATAAGACTACAGCTGAACTTATAGAAGCCATGAAAGATATCGACAAAGTTATCAGACCACCCGTTCATGTGAAACAGGAACACGTGGTCGTCGAGAAAGATGAGCAAGAGGTCACGGAACCAGATTATAAACACGATTGA

Protein sequence:

>DPOGS213461-PA
MNWVLVFMTLSMFYSYVLSYGDQASVVKFKFNLDPYGEAPLQDGRRRHRDNKKSLRVRNDFLFSLNKDALRIRGGNATDTTNYPYIAAIIINGRLWCAGTIVDVNWVLTAAHCLNYVLHVAPMKTLGQYVKVRVGSAQAHEGGLLVDVAGAVRHPKFEEEPVPHADVALLKLTENLEFSTHINLIKINEDMREPYAQSFVSVTGWGATRGTDTAFREHTPDLMTARLKVRTVNYCRDAYQLVSGFQFTADFFCASLRNGTRDACLGTDTAFREHTPDLMTARLKVRTVNYCRDAYQLVSGFQFTADFFCASLRNGTRDACLFDAGAPATQHNKLMGVMSFGPERCGHEYQPAVFIKAFYFRDFVKHTISSYKTTAELIEAMKDIDKVIRPPVHVKQEHVVVEKDEQEVTEPDYKHD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: