MonarchBase - Protein-coding gene

DPOGS210980
Transcript	DPOGS210980-TA	927 bp
Protein	DPOGS210980-PA	308 aa
Genomic position	DPSCF300004 - 152051-157716
RNAseq coverage	382x (Rank: top 31%)

Annotation
*Heliconius*	HMEL025004	6e-100	64.94%
*Bombyx*	BGIBMGA006406-TA	1e-124	80.63%
*Drosophila*	CG4914-PA	4e-114	66.90%
EBI UniRef50	UniRef50_Q9VUG2	5e-112	66.90%	CG4914 n=25 Tax=Neoptera RepID=Q9VUG2_DROME
NCBI RefSeq	XP_968105.1	1e-122	68.09%	PREDICTED: similar to AGAP004571-PA isoform 1 [Tribolium castaneum]
NCBI nr blastp	gi\|364023627	3e-154	82.14%	seminal fluid protein CSSFP038 [Chilo suppressalis]
NCBI nr blastx	gi\|364023627	4e-157	82.14%	seminal fluid protein CSSFP038 [Chilo suppressalis]

Group
Gene Ontology	GO:0003824	2.1e-95	catalytic activity
	GO:0004252	1.2e-91	serine-type endopeptidase activity
	GO:0006508	1.2e-91	proteolysis
KEGG pathway	bta:533547	5e-44
	K01324 (KLKB1)	maps->	Complement and coagulation cascades
InterPro domain	[58-301] IPR009003	2.1e-95	Peptidase cysteine/serine, trypsin-like
	[66-296] IPR001254	1.2e-91	Peptidase S1/S6, chymotrypsin/Hap
	[93-108] IPR001314	2.3e-17	Peptidase S1A, chymotrypsin-type
Orthology group	MCL14852		Single-copy universal gene

Nucleotide sequence:

>DPOGS210980-TA
ATGTGGAAGTGCTTTCTTTTATTTGTGTTTTTGTTAACTTTCACTCTATCGGAGGGTGATTTATTGCGTACGAAGCGTGGTGTGTATTCGAAGAATTTCTTCGGTGGTGTTTGGGGCAACCGACCACCACTACTTGAAGCGGGCCAGGCCAAGACTACGTGCACATGTAAATGTGGCGAAAGAAATGAAGTCTCCCGCATCGTAGGGGGTGAGGAGGCTGGTGTCAATGAGTTCCCTTGGGTTGCCAAAATGACATATTTTAAAAAGTTCTACTGCGGCGGTATGCTGATCAACGACAGATATGTTCTTACCGCAGCACATTGTGTGAAAGGATTTATGTGGTTCATGATAAAGGTGACTTTCGGTGAACACAACCGTTGTAACGCGACCACGCGCCCCGAGACTAGATTTGTTATTCGCGTCATTGCCAACAAATTCTCTCTCGCCAACTTTGACAATGATATCGCCTTACTTCGTCTGAATGAGAGGGTTCCCATGACTGCTGCTATTAAGCCTATATGCTTGCCAAGTGACGATAGTGACCTCTATGTGGGTGTTAAAGCAGTGGCTGCAGGATGGGGAACGTTGACGGAGGAGGGAAGAGTATCGTGCACACTGCAGGAAGTTGAGGTGCCAGTATTGAGTAATGAAGAGTGTCGCAATACTAAGTACACTTCCTCAATGATCACTGACAACATGCTGTGCGCGGGATACCCCAAGACGGGACAAAAGGATTCCTGTCAGGGAGACAGTGGTGGTCCGCTCATCACAGAGAGAAAGCACGACAAACGCTATGAGCTAATCGGTGTCGTATCTTGGGGTAACGGATGTGCTCGGGTGGGTTACCCTGGCGTCTACACACGGGTTACCAAATACATAGACTGGATTAAGGAAAATACTAAAGACGGGTGTTTTTGTACAGATTAA

Protein sequence:

>DPOGS210980-PA
MWKCFLLFVFLLTFTLSEGDLLRTKRGVYSKNFFGGVWGNRPPLLEAGQAKTTCTCKCGERNEVSRIVGGEEAGVNEFPWVAKMTYFKKFYCGGMLINDRYVLTAAHCVKGFMWFMIKVTFGEHNRCNATTRPETRFVIRVIANKFSLANFDNDIALLRLNERVPMTAAIKPICLPSDDSDLYVGVKAVAAGWGTLTEEGRVSCTLQEVEVPVLSNEECRNTKYTSSMITDNMLCAGYPKTGQKDSCQGDSGGPLITERKHDKRYELIGVVSWGNGCARVGYPGVYTRVTKYIDWIKENTKDGCFCTD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: