MonarchBase - Protein-coding gene

DPOGS214422
Transcript	DPOGS214422-TA	5055 bp
Protein	DPOGS214422-PA	1684 aa
Genomic position	DPSCF300069 + 430410-450604
RNAseq coverage	8087x (Rank: top 2%)

Annotation
*Heliconius*	HMEL010874	0.0	61.01%
*Bombyx*	BGIBMGA011362-TA	0.0	52.36%
*Drosophila*	scaf-PA	3e-42	36.74%
EBI UniRef50	UniRef50_D2A6A6	3e-61	48.13%	Serine protease H164 n=2 Tax=Tribolium castaneum RepID=D2A6A6_TRICA
NCBI RefSeq	XP_966561.1	2e-62	48.13%	PREDICTED: similar to AGAP008091-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91085063	4e-61	48.13%	PREDICTED: similar to AGAP008091-PA [Tribolium castaneum]
NCBI nr blastx	gi\|270009295	4e-59	48.12%	serine protease H164 [Tribolium castaneum]

Group
Gene Ontology	GO:0003824	2.7e-46	catalytic activity
	GO:0004252	5.6e-30	serine-type endopeptidase activity
	GO:0006508	5.6e-30	proteolysis
KEGG pathway	ecb:100056650	3e-17
	K01324 (KLKB1)	maps->	Complement and coagulation cascades
InterPro domain	[1182-1442] IPR009003	2.7e-46	Peptidase cysteine/serine, trypsin-like
	[1200-1429] IPR001254	5.6e-30	Peptidase S1/S6, chymotrypsin/Hap
Orthology group	MCL25840		Lepidoptera specific

Nucleotide sequence:

>DPOGS214422-TA
ATGAAGCCACTGCTATCAGTGGTGTCGCTGTGCCTTCTGCTGTGCGTACACGCGCTGCCGGAAAACATCGAAGACGTCAAAGAATTACCTCAATCCAAAGAACCGATAGTGGAAGCAGAAGAATCGAAGCCTCAAGCGAGAGCCGAAAGATGCACGACCTGTAGCACACTTAAACTAGGCCTTAAGTCCCCAAAAGAAGTATTAGCAGCCTTGCATTCCTTGCCGGGAGCGGAAGTACACACTCAGCAGTCCTTCGAAGGCTGCTCCAGCGATAAAGGATGTGCAGGACTGAAGCTCAAGGACGGAAAAGTCATAGAACGTTTCGGGAACGTAGAGGCCTTCAAAGCCGCAGCTGCCTCCGATGTGAACAACGAGTTCAACTTCCACGCCGGTTTCGGAAGCGATTTGTTCAAAAGCGCCAACTCACCATTCTGGTGGATGAACCAAGACAGTCCTTTCAATGGCGGAGCTAACGGTGCTAGCTTTGAGAAATTCAGCAAATCCTCAAGTTTCTCCTCCGGTAGTGGAGGTAACGCTGCATTCACTGGAATGGACCTATCAGCTAACCCGTTCTTAAACGGACAGTTTTCCAACCTGGGTCTTGCTGGTGATGCTAGCTCTGTAAATCCCTTCCAATCATCAACCTTCGAGTCATCGGCATTCAGTGCCTCTAGCAAAACCGGTCAGGCTGGACTCCAAGGTTTCGGAGCTCAAAACGCTGCTTCGAACTTCGGAGCTAGTGCCTTCAACTCTGGTTTCGCTGGCAATAAATTATCTGGCTTCAGTGGTTCAAGCCCAGCACCTTTCGGATCTGGAGCTAACGTCAACCTCATTCAGAACGCCCAAAAGAACGACTTCGATTTCGAGCAACAGCAAACTCAACAGAACATCGACGAAATCTTCCAAAACGCTGGAAACCTCGGCGTGGACGCGGGGGTTACAGCTGGGGAGTTGCAGCAGACCTGCTCCGGCTTGGGATACGCCTGCGTGCTGAAAACACAATGCAACAACGGCGTCGTAAACATCAACGGAGCGGCTGCGCTACAAGCTAAAACTAAGAAGCAATACTGCAACCTTGCGACGGAAATATGCTGCAGAATCGAGACCGCTCAAGGAGCCGTTGGATCTACCGCCGGCCAGGGTTCTGGTCTCTTCGCTGGACAAATTGGTTCCGTATCCGGAGGTTACGGCAGTCAGACAACCCAAAGTGGATTTTCAAACGGATTTGGTGCTAAAGGCACCTTTGCAACCGGAGCTTCTTTCGGATCTGGCATCGGATCTGCCAACAGAGGCATCACGGTCGAATCCACTAAATTCGGATCTGGATATGGCTCGACTCTCGCACCCACCACATCCAGATTTGGATCCAACGGCTTCAAATCCACGAGCCAAACGAACTTCATCGACGCTGATTCACTAACCGCTGGCAGTGAAGCTGCTGGTGTTTACCGACCTGGTGCTGTCGGATCTGGTTTGAAACCTGGTATCCCCTACCTCCCACCCATCGACGTCACAGGCAGTGGCAGTAATGTCGTCTCCACAACCGTCTTCCCTACCCCTACCATAATCACGACTCCTAGACCATTCACAACCCCAAAACCGACCTATCTGCCCCCTATTTCATCAACCTCAGCCCCAGGTTACTTACCACCTATCGGGGAACCAACCAACAACAGAGAGACCATCGTCCCTAAACCTGATTATCAAGATGGTTCTATAATCCTGGACGAAAACAGATTCCCCACAGCTAGACCTACCCCCGTGCCTGCACCGAGTGAAATCCCCGCTGGATGTGCCGCCGCCCTAAAGTGTACTGCCGTCGAGTTCTGCACAGCTGAAGGTGTGATCTCAAACGTTACTGTCTTTTTGACCAGAGATCAAGAGGCTTACAGAGTACCTCTCACGGATTGCCGTGACTTGGAGACTGGACGCATTGGTAAATGCTGCCGGGATCCTTACTACACCGACCCCTGGCCTGTGAACCAGCTGGGTAAGTGGGTGCCCGGGGTATTCGGGGGTAACGACGGTAAATACGTTCCGGATAGCAGAGTTAGTCCAAACAATATCAGACCCAGTGTCACGGTCCGCCCTCCTGTCACCGGTTCCGTCATATCACCAGCCTTCCTGACTAAACCCACGCCTACACCATTTGGGCCCAACCAAGTTTCTCCTGGTTTTGGCTCCACTGTAACTCCATTGAATCAGAGAGGTCAGGGTCAGTTCCCTATCGGAGGTCAAGGACAATACAATAAAGGTGGTCTGGGACAATTCTCTCAAGGGGGACAGGGGCAATTCACATCAGCTGGACAAGGACAACTTGGCATCATAGGACAAGGTCAAATTGGATCTGGATCTGCAATCAACACAGCGTTCGCCCAAGGACAGGTTGCACAAAAGGGACAAGGGTCGTTTGTGTCCCAAGGACAGGGAGTGGTTGCATCCAGGGGCCAAGGTCAAGTGGTAAACAGAGGTCAAGTTAGCAAGGGACAAGGTTTCTTGGTGAATCAGGGTGCGGGGGTTGGAATCAATAAACAGCAGGGACAGTTCGTCAGTCAGGGTCAAGGACAAATAGTGTCCCAAGGTCAAGGACAAATTGTTTCCCAAGGAGTGGGACAGGGAGTCAGACAAGGAGTCGGGCAATACGGCCAAGGACAGCTTGGTATCCAAGGACAAGGTGTCCAGTCGCAATTTGGTGCTGGGCAAAATGGCTTAGGCGTAGCAGCAATTGGAGCACAAGGAGTGAACGGTCAGGGACAGCTCGTAAATCAAGGACAGGGCCAATTCGTATCAAAAGGTCAAGGCAGCGCTATCAATCAAGGATTTGGTACTGGCATCCGTCAGGGAAGCGGCGTGGTTGCGTCTCAAGGATTCGGGCAGGGAGTGCGACAAGGACAAGGCACGGTTGTGTCGCAAGGATTCGGTCAGGGAGTCCGTCAAGGACAAGGACTCCTGGTCAATCAGGGAGAGGGACAAGTATCTTCGCAAGGACAGGGACAATTTGTAAGCCAGGGTCAAGGACAACTCCTAAATCAGGGACAGGGACAATATGTATCGCAAGGTGAAGGACAGCTAGTCTCTCAAGGACAGGGTGCTCTTGTGTCCCAGGGTCAAGGACAGCTGGTCTCTCAAGGACAGGGTGCTTTTGTATCCCAGGGTCAAGGATCTCTTGTTTCCCAAGGATTCGGACAAGCCATCCGTCCAGGACAAGGCGCTTTCCTGACTAATGGCCAGGGACAAATAGTCTCTCAAGGAGGAGGAGCTCTGATCAATCAGGGTGAGGGAGCATACGTCACAAATGGCTTCGATCAAATCCGCCGAGCTCAAGCCCAACTCGTATCTACAAAGGAAGGGCAGTTGGTTACGCAAGGGGAAGGAGAGCTTGTTTCACAAGGCCAGGGGCAGAGAGTGTCGCAAGGATTCGGTCAGGGTGTCCGCCAGGGGCAAGGATTCTCTGTGACGCAGGGCGGAGGGTATGGTGTTGAAAACGAGTACGGTGAATCAGTGCAGAGGGTTTTCCTTCAACAGTACAACGCTGGAGGACAATGTGGTGTTCTGAATGGCCAACGTCCTTTTGGCAACCGCAATGAATTGGAAGCCGATTTCGCTGAGATACCCTGGCAGGCGATGGTGCTGTTGCAAACTAACAGAAGCCTGCTGTGCGGCGGAGTCATCACCAGACCTGATGTGGTCGTAACCTCAGCCGCCTGTGTTGAAGGCCTGGATGCCAAGAACGTGCTGATTAAAGGAGGTGAATGGAAGCTCGGGATAGACGACGAGCCTCTGCCGTTCCAGATCGTCCAGGTCAAGACGATTCTCCGCCATCCGCTGTACAAACACAGCAACCTCCACTACGACGCTGCTATCCTGGTACTCGCTGAGAACTTGAGATTCGCTAAAAACATCTATCCCATCTGTCTCCCTGACAAGGATGACAGTTTGGACAAATACTACAACGGCGTCGGAGAGTGTATCGTAACGGGATGGGGCAAGCAAGTCCTCCAAGCTCACCTTCAAGGCAGTATAATGCACAGCATCAACGTCTCGCTCATCAGCCCAGGTGAATGCCAGTCCAAATTATCATCAGAATACCCTCACCTCCTGGACCTGTACGATGAAGACAGCTGCGTCTGTGGCCAACCTTCGAACCCTCTAAATAATATTTGCAGGGTTGACATTGGCAGTGCTCTTGCCTGCACGACTGGCGACGGTCATTACACCTTCCGAGGAGTGTACTCCTGGGATTCCGGATGTCAAGTCGGAAACCAAGTGGCTGGTTTCTATAGATTCGACCTGGAATGGTACCAGTGGGCCATCGGTCTCATCGAAAGCGTCAGATTCGCTCAATACAGTACAGTTACCAAGGTCACCACGGGGATATACACTGGTCAAATAAAGGGTGGAGTGAAGGGCTTCTCTGGAGTCAAAGGAGTCAAGGGTTCGTCAAACTCTGGCTCATCCATCAGAGCTGGTGCTGTAGCTTCAGTTTCATCTGGAGCAGTCTCTTCGGGATCATCAGGAGTCATAAGTGGCCTTAATAGCTTCAACTTTGGAAAAGGTCAATTCGGATTTGGACAAAGTCAAGGCCAGCTATCTGGTAACCAAGGGCTGGTCAGTCAGGGACAGTTCGCTGGTAAAGTGAACCAGTTCCAGGAAAAAATAAACAGTGGTAGCTCAAGCCAAGCCGGTTTTGGAGATGGATTCAACTTCAGCGAAATCAAACCGATCACTAACGGCTTCAGCGCCACCTTCTCCGAGAAGAAGGTCTTCAAGACCGAACCGAAATTCGTGACATTCACAACGAAACCAGAGATCGTGACGTATACAACTAAACCAGAAATCTTCACATTTACAACCAAACCCAAAATTATTACTTACACAACCAAACCCAAAATCATAACCTACACAACCAAACCCCAGATCATCAGATACGAGACATCCGGCAGTGGGACCAACCCCCAATACGTAGCCCCAGGGGTGACCTTCAACCCCTCCTTTTCAGAATTAGTGGGTAAGCACGAACACACAGCCAAATGCAAATGTTTAGAAGGTAAATGA

Protein sequence:

>DPOGS214422-PA
MKPLLSVVSLCLLLCVHALPENIEDVKELPQSKEPIVEAEESKPQARAERCTTCSTLKLGLKSPKEVLAALHSLPGAEVHTQQSFEGCSSDKGCAGLKLKDGKVIERFGNVEAFKAAAASDVNNEFNFHAGFGSDLFKSANSPFWWMNQDSPFNGGANGASFEKFSKSSSFSSGSGGNAAFTGMDLSANPFLNGQFSNLGLAGDASSVNPFQSSTFESSAFSASSKTGQAGLQGFGAQNAASNFGASAFNSGFAGNKLSGFSGSSPAPFGSGANVNLIQNAQKNDFDFEQQQTQQNIDEIFQNAGNLGVDAGVTAGELQQTCSGLGYACVLKTQCNNGVVNINGAAALQAKTKKQYCNLATEICCRIETAQGAVGSTAGQGSGLFAGQIGSVSGGYGSQTTQSGFSNGFGAKGTFATGASFGSGIGSANRGITVESTKFGSGYGSTLAPTTSRFGSNGFKSTSQTNFIDADSLTAGSEAAGVYRPGAVGSGLKPGIPYLPPIDVTGSGSNVVSTTVFPTPTIITTPRPFTTPKPTYLPPISSTSAPGYLPPIGEPTNNRETIVPKPDYQDGSIILDENRFPTARPTPVPAPSEIPAGCAAALKCTAVEFCTAEGVISNVTVFLTRDQEAYRVPLTDCRDLETGRIGKCCRDPYYTDPWPVNQLGKWVPGVFGGNDGKYVPDSRVSPNNIRPSVTVRPPVTGSVISPAFLTKPTPTPFGPNQVSPGFGSTVTPLNQRGQGQFPIGGQGQYNKGGLGQFSQGGQGQFTSAGQGQLGIIGQGQIGSGSAINTAFAQGQVAQKGQGSFVSQGQGVVASRGQGQVVNRGQVSKGQGFLVNQGAGVGINKQQGQFVSQGQGQIVSQGQGQIVSQGVGQGVRQGVGQYGQGQLGIQGQGVQSQFGAGQNGLGVAAIGAQGVNGQGQLVNQGQGQFVSKGQGSAINQGFGTGIRQGSGVVASQGFGQGVRQGQGTVVSQGFGQGVRQGQGLLVNQGEGQVSSQGQGQFVSQGQGQLLNQGQGQYVSQGEGQLVSQGQGALVSQGQGQLVSQGQGAFVSQGQGSLVSQGFGQAIRPGQGAFLTNGQGQIVSQGGGALINQGEGAYVTNGFDQIRRAQAQLVSTKEGQLVTQGEGELVSQGQGQRVSQGFGQGVRQGQGFSVTQGGGYGVENEYGESVQRVFLQQYNAGGQCGVLNGQRPFGNRNELEADFAEIPWQAMVLLQTNRSLLCGGVITRPDVVVTSAACVEGLDAKNVLIKGGEWKLGIDDEPLPFQIVQVKTILRHPLYKHSNLHYDAAILVLAENLRFAKNIYPICLPDKDDSLDKYYNGVGECIVTGWGKQVLQAHLQGSIMHSINVSLISPGECQSKLSSEYPHLLDLYDEDSCVCGQPSNPLNNICRVDIGSALACTTGDGHYTFRGVYSWDSGCQVGNQVAGFYRFDLEWYQWAIGLIESVRFAQYSTVTKVTTGIYTGQIKGGVKGFSGVKGVKGSSNSGSSIRAGAVASVSSGAVSSGSSGVISGLNSFNFGKGQFGFGQSQGQLSGNQGLVSQGQFAGKVNQFQEKINSGSSSQAGFGDGFNFSEIKPITNGFSATFSEKKVFKTEPKFVTFTTKPEIVTYTTKPEIFTFTTKPKIITYTTKPKIITYTTKPQIIRYETSGSGTNPQYVAPGVTFNPSFSELVGKHEHTAKCKCLEGK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: