MonarchBase - Protein-coding gene

DPGLEAN21569 in OGS1.0

New model in OGS2.0	DPOGS205232
Genomic Position	scaffold1893:+ 2-12213
	See gene structure
CDS Length	2259
Paired RNAseq reads	2688
Single RNAseq reads	6891
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA014404 (2e-53)
Best Drosophila hit	CG5390 (8e-57)
Best Human hit	coagulation factor XI precursor (8e-23)
Best NR hit (blastp)	serine proteinase-like protein 1 [Helicoverpa armigera] (1e-68)
Best NR hit (blastx)	serine proteinase-like protein 1 [Helicoverpa armigera] (1e-69)
GeneOntology terms	GO:0004252 serine-type endopeptidase activity GO:0006508 proteolysis
InterPro families	IPR001314 Peptidase S1A, chymotrypsin-type IPR001254 Peptidase S1/S6, chymotrypsin/Hap IPR009003 Peptidase cysteine/serine, trypsin-like
Orthology group	MCL22649

Nucleotide sequence:

ATGTTCGTCTCAGGTCGTAAGTCGTGCACCAACGATAAAAATGAACAGGGACTGTGTGTC
AGGAAGGCGTCCTGCGTGAACGCTGTGCAGACAGTTGACCCCACAATCAATTTCAATCTC
AGGGAACGCGAGTTATGCCACTACTTAGAGACCTGCTGCTTGGAGAAGAACATCAAAAAG
AAAGCTGTGAAACCGATTCGTCAGCAAAACACCGGCTGCGGCTGGAGCAACCCTGGCGCC
AACGTGTTCAGGGAGAAGAACTCGCCAACAGGTTTCGCTGATTACGGGGAATTCCCGTGG
ATGGTAGCTTTAATCCAGAAGGGTACCGGAAAAGATGGCTTCAACGAAAGTTACGCTGGC
GGAGGAGTTCTCATCCATCCGTCAGTAGTCATGACAGCGGCGCATAAAGTACAAAATTTC
AAACCGGAAGTGGTAAAAATCCGAGCCGGCGAATGGGACACTCAAACAGACGCGGAAGTG
GAGCCCTATCAAGAGAGAGACGTCTCTAAGATCATTATACACGAAGGTCACAATGAAAAA
CAGCACAACGATGTGGCGCTTCTGATTCTGAAGTCGCCAGTGGATCTGTCAGATGCTCCT
CACATCGCTGTAGGTTGTCTAGCATCTCGTCTCCCCCCACCTGGAACGAGGTGTTACAGC
ATGGGATGGGGCGAAGACTTCCTCAATGACAACAAATACGCCGTCATTTTAAAGAAGGTG
GAACTGCCCCTGGTAGAAGCCTCGGACTGCGAGAGTCGTTACAAACGCACGGTTCTCTCG
AGCGCTTACGTTCTGGATAAGACGTTGATGTGTGCGGGGGGCGAGCAGGGAGTTGACACG
TGTCGCGGAGATGGGGGGAGTCCGCTGGTGTGTCCCATTAAGGGTCAGCCTGATAGGTTT
GAGGTCGTCGGTCTGGTGGTGTACGGCCTGCAGTGCGGGACGGGCGGTCTCCCAGGGGTA
TACCTGAACGTCCCGCAAGTACACGACTGGGTCGCGCTCGTCTTCCCACCAACTTGTTTG
ATAACTGTCAGTGGGGTTTACAACCTTGAAGCGCGGAGTCGTCTCAAAATGAGTGTCAAG
ATATTTATAGTTGGCCTGGCGTTACTGTACGCAAACGCTACACCAGATAACGACCTAAAC
GACTGGTTGAATTTCATATCGAAGCAGAATAAAGAAAGTTCAACGGGATCTGAGGAAAGT
AATCCAGACTTGACGCCCACGAATGTTAAATCATCGGATGCTGAAAGAACGTGTAAAATA
AACAAACATGAAGAGGGAGTGTGCGTCGACGGAAGTCTCTGCGACGGAAATCCTGATGCC
ACAATATCATTTACATTAAGGGAAAAAAGCACTTGTAATGGCATTGAGGTGTGCTGTTCA
AGAAATGACATAAGAACTATTTCAACGACGCAGCTCATGGCTCCAGACGGTTGTGGCTTC
AGCAACGCTGGGGCGATACCATACCAGAGACCCTCAGACCCTGGATATGCTGAATTCGGG
GAATTCCCTTGGATGATAGCTGTGATTAGAAGGTCCGGTGACATCGGAGATTTTGACGAC
AAATACGCAGCGGGAGGCGCTTTGGTACATCCGAAGGTTGTCATAACCGCAACCCATAAG
GTCAGGGACTATGGGCCGCAAGAGTTGATGGCGCGAGCCGGTGAATACAACACTCGCTCC
ATATCTGAAGTCTTCTTTCACCAAGAAAGGGGCGTCGCAAAAATTGTAACACACAAACAG
TTCTCTGATGTGCACGTCCACTACGACGTCGCGCTGCTGATGCTGTCCGCCCCATTCAAC
CTAGTGGACGCCCCTCACATCGGGGTCGCGTGTTTGGCGTCTCGCCTCCCACGCCCGGGG
ACCAGATGCTACAGCATGGGCTGGGGGCACGACTTCCTCAACCAGGACAAGAACTCCGTC
ATTCTGAAGAAGGTGGAAGTGCCTTTAGTGGAGTCGTCCACATGCGAGCATCAGTATAAG
AACACCAAACTGGGCTCCCAGTTCCACCTCCACAGGACCCTGACCTGCGCGGGGGGTGAG
GAGGGCGCGGACACGTGCAAGGGTGACGGCGGCAGTCCCCTCGTGTGCCAGATACCGAAC
ACCCAGAGGTTCGAGGTGGTGGGTCTCGTGGCGTACGGCCTGGGCTGCGGGACGAAACTG
CCAGGTGTTTATGTGAACATACCAGAGCTCTTCGACTGGGTCGGCGGAGAGTTCACCTGG
GCAGGACTCAATAAAAGCTCTTTCGTATATACGGCGTAG

Protein sequence:

MFVSGRKSCTNDKNEQGLCVRKASCVNAVQTVDPTINFNLRERELCHYLETCCLEKNIKK
KAVKPIRQQNTGCGWSNPGANVFREKNSPTGFADYGEFPWMVALIQKGTGKDGFNESYAG
GGVLIHPSVVMTAAHKVQNFKPEVVKIRAGEWDTQTDAEVEPYQERDVSKIIIHEGHNEK
QHNDVALLILKSPVDLSDAPHIAVGCLASRLPPPGTRCYSMGWGEDFLNDNKYAVILKKV
ELPLVEASDCESRYKRTVLSSAYVLDKTLMCAGGEQGVDTCRGDGGSPLVCPIKGQPDRF
EVVGLVVYGLQCGTGGLPGVYLNVPQVHDWVALVFPPTCLITVSGVYNLEARSRLKMSVK
IFIVGLALLYANATPDNDLNDWLNFISKQNKESSTGSEESNPDLTPTNVKSSDAERTCKI
NKHEEGVCVDGSLCDGNPDATISFTLREKSTCNGIEVCCSRNDIRTISTTQLMAPDGCGF
SNAGAIPYQRPSDPGYAEFGEFPWMIAVIRRSGDIGDFDDKYAAGGALVHPKVVITATHK
VRDYGPQELMARAGEYNTRSISEVFFHQERGVAKIVTHKQFSDVHVHYDVALLMLSAPFN
LVDAPHIGVACLASRLPRPGTRCYSMGWGHDFLNQDKNSVILKKVEVPLVESSTCEHQYK
NTKLGSQFHLHRTLTCAGGEEGADTCKGDGGSPLVCQIPNTQRFEVVGLVAYGLGCGTKL
PGVYVNIPELFDWVGGEFTWAGLNKSSFVYTA