MonarchBase - Protein-coding gene

DPGLEAN17130 in OGS1.0

New model in OGS2.0	DPOGS215001
Genomic Position	scaffold14791:- 577-7173
	See gene structure
CDS Length	1632
Paired RNAseq reads	991
Single RNAseq reads	3382
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA012215 (1e-16)
Best Drosophila hit	CG31217 (4e-30)
Best Human hit	low-density lipoprotein receptor-related protein 2 precursor (1e-18)
Best NR hit (blastp)	pattern recognition serine proteinase precursor [Manduca sexta] (6e-106)
Best NR hit (blastx)	pattern recognition serine proteinase precursor [Manduca sexta] (6e-112)
GeneOntology terms	GO:0006508 proteolysis GO:0004252 serine-type endopeptidase activity GO:0045087 innate immune response
InterPro families	IPR018114 Peptidase S1/S6, chymotrypsin/Hap, active site IPR023415 Low-density lipoprotein (LDL) receptor class A, conserved site IPR002172 Low-density lipoprotein (LDL) receptor class A repeat IPR000436 Sushi/SCR/CCP IPR009003 Peptidase cysteine/serine, trypsin-like IPR016060 Complement control module IPR001254 Peptidase S1/S6, chymotrypsin/Hap
Orthology group	MCL10336

Nucleotide sequence:

ATGGCTTGCAACGGACTATCGGACCCGCTCTCCGATTTGATGATCCGCAGACCTAAACGT
CAGACGCAAAACTGTCGCAAGAACCAGTGGCAGTGTCGTGACGGCACCTGCATAGGGTTC
GACGGTAAATGTGACGGTGTGGTCGACTGTCCCGACTTCAGCGACGAGACCTTCGCGCTG
TGCAGGGACATGCAATGCCAGAGCAATTGGTTCCGCTGTACTTACGGCGCCTGCGTCGAC
GGCAGCGCCCCTTGTAATGGTGTGCAAGAGTGCGCTGATAACTCCGACGAGTTGCTGCCT
AGGTGCCGCAATCAAACAATTGGTTCCAGGGGTAAGCACACGTGCGACAATGGTCAGGTG
ATATCCTCGGTGGATATATGCGATGGGAAGAAGGACTGCGCTGATGGCTCTGACGAGACC
CTCGCCACCTGCGCCGGGAACAGCTGTCCGTCATACGTGTTCCAATGTGCGTATGGAGCC
TGTGTGGACCAGAACGCGAAGTGCAACAAGGTGGAAGAGTGTGCTGATGGTTCTGACGAA
ACAGACGAGCTCTGCAACAGGCTGGCGCCGGGTCAGCCGGTGACTCCAGCCACGAGACCA
CCACCTCAGGGGGGTAATTGTCTGTTGCCTCCATACCCTCAGTATGGGTCGTACAAGGTC
AGACAGTACCCCAACGCGGTCCCCGGCCAGAGGTATCCCAACGTGAGGCTGGACGTCACC
TGTAACCCTGGCTTCCAGACTGAAAACAATAACAGCATCTTCTGCGATAACGGAGAGTGG
TCAGGACCTATGCCAGCGTGTCTCCGTTTCTGCAGGCTTAACAAACACCCGAGCGTGGAG
TACCGCTGTCTGTTGTCTGGCAACTCGGTGACAGGGTCCAGAGAGTGTGGCTCATTGGAG
CCGTCTGGGACCGTCGTCACCCCCATCTGCCGCTCCCCCAATTACTACTCCTCGGGGGTA
ATGTCCAACATGCACTGCGTTGAAGGCAGTTGGGACTATATAGCTGTGTGCAAACCAGGT
TTGACCAACGTTACAATAAGTATAGATAGTTTAGAAATTATCATAACATCGGATAACGCC
CACGTAATAATTAACAATTACGGGAACAAGGAGGTTAAGGTCGTCAACAATATTAGTAAC
GCTGATAGGATTGTGTTTGAAGACAGTAGAACGACCACCAGTAGACCAACCGCTAGTAGA
ACGACTACCAGTGGACCGACTAGCGCTAATTATGATAATGAAATCGATGAGGGTGACTGG
AGAATGGCCTCCGTTGACACAATAGGTTTCCAAGCTCAGCCCGTCCGGCCCAAAAAGTGC
GGTACAATAACTCCTGAGGGTATCCAGCTGGTGATCGGCGGGCGGTCTGCCAAGCGCGGG
GAACTCCCGTGGCATGCGGGGATTTACAGCAAATTATTCACACCTTACATGCAGATATGT
GGCGGGTCGCTCATCAGTACAACCACTATTATATCCGCCGCACATTGTTTCTGGAGCGAC
ACCAAGAAGCTGCTGCCCGCGTCCGAATACGCGGTGGCTGTTGGGAAGCTGTACCGACCT
TACAACGAAAAACACGACGCTGACGCGGAGAAATCTGATGTACGACGAAAATATATCACA
AGCAATACGTAA

Protein sequence:

MACNGLSDPLSDLMIRRPKRQTQNCRKNQWQCRDGTCIGFDGKCDGVVDCPDFSDETFAL
CRDMQCQSNWFRCTYGACVDGSAPCNGVQECADNSDELLPRCRNQTIGSRGKHTCDNGQV
ISSVDICDGKKDCADGSDETLATCAGNSCPSYVFQCAYGACVDQNAKCNKVEECADGSDE
TDELCNRLAPGQPVTPATRPPPQGGNCLLPPYPQYGSYKVRQYPNAVPGQRYPNVRLDVT
CNPGFQTENNNSIFCDNGEWSGPMPACLRFCRLNKHPSVEYRCLLSGNSVTGSRECGSLE
PSGTVVTPICRSPNYYSSGVMSNMHCVEGSWDYIAVCKPGLTNVTISIDSLEIIITSDNA
HVIINNYGNKEVKVVNNISNADRIVFEDSRTTTSRPTASRTTTSGPTSANYDNEIDEGDW
RMASVDTIGFQAQPVRPKKCGTITPEGIQLVIGGRSAKRGELPWHAGIYSKLFTPYMQIC
GGSLISTTTIISAAHCFWSDTKKLLPASEYAVAVGKLYRPYNEKHDADAEKSDVRRKYIT
SNT