MonarchBase - Protein-coding gene

DPGLEAN02918 in OGS1.0

New model in OGS2.0	DPOGS201831
Genomic Position	scaffold2961:- 402-10106
	See gene structure
CDS Length	1434
Paired RNAseq reads	98
Single RNAseq reads	412
Migratory profiles	Query via corresponding ESTs
Best Bmobyx hit	BGIBMGA008281 (3e-31)
Best Drosophila hit	CG31269 (1e-17)
Best Human hit	serine protease 48 (5e-14)
Best NR hit (blastp)	serine protease 33 [Mamestra configurata] (3e-79)
Best NR hit (blastx)	serine protease 33 [Mamestra configurata] (3e-74)
GeneOntology terms	GO:0004252 serine-type endopeptidase activity GO:0006508 proteolysis
InterPro families	IPR001314 Peptidase S1A, chymotrypsin-type IPR009003 Peptidase cysteine/serine, trypsin-like IPR018114 Peptidase S1/S6, chymotrypsin/Hap, active site IPR001254 Peptidase S1/S6, chymotrypsin/Hap
Orthology group	MCL11168

Nucleotide sequence:

ATGACGTCTGGACGCACGACAGGGGACTGCAGAGTTCAGCGACCCACGCGGCCATTCTCC
AACTACCCACCGCCGAGCGCAAGCGTCCAATGGCAGACAGAGCGGAGACCGGCCATCAAG
CGACCCGGACCTTCGAAGAGGCCCGAGTTTCCCTTCGCCTCATTCAGCGGCAACCCCTCC
TTCGTGACTGATTGCACCGGTTACCCGGTGGGCGATGGGGCCGTCACGTCCCGACGCCAA
AATATAGTCGTAAACCATCATAATGCTCTACCTCTCAATGAGGCGGAAGACATGTCCGTC
TTCTTCGACCACCCGGCAATAACACCATACATCGTCGGAGGATTGACTGCTGGCAAAGTT
CCTCATATGGTGGCTCTGACCACCGGTGTCTTCACTAGATCCTTCACCTGCGGAGGTTCT
CTGGTGACCAAGAAACACGTCCTCACTGCAGCACATTGCATTGAAGCTGTGTATAGTCGA
GGATCTCTTTTGAGTTCTCTCCGTGGAATTGTCGGCACCAATCGCTGGAATTTTGGGGGA
GTCCAACAACAATTCGCCTCAAACATTACGCACCCTAACTACGTCGGTTCCATCATCAAA
AACGACATCGGTTTTCTGGTAACAGACGCCGAAGTATCTCTGAACGACAACATACAATTG
GTACCAATCTCCTACGATTTCATTGAAGGTGAAGTAGCTGCTGTTATCCATGGATGGGGC
AGAATCCGGACTGGTGGATCATTGTCACCAAATCTGTTGGAGCTCAAAACAAAGGTCATC
GACGGCGAGCGTTGCGTCTCTGACGTGGCTCGTAGAAGTTCGGAAATTGGTATGAGGGTT
CCACCAGTTCAACCAGATCTCGAAGTCTGTACTTTCCTAGCACTCAACTTTGGAAACTGT
CATGGTGACTCCGGCAGTGCCCTCCTTCGTCAAAGTGACGGCCAGCAAATCGGTGTCGTG
TCTTGGGGTCTTCCTTGTGCTCGCGGCGCACCCGATATTTCTCTCCGTGGAATTGTCGGC
ACCAATCGCTGGAATTTTGGGGGAGTCCAACAACAATTCGCCTCAAACATTACGCACCCT
AACTACGTCGGTTCCATCATCAAAAACGACATCGGTTTTCTGGTAACAGACGCCGAAGTA
TCTCTGAACGACAACATACAATTGGTACCAATCTCCTACGATTTCATTGAAGGTGAAGTA
GCTGCTGTTATCCATGGATGGGGCAGAATCCGGACTGGTGGATCATTGTCACCAAATCTG
TTGGAGCTCAAAACAAAGGTCATCGACGGCGAGCGTTGCGTCTCTGACGTGGCTCGTAGA
AGTTCGGAAATTGGTATGAGGGTTCCACCAGTTCAACCAGATCTCGAAGTCTGTACTTTC
CTAGCACTCAACTTTGGAAACTGTCATGTAAGTTTGTCCACAATATATACATAA

Protein sequence:

MTSGRTTGDCRVQRPTRPFSNYPPPSASVQWQTERRPAIKRPGPSKRPEFPFASFSGNPS
FVTDCTGYPVGDGAVTSRRQNIVVNHHNALPLNEAEDMSVFFDHPAITPYIVGGLTAGKV
PHMVALTTGVFTRSFTCGGSLVTKKHVLTAAHCIEAVYSRGSLLSSLRGIVGTNRWNFGG
VQQQFASNITHPNYVGSIIKNDIGFLVTDAEVSLNDNIQLVPISYDFIEGEVAAVIHGWG
RIRTGGSLSPNLLELKTKVIDGERCVSDVARRSSEIGMRVPPVQPDLEVCTFLALNFGNC
HGDSGSALLRQSDGQQIGVVSWGLPCARGAPDISLRGIVGTNRWNFGGVQQQFASNITHP
NYVGSIIKNDIGFLVTDAEVSLNDNIQLVPISYDFIEGEVAAVIHGWGRIRTGGSLSPNL
LELKTKVIDGERCVSDVARRSSEIGMRVPPVQPDLEVCTFLALNFGNCHVSLSTIYT