MonarchBase - Protein-coding gene

DPOGS208138
Transcript	DPOGS208138-TA	5430 bp
Protein	DPOGS208138-PA	1809 aa
Genomic position	DPSCF300347 - 129562-141605
RNAseq coverage	10x (Rank: top 84%)

Annotation
*Heliconius*	HMEL016514	0.0	55.21%
*Bombyx*	BGIBMGA014089-TA	0.0	42.99%
*Drosophila*	ndl-PA	4e-126	37.25%
EBI UniRef50	UniRef50_Q8WSJ2	0.0	50.36%	Ovarian serine protease n=3 Tax=Bombyx mori RepID=Q8WSJ2_BOMMO
NCBI RefSeq	NP_001037168.1	0.0	50.36%	ovarian serine protease [Bombyx mori]
NCBI nr blastp	gi\|112984438	0.0	50.36%	ovarian serine protease [Bombyx mori]
NCBI nr blastx	gi\|112984438	0.0	49.94%	ovarian serine protease [Bombyx mori]

Group
Gene Ontology	GO:0004252	9.8e-82	serine-type endopeptidase activity
	GO:0006508	9.8e-82	proteolysis
	GO:0003824	5e-80	catalytic activity
	GO:0005515	1e-09	protein binding
KEGG pathway
InterPro domain	[427-659] IPR001254	9.8e-82	Peptidase S1/S6, chymotrypsin/Hap
	[423-664] IPR009003	5e-80	Peptidase cysteine/serine, trypsin-like
	[1314-1571] IPR015420	9.9e-60	Peptidase S1A, nudel
	[1118-1164] IPR002172	1e-09	Low-density lipoprotein (LDL) receptor class A repeat
Orthology group	MCL16591		Insect specific

Nucleotide sequence:

>DPOGS208138-TA
ATGGAAACATTGGAAATTGGTAGAAACATGGCTACAAGTACAAATGAAAAGTTAGCTGTAGGGCTCCCGATGGACTTGGCGGAGACAAATAAAGTTCGCAATGGTTTCAAGTGCATACCTGCTGTTCAAAAAGCTCTAGTTATCATCACACTAATTATATTTTCTATCGGTATCTATGTTTTGTTTCTGAGACTTTTAAAAGTCGACGGTGGTTATGGAGATATGTATTCAGATCATCAACTGCAATATCCGCACCACTCAAGGCCCATATCAAATTATAGGTCGCATTATGCCCAAACTCATAATTCAGAAGAACTTTTGACAAATCCTCACCCACAAGACATCGGAATCGCTATGAAATTCTTATCACCAAAATATGACATGACATCCAAAGACTCTGTTGGTTCAAATTCGACATTTAATGAAATAGAATGTCCAGTTGGAACTGTTTCATGTAATAACGGGGCCTTGTGTATAGATGAACACAAATGGTGCGATGGTAATGTTGAATGTGATGACGTCAGCGATGAATCAAAATGTGACTGTAGATCAAGGGTTGATGATTCTAGAATTTGCGATGGCTATTTTGATTGTCCTTTCGGTGAAGATGAAATGGGATGTAATGGTTGTAATGACAACACATTCAGTTGTGAGGATCTAAATGTTAACTCAAAGAACACATGTTTTTCCAAGGAGCAACGTTGTGACAACTTTGCGGATTGTCCAAATCAGAAAGACGAAATTGACTGTAGCTTGTTAGCACCGAGCTTACACAAAAAACCCTTGTTTGCCATTTCAAATACGGAAGGCTTTCTGCACAGAAATTTTAAAGGAAACTGGTATGCTGTCTGTAGTAATCCTTACATGTGGGCACATGATGTGTGTCGTCGGGAAACAGGGCTTATAATAAGGCCTCCTTATATTCAAGTTGTGCAAATAGATCCCTTAATAAAGGTTAAGTATATAAACACGGCGCTGGGAGGATCAATACACACTACAAATACTTGCGGGAACAATTCCGCAGTGTACGTCACGTGTCCTGATTTATTGTGTGGAACCCGAGTGCTATCTTCCTCAGAATTTTTAAGACAAAACGCTAATATGGAAGACAACCTGTTTGGCCGGAATAAAAGATTCCTTTTCCAAGAATCATACCCTGGGATATATTACGGTGACCGAAAAAAGAGATATACAATAAACAACGCCTGGCAATCCCAACCATTCCATTATTTGAGAAAAGATTTGGTTAATGATGTAAGGAACAAAAGATCAGACAGTAGAGTAGTGGGAGGAAAACCTAGTCAACCAGCTGCCTGGCCGTGGGTAGTAGCACTTTATAGAGATGGAATGTTTCATTGTGGAGGCGTTATTGTTAACCAAAATTGGATAATGTCTGCGGCACACTGCGTTAACAAATTTTGGGAACATTACTATGAAGTACAAGTCGGTATGCTCCGTCGGTTTTCATTCTCACCTCAAGAGCAGAACCACCGTGTTACTCACGTAATAGTGAATCAAAATTACAATCAGGAAGATATGAAGAATGACTTATCTTTATTGAGAGTTAAACCTGGCATTCAGTTTAGTCGCTGGGTACGACCTATTTGCTTACCTGGACCTGAAGTGGCTGGTGCTGACTGGATGTGGGGACCTCCTGCTGGTACGACTTGTACAGCTGTAGGCTGGGGAGCAACTGTAGAACGTGGCCCTGATCCGGACCATATGCGTGAGGTAGAAGTTCCTGTATGGGAGCACTGCAAACATGAGGAAGATCAAAGTGGCAGTGAAATGTGCGCAGGTCTTGCTGAGGGTGGTAGAGATTCTTGTCAAGGAGATAGCGGAGGACCACTTCTATGCACTAATCCTGCCAATCCGCAGCAATGGTATGTAGCAGGTATTGTGAGTCATGGCGATGGTTGTGCACGAAAAGGTGAACCAGGGGTTTATACAAGAGTCAGCGTTTTTGTTTCTTGGATACGATACCACATTGCATCAAAAGCGTTACCGATAATTCAGCCTAAACAAGAATGTCCGGGATTTAGATGTGATTCTGGGATTTCAAAGTGCTTGCCAAAAAAGAGGATGTGTGATAAAATAATAGATTGTTTAGATGGCGAAGATGAACTAAATTGTGAAATAGTGAGATCAGCAGATATTTTTCCAAATAATTTATTTCTCAATCCATTGGCTAAAGTCGCAAATATAACAAACAACCAAGAAACTATCAACATAAGTGATAATGAAAAAAACAATAATCTTCCAAGTAATAATATTATCTTAGTCAATGATACCAATATGAATACGAAATTAAACTCATCTAATTTAAATGAATTTGAAACTACAACATTTTTATCGAATAAAGATATAATAACTGATACAAAAGTATATGACCAATCTACTTTGTTTGTAACCACGGAGAAATCTATCATCAAAAATGATGATAAACTTACAAATATTATACCACTCCCAACTGAAGTAAGTTTAGAACAAAGTTCCCTTTACGATGATATAAAACACGCTTCAACAATAGAAATGCCATCTCCTGATTATTCAGGAGAATCCATAGATGATCTGGATCCAAATGAATCAATTACATTAGATTCAATTATTACAACGACTACAAGTAAATATTTTGATGATATAAATATAAACCTAAACTCTAGATACGCAATAGAGTCTATGTCCTCGATTTTAGATAACCCTCAAAAAGAAGAGAAAATATTCACAAATATTAAGGTGACAGAGAAAACTTTGGTAACATCACCACTTGGCATTTCTAGATTAGATTCGGATATTGATTCTACAACAGTAACTATAAAATCAAGTGATTTTAATACATCCGACGAAAATAATTTAAATAACAATATATTCAATAATACTATTGATCAAAAGGATAACTTAAACTTAGCAGATAATAAATATAATAAGACTATTCCAACGACAAATGATTATGTGCCAACTTATAATGGTAGCAATAATTTTAATGAAAGTACTACTGAACCAAATATAGACGACCAAATAAATTCGGAAACGAATCATGAACAAAACTATTTAACACCCATTAGGCCGATGGATACTACTTACACTAATAGCGATAAAAATGAAGACACGTTTCTGACTGAACTCCAATCAGCAAAAAAGAAAAAATATATACCAACGCCTACTGAGTTTCAATGCAGGCGCATTTATCAAATCGTCCCCCACACGACTCGTTGTGATCATAAAGCAGACTGTGAAGATGGTTCAGATGAACAGGATTGTACGTGTGTTGACTACCTAACAACTTTTGATAATAGACTGTTATGTGATGGACACTTCGATTGTGCCGATGGACAGGACGAAGTGAATTGTTATACATGTGAAGAGGATAAGTTTCTATGTAAACTAAGTGAAATGTGTCTCGATTCAAAGTACGTTTGTGATGGTATACCACAATGTCCCTCAGGCGAAGACGAAATGGACTGCTTTGCTCTTACAAACGGCAATCATATTGAACGTGATATACACGGCAGACCAGAGGCAAAATTGGAGGGTTACTTGACTAAAAAGTATCAAAACAGCTGGCATGTTGTGTGTGAAGACAACATGTCGGTTTCAGAACAAGAAGAAGCTGCTACACATATATGCCGCTATTTGGGATTTAGCTCAGCAAATAAATATGTTATCAAATATATCAATGTGAAACAAAAACTTCATCATATGAAAGATAAAAGGTCGATACGAAATATCGATTTAAGGATGCCTGTTCACTTCAGCTATAGAACAGCTAGTGACAACAATGATTCCACGCATGTAGTCATAAATGAACCTCAAATAATTAAAGAGGAATGTGTTCCTAATATAACGAAAACCTGCATGTCGCTTTATGTTTTTTGCGATCATTCCTTGTACACTCATTTTGATAGCATTGATGAAGTGAACATCAAGAACGAAATAAAGAAGATGTCTGATCAAATGTGGCCATGGATTGCGAAATTATATGTGGACGGAAAATATAAATGCACTGGAGTTTTAGTTGATTTGTCTTGGGTTCTAATAAATCACGTATGCCTACCGAGTTCTGAGCTAAGTTATCACTATGTAACAGTTATACTTGGTTCTCACAAAACTCTTAAATCAACTGTTGGACCTTATGAGCAAGTGTATCGAGTTGATGCAAAGAAACATTTATATCAAAGGAAAGTTATGCTTCTGCATCTCAACGAACCCGCTGTATACACATCTATGGTGAAGCCGATGGTAGTGACGTCTCTATATTCCGATGATGCTGATAATACGATATGCGTAGCAGTTGGCCAGGATAGGAATAATAAAATGTCAAGCGTTTTTCTAAAAGAAACTGATAAATGCAATTCCCACAATCGATGTTTCGATCTTTTAGTCAATTCTAGCTATTGTAACTTTGAAGATGCAAAATGGGCCGGTATAATAAGTTGTCACAACAAACGTGGATGGTATCCCGCAGCGTCGTTTGTTAAAGACATGGGAATATGTAAAAATACTGATGGCATAAATGGAACAGACATTGGAAATTTAAAAATTGATATAAAATATTTCGAAGATAAACCATTACCTCTTTCCGATGGGCATTTGTTTACAAATTGCGAAGGAGTCCGGTGTCAAAGAGGGCATTGTGTGGGGTTACAAGATGTATGTAATGGGGTCACGAATTGTGAAGATTCTTCGGATGAATCTAAAGAATCATGTCGGAAAAAACATGATGTTTGTACACAAAATCCATTTTATCGTGGATGTGAATGTCCGGTTGGTCAGTTAAAATGTCATAATGGTCAATGTATACCCAAAGAATTGTTCAAGGACGGCCGCAATGATTGCGGAGATGGCACCGACGAGCCTGGTCAAACTTTATGTTCAGATTACTTGAGGAGGGTTATGCCTTCAAGACTTTGTGACGGAATTCTTCACTGTCACGACAGGAGTGACGAAGATCCCACATTCTGTAAATGTTTCGCAAAAAAGGCGTACAAGTGCACAGGAATGTCGATTGACGAGGACTACTGCGTAGCAACTGACATGGTTTGTGACGGTGTACTTGATTGTCCAAATGGAGATGATGAGCGAACCTGTATAGGTTTGAGCTCGGCTCAGGGAACACCGCACGGCATTGGCGAAGTAATAATACGCTCCCACGGCGTGTGGTATTCGAAATGCTATACCAAACAAAACCATACGAAATCAGAACTAGAAGCTATTTGTAGAGAGTTAGGTTTCATTGGCGGACACGCAAAACAACTGCCAGATCCTAAAGGAATACCAAATCCCTACAACAATATTGTTATCGACATGTTTTCTGATGTAATGCTAAATAATAACACAATAATAAAATTGAGAAACACACCGAATCCTATCGCCCGCGCTGTGACTCAAGATATAAAAGAGTGTTATCCAGTTTTCATAGAATGTCTCTAG

Protein sequence:

>DPOGS208138-PA
METLEIGRNMATSTNEKLAVGLPMDLAETNKVRNGFKCIPAVQKALVIITLIIFSIGIYVLFLRLLKVDGGYGDMYSDHQLQYPHHSRPISNYRSHYAQTHNSEELLTNPHPQDIGIAMKFLSPKYDMTSKDSVGSNSTFNEIECPVGTVSCNNGALCIDEHKWCDGNVECDDVSDESKCDCRSRVDDSRICDGYFDCPFGEDEMGCNGCNDNTFSCEDLNVNSKNTCFSKEQRCDNFADCPNQKDEIDCSLLAPSLHKKPLFAISNTEGFLHRNFKGNWYAVCSNPYMWAHDVCRRETGLIIRPPYIQVVQIDPLIKVKYINTALGGSIHTTNTCGNNSAVYVTCPDLLCGTRVLSSSEFLRQNANMEDNLFGRNKRFLFQESYPGIYYGDRKKRYTINNAWQSQPFHYLRKDLVNDVRNKRSDSRVVGGKPSQPAAWPWVVALYRDGMFHCGGVIVNQNWIMSAAHCVNKFWEHYYEVQVGMLRRFSFSPQEQNHRVTHVIVNQNYNQEDMKNDLSLLRVKPGIQFSRWVRPICLPGPEVAGADWMWGPPAGTTCTAVGWGATVERGPDPDHMREVEVPVWEHCKHEEDQSGSEMCAGLAEGGRDSCQGDSGGPLLCTNPANPQQWYVAGIVSHGDGCARKGEPGVYTRVSVFVSWIRYHIASKALPIIQPKQECPGFRCDSGISKCLPKKRMCDKIIDCLDGEDELNCEIVRSADIFPNNLFLNPLAKVANITNNQETINISDNEKNNNLPSNNIILVNDTNMNTKLNSSNLNEFETTTFLSNKDIITDTKVYDQSTLFVTTEKSIIKNDDKLTNIIPLPTEVSLEQSSLYDDIKHASTIEMPSPDYSGESIDDLDPNESITLDSIITTTTSKYFDDININLNSRYAIESMSSILDNPQKEEKIFTNIKVTEKTLVTSPLGISRLDSDIDSTTVTIKSSDFNTSDENNLNNNIFNNTIDQKDNLNLADNKYNKTIPTTNDYVPTYNGSNNFNESTTEPNIDDQINSETNHEQNYLTPIRPMDTTYTNSDKNEDTFLTELQSAKKKKYIPTPTEFQCRRIYQIVPHTTRCDHKADCEDGSDEQDCTCVDYLTTFDNRLLCDGHFDCADGQDEVNCYTCEEDKFLCKLSEMCLDSKYVCDGIPQCPSGEDEMDCFALTNGNHIERDIHGRPEAKLEGYLTKKYQNSWHVVCEDNMSVSEQEEAATHICRYLGFSSANKYVIKYINVKQKLHHMKDKRSIRNIDLRMPVHFSYRTASDNNDSTHVVINEPQIIKEECVPNITKTCMSLYVFCDHSLYTHFDSIDEVNIKNEIKKMSDQMWPWIAKLYVDGKYKCTGVLVDLSWVLINHVCLPSSELSYHYVTVILGSHKTLKSTVGPYEQVYRVDAKKHLYQRKVMLLHLNEPAVYTSMVKPMVVTSLYSDDADNTICVAVGQDRNNKMSSVFLKETDKCNSHNRCFDLLVNSSYCNFEDAKWAGIISCHNKRGWYPAASFVKDMGICKNTDGINGTDIGNLKIDIKYFEDKPLPLSDGHLFTNCEGVRCQRGHCVGLQDVCNGVTNCEDSSDESKESCRKKHDVCTQNPFYRGCECPVGQLKCHNGQCIPKELFKDGRNDCGDGTDEPGQTLCSDYLRRVMPSRLCDGILHCHDRSDEDPTFCKCFAKKAYKCTGMSIDEDYCVATDMVCDGVLDCPNGDDERTCIGLSSAQGTPHGIGEVIIRSHGVWYSKCYTKQNHTKSELEAICRELGFIGGHAKQLPDPKGIPNPYNNIVIDMFSDVMLNNNTIIKLRNTPNPIARAVTQDIKECYPVFIECL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: