MonarchBase - Protein-coding gene

DPOGS202102
Transcript	DPOGS202102-TA	1638 bp
Protein	DPOGS202102-PA	545 aa
Genomic position	DPSCF300150 - 446011-450451
RNAseq coverage	1737x (Rank: top 7%)

Annotation
*Heliconius*	HMEL022141	1e-109	73.88%
*Bombyx*	BGIBMGA009139-TA	9e-98	39.79%
*Drosophila*	26-29-p-PA	6e-96	38.81%
EBI UniRef50	UniRef50_C7BWZ0	6e-157	50.57%	Putative C1A cysteine protease n=1 Tax=Spodoptera frugiperda RepID=C7BWZ0_SPOFR
NCBI RefSeq	NP_001128673.1	4e-146	48.11%	cathepsin L like protein [Bombyx mori]
NCBI nr blastp	gi\|254746346	2e-156	50.57%	putative C1A cysteine protease precursor [Spodoptera frugiperda]
NCBI nr blastx	gi\|254746346	4e-157	50.95%	putative C1A cysteine protease precursor [Spodoptera frugiperda]

Group
Gene Ontology	GO:0008234	1.1e-115	cysteine-type peptidase activity
	GO:0006508	8.7e-77	proteolysis
KEGG pathway	hsa:1512	2e-54
	K01366 (CTSH)	maps->	Lysosome
InterPro domain	[220-544] IPR013128	1.1e-115	Peptidase C1A, papain
	[330-544] IPR000668	8.7e-77	Peptidase C1A, papain C-terminal
	[243-298] IPR013201	3.9e-21	Proteinase inhibitor I29, cathepsin propeptide
Orthology group	MCL23659		Lepidoptera specific

Nucleotide sequence:

>DPOGS202102-TA
ATGATTGCCTTTATATTAAAAATTTTTCCGTTACTCATTGTTGCATCGGTTGCTGGGAAAAATGTTCTTGAAGATGACCTTCCAAAACTGAAATGGCCCAAAAAGTATTCGTTCGAAGCCGAATCTCTGTCACTGACGTCAGGTTTGGTTCAAGATGTCACCTACTGGCGAGTCAGCAAAAAATCGAGGGTAGATTTTAACAAAGGTGCCGTAAAACTGATATCAATTAAGGGCCAGAGGAAGTCAAAATTTCCTTTCGGTGTAAAATATGAGATTCATCCCGAAAGTAATGAAGAATATGAGAACAAATTCATCTGCACGGGAATGAAAGGAAACATCTTCAGACAAGCCAAACTGGATAAGGTTTTGCCAGATGTTGACGATTTTGTCCACATTGGGAAGGAGAAACTTGAATTAGGTGAGGTGGAAAAGTTTACATTCTTTGAAGACAAAGATTATATTAACTCTCAAACGAGGCAGAATTTATGGGTGTTACAAAATGATTCAACATTTATACCCGTTAGATATGAGAAGATAATATATAATACTTGGATTAAAAATGTGAAAGATCACACAATTTGGAACATCTTCAACTTCAAAACCGATTTCAGCGAAGACGTCTTCGACACAGATGACTATGATTGCAAAATTAATTCGCCCAAAAATAACAATGAAAATGAAGAGGTTGATAGTGATGAAAGCACAAACTTGGATTCGGATCACGTATTCGCAGAATTTATGCAAAAGCACAATAAAAACTACGACGGTCCTGAACATGAGCAGCGCAGAAAAATTTTTGAAACTAATTTAAGAAAGATTGAGGAACATAATAGAAGTAATAAAAACTTCAAGCTAGCAATAAACAAGTTTGCTGATCTTACCCACAAAGAAATGGAAAAACGGAAGGGTCTCAAACGACGAGGCAAATCATCAGGCGCAATTCCATTTCCGTATAGCAAATCGAAGATCGCTGAAATGTCTGATACTCTACCGAAAGAATATGACGCGAGGATGTACGGCCTAGTAACATCGGTTAAGGATCAACAGGATTGTGGATCGTGTTGGACTTTTGGAACAACTAGCGCGGTAGAGGGAGCTCTAGCAAGAATAAATGGTGGAAGACTTATGAGACTCGCCAACCAAGCTCTTATAGACTGTGCCTGGGGATATGAGAATTTTGGCTGTGACGGGGGTACAGACACGGGAGCGTATCACTGGATGTTGAATTATGGCATGCCCACTGAAGAGGAGTATGGTCCATATGTGAACAAAGACGGTTTCTGTAGAATACACAATATGACGCAAACCTACAAGATAAAAGGATTTACTAACGTTACACCCTACAGCGTTGAAGCTCTTAAGGTGGCCTTGGTGAACCACGGTCCGTTGTCGGTGTCCATCGACGCTACAGACATGCTTACTTATTACAACGGCGGTATCTACTCCGATAGTGACTGCAGTACTACAAATTTAAACCATGAAGTAACTCTCGTCGGCTACGGTGAATTGGACGGTGAAGAGTATTGGATAGTGAAAAATTCTTGGGGTAGGGATTGGGGTGTTGACGGCTATTTCCATATCACAACCCGGGATAACAGCTGCGGGATCACCACTGAACCTACTTATGTAGTTTTCTAA

Protein sequence:

>DPOGS202102-PA
MIAFILKIFPLLIVASVAGKNVLEDDLPKLKWPKKYSFEAESLSLTSGLVQDVTYWRVSKKSRVDFNKGAVKLISIKGQRKSKFPFGVKYEIHPESNEEYENKFICTGMKGNIFRQAKLDKVLPDVDDFVHIGKEKLELGEVEKFTFFEDKDYINSQTRQNLWVLQNDSTFIPVRYEKIIYNTWIKNVKDHTIWNIFNFKTDFSEDVFDTDDYDCKINSPKNNNENEEVDSDESTNLDSDHVFAEFMQKHNKNYDGPEHEQRRKIFETNLRKIEEHNRSNKNFKLAINKFADLTHKEMEKRKGLKRRGKSSGAIPFPYSKSKIAEMSDTLPKEYDARMYGLVTSVKDQQDCGSCWTFGTTSAVEGALARINGGRLMRLANQALIDCAWGYENFGCDGGTDTGAYHWMLNYGMPTEEEYGPYVNKDGFCRIHNMTQTYKIKGFTNVTPYSVEALKVALVNHGPLSVSIDATDMLTYYNGGIYSDSDCSTTNLNHEVTLVGYGELDGEEYWIVKNSWGRDWGVDGYFHITTRDNSCGITTEPTYVVF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: