MonarchBase - Protein-coding gene

DPOGS210899
Transcript	DPOGS210899-TA	1011 bp
Protein	DPOGS210899-PA	336 aa
Genomic position	DPSCF300045 - 601615-603604
RNAseq coverage	1231x (Rank: top 10%)

Annotation
*Heliconius*	HMEL003507	8e-57	45.49%
*Bombyx*	BGIBMGA005131-TA	1e-58	42.35%
*Drosophila*	CG12163-PA	2e-51	36.48%
EBI UniRef50	UniRef50_Q8V5U0	4e-62	40.62%	Viral cathepsin n=8 Tax=Alphabaculovirus RepID=CATV_NPVHZ
NCBI RefSeq	XP_002734978.1	1e-59	43.14%	PREDICTED: cysteine proteinase inhibitor-like [Saccoglossus kowalevskii]
NCBI nr blastp	gi\|209978824	1e-64	44.08%	cathepsin [Adoxophyes orana nucleopolyhedrovirus]
NCBI nr blastx	gi\|209978824	5e-65	44.08%	cathepsin [Adoxophyes orana nucleopolyhedrovirus]

Group
Gene Ontology	GO:0008234	2.8e-115	cysteine-type peptidase activity
	GO:0006508	4.2e-77	proteolysis
KEGG pathway	tet:TTHERM_01276400	4e-60
	K01373 (CTSF)	maps->	Lysosome
InterPro domain	[1-322] IPR013128	2.8e-115	Peptidase C1A, papain
	[126-335] IPR000668	4.2e-77	Peptidase C1A, papain C-terminal
	[41-96] IPR013201	1.1e-14	Proteinase inhibitor I29, cathepsin propeptide
Orthology group

Nucleotide sequence:

>DPOGS210899-TA
ATGATCGTTTTCGTACTCTGCGCCATCTCCTTCACAGCGGCTGCACCGCAGAATGATGTGAGCGATGTGGAGAAAGTACGGAAACCAGTATTTTATTCTATGGACGAAGCTCCAATACTCTTTGAAAACTTCATCAGAGAATATAATAAAAAGTATGACTCCAAAGAAAAGGAAGAGAGATTCAAGATATTTGTAAACAATTTAAAGAGAATAAATGATCTAAACCACAAGAGTACGAACGCTGTTCACGGTATTAACAAGTTCACAGATCTGAGCAAAGAAGAGTTCAAAAAGTTTTATACAGGTTTCAAGCCGGACAAAAGCTTTTTGGATGATAACATTAAAAAACCGAGTCAATTATCATTTAATATCACCGCACCGCCTGCGTTTGATTGGCGAGATAAAGGAGTCGTCACCAGAGTGAAGAACCAAGGAACATGTGGCTCATGCTGGGCATTTAGTACAATCGGTAACGTGGAAAGTGTGAACGCAATCAAACACGGGAACCTTGTGGAATTATCAGAACAACAATTGGTAGACTGTGACAGCAAAGATGAGGCGTGTGACAGCGGATTACCAGATAACGCACAACAATACCTCGTATCACACGGTGCTATCTCTGAACAATCTTACCCATACAAAGGATATGCCGCAAACTGTACATACGATAGCAGTCAGGTTGTTGTTAGATTAAGTAATTTTGAAAAAGTTGTATTGTCAGAGTGTCAAATGGCCGAAAAGCTTTACAGCACCGCACCATTGAGTATAGTTATTGCTGCAGAAGTATTAGGTACATATACTAAGGGTATCCTCGTCAATGAATGTGAACAAAGTCAAGACCTCAATCATGCTGTGCTTTTGGTAGGCTACGGAAACGAGGGAGGCACTAACTTCTGGATCCTCAAGAATTCTTGGGGAACTAACTGGGGTGAAGGCGGTTACTTCAGAATAAAGCGAGGTGTCAACTGTCTTATGATCACCGATTACGGAGTCCTTTCAGGAATCATATAA

Protein sequence:

>DPOGS210899-PA
MIVFVLCAISFTAAAPQNDVSDVEKVRKPVFYSMDEAPILFENFIREYNKKYDSKEKEERFKIFVNNLKRINDLNHKSTNAVHGINKFTDLSKEEFKKFYTGFKPDKSFLDDNIKKPSQLSFNITAPPAFDWRDKGVVTRVKNQGTCGSCWAFSTIGNVESVNAIKHGNLVELSEQQLVDCDSKDEACDSGLPDNAQQYLVSHGAISEQSYPYKGYAANCTYDSSQVVVRLSNFEKVVLSECQMAEKLYSTAPLSIVIAAEVLGTYTKGILVNECEQSQDLNHAVLLVGYGNEGGTNFWILKNSWGTNWGEGGYFRIKRGVNCLMITDYGVLSGII-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: