MonarchBase - Protein-coding gene

DPOGS204148
Transcript	DPOGS204148-TA	1008 bp
Protein	DPOGS204148-PA	335 aa
Genomic position	DPSCF300034 - 1136771-1139676
RNAseq coverage	307x (Rank: top 37%)

Annotation
*Heliconius*	HMEL016481	4e-67	50.00%
*Bombyx*	BGIBMGA005173-TA	1e-71	46.62%
*Drosophila*	ea-PA	2e-62	39.53%
EBI UniRef50	UniRef50_Q8I924	1e-83	48.05%	Prophenoloxidase activating factor 3 n=4 Tax=Obtectomera RepID=Q8I924_BOMMO
NCBI RefSeq	NP_001036844.1	3e-85	48.06%	BzArgOEtase [Bombyx mori]
NCBI nr blastp	gi\|56418397	3e-85	46.92%	hemolymph proteinase 8 [Manduca sexta]
NCBI nr blastx	gi\|56418397	2e-84	47.20%	hemolymph proteinase 8 [Manduca sexta]

Group
Gene Ontology	GO:0003824	1.5e-86	catalytic activity
	GO:0004252	1.6e-77	serine-type endopeptidase activity
	GO:0006508	1.6e-77	proteolysis
KEGG pathway
InterPro domain	[70-334] IPR009003	1.5e-86	Peptidase cysteine/serine, trypsin-like
	[79-329] IPR001254	1.6e-77	Peptidase S1/S6, chymotrypsin/Hap
	[110-125] IPR001314	5e-14	Peptidase S1A, chymotrypsin-type
Orthology group	MCL14995		Insect specific

Nucleotide sequence:

>DPOGS204148-TA
ATGATTCTAGAAGATTGCGTTGACCTTTACGAAAGATTCAATGAAGGGACTTCCGCTATTTATATTAAGTTATTTCAAAAATTACAATGCGGTTTCAATGGTAACCAATCAAAGATTTGCTGTCCACCAAATTTTCTAACCTCTGTTGGTGATACGTCAAATATAAATCAAACAAATAAATTAAAGATCTTGCCTAACAACACTGTTTGTGGCATTGACACTAAAATTATAAATAGGATTTCCGGGGGGGAGGAAACTGAAATCGGTGAACATCCTTGGCTGGCGTTATTGAATTATGGTCCACCTTCGACTAATAGTTTTTATTGTAGTGGAGTCCTGATATCATCAAGATATGTCATGACCGCAGCACACTGCGTGAAGCGCACTTTGGAGGATGTCACAGTTTCTCAGGTGCGACTTGGTGAATGGGACTTGTTAAGGAATACGGACTGCTCGAAGAATTACTGCAGTTCTGATGCAATAGACGTCGATGTAGAAGAAATTGTGGTCCACGAGAACTTCATCATCGGAGATCCCTCATTTCACCATGATATTGCTCTTCTGAGATTAGCCCAAGATGTAACTTTCAGTGATTTCATCAGGCCGATCTGTCTTCCTATTGATACGGAAATAAGGGAAAATAATTTTGAACATTCAGTTCATGCGGAAATAGCGGGTTGGGGTCAAAATGAATACAGTTCATTTTCAGAGAAGAAACTCAAGGCTAAAGTTTCTGTCGTAAACTTAGAAACATGCAAAAAAGCATATGCCTATGGTAAGCACGTCATAACTAATAATCATATCTGTGCCGGTGGCGAGAGAGGCAAAGATATCTGTGATGGAGATTCTGGTGGTCCACTCATGGTTCAAGTTCAGGATAAGAGAATTTGGATGGCTGTTGGTGTGTCATCCTTTGGCCCAGCGACTTGTGGTGTAGAAGGATGGCCTAGCGTGTTCACCAGAGTGACGTCTTATGTACCCTGGATATTATCTAAGATACGACCTTGA

Protein sequence:

>DPOGS204148-PA
MILEDCVDLYERFNEGTSAIYIKLFQKLQCGFNGNQSKICCPPNFLTSVGDTSNINQTNKLKILPNNTVCGIDTKIINRISGGEETEIGEHPWLALLNYGPPSTNSFYCSGVLISSRYVMTAAHCVKRTLEDVTVSQVRLGEWDLLRNTDCSKNYCSSDAIDVDVEEIVVHENFIIGDPSFHHDIALLRLAQDVTFSDFIRPICLPIDTEIRENNFEHSVHAEIAGWGQNEYSSFSEKKLKAKVSVVNLETCKKAYAYGKHVITNNHICAGGERGKDICDGDSGGPLMVQVQDKRIWMAVGVSSFGPATCGVEGWPSVFTRVTSYVPWILSKIRP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: