MonarchBase - Protein-coding gene

DPOGS205586
Transcript	DPOGS205586-TA	2883 bp
Protein	DPOGS205586-PA	960 aa
Genomic position	DPSCF300237 - 27054-41031
RNAseq coverage	140x (Rank: top 55%)

Annotation
*Heliconius*	HMEL011244	6e-152	48.19%
*Bombyx*	BGIBMGA009750-TA	2e-151	87.31%
*Drosophila*	CG34350-PA	7e-145	79.00%
EBI UniRef50	UniRef50_UPI0002063387	7e-149	59.35%	UPI0002063387 related cluster n=3 Tax=unknown RepID=UPI0002063387
NCBI RefSeq	XP_973911.2	6e-144	59.95%	PREDICTED: similar to serine proteinase stubble [Tribolium castaneum]
NCBI nr blastp	gi\|328778359	3e-148	59.35%	PREDICTED: hypothetical protein LOC409827 [Apis mellifera]
NCBI nr blastx	gi\|161076432	0.0	41.72%	CG34350, isoform A [Drosophila melanogaster]

Group
Gene Ontology	GO:0003824	4.1e-91	catalytic activity
	GO:0004252	8e-88	serine-type endopeptidase activity
	GO:0006508	8e-88	proteolysis
KEGG pathway
InterPro domain	[707-959] IPR009003	4.1e-91	Peptidase cysteine/serine, trypsin-like
	[716-954] IPR001254	8e-88	Peptidase S1/S6, chymotrypsin/Hap
	[747-762] IPR001314	7.7e-13	Peptidase S1A, chymotrypsin-type
Orthology group	MCL12722		Insect specific

Nucleotide sequence:

>DPOGS205586-TA
ATGGGTCCTCCCCTCAACACCTGGCCCTACAGCCACCATCGAGAACTTAAAAGCGCTAGTGATAAAAGTAGTTTAGTTAATATTGTAGACAATTTACGTAATTTAAGTATAAATTTTACTTTTATATTTATTTTTATACAAGTGTTTATAAATCTGAGTGCGGTTAGCGCGGGACCCGTGATACTCAGCTTGGACCATTTGCGCGGCTCGGTGCCAATAGCTAGAAACATAAGGCATTTACCATGCATATCAAGGAAAACTGCTCAAGAGGGACTCTGCATGTTCGCGATAGACTGTCTTAAAGCAAACGGAACTCATTTGGGAACATGTATAGATAGGTTTTACTTCGGTTCCTGCTGCCAGCTGACAGATAAATCTGCTATACCAAATATAGCTGCGAACAATATTGAAGATAACGCCATAGACGGCGCTAATTTCGTACATCCGCTCATAGATCACAAAATCCATAGTCAAACGAGTAAAAAACCCGATAAAATAAACGTGAACACAGATAAAGAGAATGCAAAACCAATACAAGACGATATCGCTACTAAGAAACCGTCAACAGTTCAGGATGTGACTAGCTCTGACAAAATGCAGTCGAAGTCTGATGAAACGGTATCTATTAACCATATAACAAGTGATATTAGGACTACAGAAGCTGTCACAGCTGTCAAAGAAGCTACTACACAATCTATGAAAGTATCCGACAATGTAGTGACCGAGATTCCTGTTAAACTGTCCACATTCCAAACAGTATCCGCTGCTGGTGACACAGCAACTGCAGCTCCGGAAGCCAAACCCACAAAACCACAAACACCAGAAGAACCAGTCAAACCAACAAGGAAACCGGTGAAACCAACGTATAAACCTAGACCATATAGACCCACGAATTTCACGAGACCTCCAATAAGTCCTAAACCGAAACCGACGAAGCCTGTCGCATTATTCAATACAACAAGGAAGCCGCCTTACCGACCGCCCCCGAAACGTAACTCAACCAAAAAACCCCTGCCATCTCCACCGAGACTTAATATAACCATCATACCTCAATCCACGAGTTCACGACCGACATTTACAAGACCTTCCTCTAGTGTCATTACATATATCAACTCAACATCTCCTAAAGTTGAAGAGCCTGCAGAAACAACCATAAAAACAACCCTATCAACAGATACAACAACATTAAAGACCACAACTACGACAACACCTCCTCCACCACCACCAACAACAACAATTGCATCTACTACTACATCTACAACTACAACTACAACAACTACTACTACTACCACCACAACCCCCCCACCATCCACAACAACTACACCAATACCAACAACAATGATCATAACAACAGCAGAATCAATCCCAACTGCAACAGAACGCGCCACTATAACAACAGAAAATATCGTAACCGAAACTTTACCTATAGAACCATCAACGGAGAAAGCAACAGAGATACCAACAGAAAAAAATACCGAGCGAATTACTACAGAACTCTTACCAGAACCAACAGAAGAGAAGGAGAAAGAAACTGTCACTGAAAACGTCACGACAGTTGTCACTGAAAAGGTGACATTACAGGATGTCATTGAAAAAGATACCGTAAAACCAGCCACTGAAGGTGATAATCCTGTGACAACGAAGCCTACCACTGACTACCCTCCCTTTGTAACTTGGACCAACGAGGCAAGTTCAAAAGCACCGGCTACTGTCAGCGACGACTGGTCACCAATCACACCTCCTGACGGCTGGGTCTTAATATCTACCATGTCTCCCAAACCGGAAACAACAGTGAAACCACAAACAACAGAAACTGAAACAACACTAAAACCAACTTCGGTTCTAACTGAAGCGACTTCAATTTTAACATCAACTTCAACCACGGCCTCGCCAACTTCAGAAATTGAGTTTGTTGTGAACGTGACATTGTCTCCTACAACACCCACTCCCACCTCGAGCATGGCGCCAACAACAAATGTCACCTCGGACGAAACACAAACAACAACAACAACAACACTAGCGGCTCTGACTACTATCGCGAACGTGACAACCACAGAGGCGACAACCACTATAACAACGACCACAGAATCTTACAATATGTCGAATTACAAAGAAGTATGCGGTAGGCGCATGTGGCCTCAGGCGAGGATCGTTGGTGGGGCGAAGTCCGGCTTCGGGCAGTGGCCCTGGCAGATATCGCTCCGACAGTACAGGACTTCGACCTACCTTCATAAGTGTGGGGCCGCTTTATTGAACGAGAACTGGGCGATCACTGCCGCTCATTGTGTTGACAGGGTTCCTCCATCGGAGTTGTTGGTGCGTCTCGGTGAATATGATCTCGCGAACGAGGACGAGCCCTACGGCTTCGCTGAGAGACGAGTGCAGATAGTAGCCAGCCATCCTCACTTCGATCCGGCTACCTTTGAATATGATCTAGCTTTACTGAGGTTCTACGAGCCGGTTACATTCCAGCCGAACATTCTTCCTGTGTGTGTCCCTGATGATGACGATTCTTACGTCGGACGAACAGCCTACGTCACGGGCTGGGGACGTCTCTATGATGAGGGTCCCCTCCCGAGTGTGTTGCAGGAGGTGGAGGTGCCTGTGATCAATAACACAGCCTGTGAGAGCATGTACCTCGCGGCTGGTTACAACGAGCACATACCGAACATATTCATTTGTGCCGGATGGAAGAAGGGAGGCTCGGACAGCTGTGAAGGCGACAGTGGTGGACCGATGGTGGTTCAGAGAGCGAAAGACGATCGCTTCGTACTGAGCGGAGTTATCTCGTGGGGTATCGGATGTGCGGAACCCAACCAGCCCGGGGTCTACACAAGGATATCCGAGTTCAGGGATTGGATCAACCAGATACTACGCTTCTAA

Protein sequence:

>DPOGS205586-PA
MGPPLNTWPYSHHRELKSASDKSSLVNIVDNLRNLSINFTFIFIFIQVFINLSAVSAGPVILSLDHLRGSVPIARNIRHLPCISRKTAQEGLCMFAIDCLKANGTHLGTCIDRFYFGSCCQLTDKSAIPNIAANNIEDNAIDGANFVHPLIDHKIHSQTSKKPDKINVNTDKENAKPIQDDIATKKPSTVQDVTSSDKMQSKSDETVSINHITSDIRTTEAVTAVKEATTQSMKVSDNVVTEIPVKLSTFQTVSAAGDTATAAPEAKPTKPQTPEEPVKPTRKPVKPTYKPRPYRPTNFTRPPISPKPKPTKPVALFNTTRKPPYRPPPKRNSTKKPLPSPPRLNITIIPQSTSSRPTFTRPSSSVITYINSTSPKVEEPAETTIKTTLSTDTTTLKTTTTTTPPPPPPTTTIASTTTSTTTTTTTTTTTTTTPPPSTTTTPIPTTMIITTAESIPTATERATITTENIVTETLPIEPSTEKATEIPTEKNTERITTELLPEPTEEKEKETVTENVTTVVTEKVTLQDVIEKDTVKPATEGDNPVTTKPTTDYPPFVTWTNEASSKAPATVSDDWSPITPPDGWVLISTMSPKPETTVKPQTTETETTLKPTSVLTEATSILTSTSTTASPTSEIEFVVNVTLSPTTPTPTSSMAPTTNVTSDETQTTTTTTLAALTTIANVTTTEATTTITTTTESYNMSNYKEVCGRRMWPQARIVGGAKSGFGQWPWQISLRQYRTSTYLHKCGAALLNENWAITAAHCVDRVPPSELLVRLGEYDLANEDEPYGFAERRVQIVASHPHFDPATFEYDLALLRFYEPVTFQPNILPVCVPDDDDSYVGRTAYVTGWGRLYDEGPLPSVLQEVEVPVINNTACESMYLAAGYNEHIPNIFICAGWKKGGSDSCEGDSGGPMVVQRAKDDRFVLSGVISWGIGCAEPNQPGVYTRISEFRDWINQILRF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: