MonarchBase - Protein-coding gene

DPOGS212294
Transcript	DPOGS212294-TA	1944 bp
Protein	DPOGS212294-PA	647 aa
Genomic position	DPSCF300077 + 900256-909335
RNAseq coverage	8x (Rank: top 86%)

Annotation
*Heliconius*	HMEL014950	8e-70	44.17%
*Bombyx*	BGIBMGA012478-TA	1e-09	32.90%
*Drosophila*	MP1-PC	6e-10	22.31%
EBI UniRef50	UniRef50_UPI00022B476D	6e-14	22.66%	UPI00022B476D related cluster n=3 Tax=unknown RepID=UPI00022B476D
NCBI RefSeq	XP_001603793.1	3e-16	24.74%	PREDICTED: similar to polyserase-IA protein [Nasonia vitripennis]
NCBI nr blastp	gi\|194668847	6e-16	25.38%	PREDICTED: transmembrane protease serine 9 [Bos taurus]
NCBI nr blastx	gi\|194668847	3e-14	25.16%	PREDICTED: transmembrane protease serine 9 [Bos taurus]

Group
Gene Ontology	GO:0003824	5.8e-28	catalytic activity
	GO:0004252	1.4e-22	serine-type endopeptidase activity
	GO:0006508	1.4e-22	proteolysis
KEGG pathway
InterPro domain	[429-623] IPR009003	5.8e-28	Peptidase cysteine/serine, trypsin-like
	[212-422] IPR001254	1.4e-22	Peptidase S1/S6, chymotrypsin/Hap
	[221-236] IPR001314	3.8e-06	Peptidase S1A, chymotrypsin-type
Orthology group	MCL34936		Lepidoptera specific

Nucleotide sequence:

>DPOGS212294-TA
ATGTACCCTATCAGAAGCTTAAGGTCTTTGTCGGGCAAGTTTGCTGTAGCAGGTAATTTAAGAAATGTAGATTTCTACCCACTTGTAGAATCAGATACAACTGGCCAATGGAGAAAATTAAGAAAAGTAGTTTATCCATGGACCTATACATTCCCTAGAGATGATATTGCTATTGTGTTCCTACGTTCTCCATTTATCTACAACAGCTTTGTAAACTATGTACCTATTGCAAGTAAATCAGTTGACTACCAGGGAAAGTGCCTGGTGTCCGGATATGGGCGAATATCCCAGAAGGACTCGTCGGATAAACTTCTTTTAGCCCAATTAGATCTAATCCCAATGCGAGCGTGTAACAGAAAACACCGGCGGAATATGCGAAGATTCGTTTGCACTTCCAGTTTATTCACAGATGTTGGAAAGGGTGACTCTGGTGGACCGTTGGTTTGTTCAAACACTGGTGACCCAAATGAAGAGCCTGGGAAAGGAGTTCTTATCGGTGTAGTGAGTGGACATCGGTACGGAGCAGGCTCATTCTTTACCCGAGTCTCATCTTACTACAAATACGTTAAAAGGAACAAATCGAATAAATTACACTTCAAATACAGCGTTGTTGCCTTCAAATCACTGATAAGACGACCCAGACTTTACAATACTTTTTGTGGAGGCGTCATCATGACACCGACAAAATTGCTCTCCGCAGCTCACTGTTTTGTAACCAAGGGCAATTTTTGTCAGAGATTAATATATAAGGGGGGAATATTAATATCTATGAGGAATAAATATGCTGTAGCAGGTCATTTGAAAAATGTAGATTTTCGCCCCTTTATAGACTCGAACTCCAATGGACAGTGGAGAAGATTGAGAGGAGCTAGCTATCCATCGACTTATAAATTCCCCAGAGATGATATTGCTATTGTGTTCATACGTTCTCCATTTAATTTCAATAACTTCGTCAACAATATACCTATTGCAAGTACACTAGTTGACTACGAAGGTAAATGCCTGGCGTCCGGATTTGGACGAATATCCCAAAAGAAATCATCGGATAAACTCCTTTTGGCGGAACTAGAACTAATACCTATGAAAGAGTGTGACAGAAGGCATCGACAAAATATGAGAAAATTCGTTTGCACGTCCAGTATAGTGTCGGATGTTGATAAGGGTGATTCTGGTGGACCCTTGGTGTGTACAAACACTGGTGATCCAAACGAAGAGTTAGGAAAAGGAGTTCTTATCGGTATAGTTGCTTTCAAATCAGTAGTTCAACGGCCCAGACTTTGTAAAACCTTTTGTGGAGGTGTCATTATGACACCAACGAAGTTGCTTTCTGCAGCTCATTGTTTTGTGGAGAAGGGCAATATTTGTCAGAGACTATTATATGGCACGGGATCCTTAAGATCATTAATGGACAAGTATGCCGTAGCAGGTAATTTAAGAAATACAGATTTTCGCCCCCGTGCGGACTCGAATAATCAAGGACAATGGAGAAAATTAAAAAGAGTTGTTTACCCAAAAACCTATAAATTCCCCAAAGATGATATTGCTGTAGTGTTCCTACGTTCTCCGTTTATTTATAACAGCTATGTCAACTATGTACCTATTGCAAGGAAATTAGTCGACTACCACGGAGAGTGTCTGGTGTCCGGATTTGGACGCATTTCTCATAAGGCTTCATCGGATAAACTTCTATTGGCGAATTTAAAACTTATGCCAATGAAAGGTGATTCTGGTGGACCGTTGGTGTGTGCAAACACTGGTGATCCGAATGAACAGCTTGGGAAAGGAATTCTTGTCGGTATAGTGAGTGGACATCGGTACGGATCAGGCTCATTCTTTACCCGAGTCTCATCTTATTACAAATATATACAACTTAGCAAATCAAATAGATTACACTCTAGAATTAGCATCGTTATAATAATACAAACAATAATATTGCTGTTTTGA

Protein sequence:

>DPOGS212294-PA
MYPIRSLRSLSGKFAVAGNLRNVDFYPLVESDTTGQWRKLRKVVYPWTYTFPRDDIAIVFLRSPFIYNSFVNYVPIASKSVDYQGKCLVSGYGRISQKDSSDKLLLAQLDLIPMRACNRKHRRNMRRFVCTSSLFTDVGKGDSGGPLVCSNTGDPNEEPGKGVLIGVVSGHRYGAGSFFTRVSSYYKYVKRNKSNKLHFKYSVVAFKSLIRRPRLYNTFCGGVIMTPTKLLSAAHCFVTKGNFCQRLIYKGGILISMRNKYAVAGHLKNVDFRPFIDSNSNGQWRRLRGASYPSTYKFPRDDIAIVFIRSPFNFNNFVNNIPIASTLVDYEGKCLASGFGRISQKKSSDKLLLAELELIPMKECDRRHRQNMRKFVCTSSIVSDVDKGDSGGPLVCTNTGDPNEELGKGVLIGIVAFKSVVQRPRLCKTFCGGVIMTPTKLLSAAHCFVEKGNICQRLLYGTGSLRSLMDKYAVAGNLRNTDFRPRADSNNQGQWRKLKRVVYPKTYKFPKDDIAVVFLRSPFIYNSYVNYVPIARKLVDYHGECLVSGFGRISHKASSDKLLLANLKLMPMKGDSGGPLVCANTGDPNEQLGKGILVGIVSGHRYGSGSFFTRVSSYYKYIQLSKSNRLHSRISIVIIIQTIILLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: