MonarchBase - Protein-coding gene

DPOGS215393
Transcript	DPOGS215393-TA	3903 bp
Protein	DPOGS215393-PA	1300 aa
Genomic position	DPSCF300088 - 127076-162195
RNAseq coverage	1176x (Rank: top 11%)

Annotation
*Heliconius*	HMEL007947	74.17%
*Bombyx*	BGIBMGA002365-TA	76.49%
*Drosophila*	Fur2-PC	61.90%
EBI UniRef50	UniRef50_Q26489	80.47%	Endoprotease FURIN n=4 Tax=Coelomata RepID=Q26489_SPOFR
NCBI RefSeq	XP_001355065.2	65.61%	GA15057 [Drosophila pseudoobscura pseudoobscura]
NCBI nr blastp	gi\|1167860	80.47%	Endoprotease FURIN [Spodoptera frugiperda]
NCBI nr blastx	gi\|1167860	80.47%	Endoprotease FURIN [Spodoptera frugiperda]

Group
Gene Ontology	GO:0004252	5.6e-112	serine-type endopeptidase activity
	GO:0006508	5.6e-112	proteolysis
	GO:0016020	1.4e-08	membrane
	GO:0007169	1.4e-08	transmembrane receptor protein tyrosine kinase signaling pathway
	GO:0005524	1.4e-08	ATP binding
	GO:0006468	1.4e-08	protein phosphorylation
	GO:0004714	1.4e-08	transmembrane receptor protein tyrosine kinase activity
KEGG pathway
InterPro domain	[23-1180] IPR015500	0	Peptidase S8, subtilisin-related
	[132-471] IPR000209	5.6e-112	Peptidase S8/S53, subtilisin/kexin/sedolisin
	[467-617] IPR008979	6.1e-44	Galactose-binding domain-like
	[693-856] IPR009030	6e-37	Growth factor, receptor
	[520-608] IPR002884	4.1e-26	Proprotein convertase, P
	[25-97] IPR009020	1.7e-25	Proteinase inhibitor, propeptide
	[743-790] IPR006212	5.8e-15	Furin-like repeat
	[699-806] IPR006211	1.4e-08	Furin-like cysteine-rich domain
Orthology group	MCL10133		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215393-TA
ATGGTGCTGTCATGGCGTGCGCTGGCGCTGCTAGCCGCGCTTCAAATGTGCTCATGCTTACCGAAAGCGCTATATCACAATCACTTCGCTATCCATGTACCAGCTGGCGAAAAACACGCGGATGACATCGCGACAAGACATGGTTTCATCAACCATGGCCAGATTGGAGCCCTCAAGGGATACTACTTGCTGTCACACCACGGGGTTCACAAACGGTCTACAGAACCAAGTCACGAGCATCATCACAAGTTAAATAATGAACCCGAGGTTAAATGGTTCGAGCAACAACGCGAGAGGCGTAGAATGAAACGTGATTACAGCCCTTATGAGAGCACATTATGGTCGCAGTTGTCTCGAAGGCTGCCCTCCCATAGAACCCGTCACCGCGCCATTACACCCTCGCCTTTCTTCTCCGATCCGTTGTTTAAAGAGCAATGGTATTTGAATGGCGGTGCGAAAGATGGACTTGACATGAATGTAATGCCGGCGTGGCAAAGAGGTTACACTGGAAAGGGTGTAGTTGTGTCAATCCTTGATGACGGTATACAAACCAACCATCCCGACCTCGCGCAGAACTATGATCCTCTCGCTTCCACTGACATAAATGGGAACGACGATGATCCAATGCCTCAAGACAACGGCGATAACAAACATGGAACACGTTGTGCTGGGGAGGTTGCCGCTGTAGCATATAATCAGTACTGTGGCGTCGGTATAGCATACAATGCTAGTATAGGAGGAGTCCGTATGTTGGACGGTGTAGTGAATGACGCGGTGGAAGCCAGAGCTCTTGGTCTTAACCCCGATCACATTGACATATACAGTGCCTCGTGGGGTCCTGAAGATGATGGGAAGACGGTAGACGGGCCGGGCCCGCTTGCTAGAAGAGCTTTTATTTATGGAGTTACAAGTGGTAGGCGCGGTAAAGGAAGTATATTCGTGTGGGCTTCGGGAAACGGTGGTCGCCATACAGACTCCTGTAATTGTGATGGATATACAAATAGTATATTTACTTTATCAATATCGAGTGCGACACAAGGGGGATTTAAACCTTGGTATCTAGAAGAATGTTCATCGACTCTAGCCTCCACATACAGCTCGGGTACTCCGGGTCATGATAAGAGTGTTGCTACTGTTGATATGGACGGCAGATTAAGATCAGATCATATTTGTACAGTGGAACATACAGGAACGTCCGCATCTGCACCTTTAGCAGCCGGTATTTGTGCCCTTGCGCTGGAAGCTAATCCAAATTTGACCTGGAGAGATATGCAGTATTTAGTAGTGTTAACATCACGTCCACAACCCCTCGAAAAAGAAACTGGGTGGATTGTGAACGGTGTGAAGAGAAAAGTTAGTCACAAGTTTGGCTATGGTTTAATGGATGCATCGGAAATGGTGAATTTGGCGGAACAATGGGTATCAGTACCACCGCAACATATATGTAAATCGCAGGAAATTAATGAGGACAAAGCTATTGAATCCTCATTTGGTTATACACTAAAAGTACATATGGATGTTAATGGTTGCAGTGGAACAGTTAATGAAGTGAGATATCTAGAACATGTCCAGTGCAAAATATCGTTGAGGTTTTTCCCTAGAGGTAATCTCCGCATACTTCTTACTTCACCGATGGGAACAACGTCCTCTTTATTATTTGAAAGACCTAGAGATGTTATCAGTTCCAACTTTGATGATTGGCCCTTCTTAAGTGTTCATTTCTGGGGTGAGAGAGCCGAAGGTAGATGGACTTTGCAGATCGTCAATGCTGGTAACAGGCATGTTAACCAACCAGGCATTCTTAAAAAATGGCAGTTGATATTTTATGGCACATCAACAGACCCTATACGGCTAAGGTCGAAAAGACCTGCACAAGCAGCGCCAGCCTTTGCTTTTCCAACTGCCGCTGATGGTTACGAAGCTGCCGGGGATTCTTTTTACAATACTGACGCGTTTACAAATTACCAGAACTTTCCTTCATTATTCGCCGCTGGGTCAAACCCCGAAAAGGCGATAGCACGTCTCGACGGACACAATGTCCCTTCACCGCATGGGGAAAATGTCCTCGCTGATAGTAATGATAAGCGCGTCATGCACGATTGTGATCCCGAATGCGATTCTCAAGGTTGCTATGAAAAAGGACCCACACAATGTATAGCCTGTAAGCATTACAGACTAGATGATGCCTGTGTATCTCGATGCCCTCCGAGAAGTTTTGCCAATCAAGGTGGTGTTTGTTGGCCCTGTCATGAAACATGTGAAACATGCGTGGGCCCAGGACAAGATTCATGTTTGACATGTTCGCCAGCACATTTATTAGTGGCCGATTTGGGTTTGTGTATACAACAATGTCCTGATGGATATTGGGAAAATAGCGAAGCGTCAGCTTGTCGGCCGTGTGCTGCACACTGTTCCACCTGCTCAGAGAGAGCTGATGCATGTACGTCATGTGAACATCATTTAGTACTATACAACGGAACTTGTGCCACATCCTGCCCACCTTCAACGTATGAAACGGAAGACTATAGCTGTGCTAAATGTCATGAAAGTTGCAACACTTGTCACGGACCTGGAGAGCAACATTGTGTCACATGTCCTGCTTCTAGTTATGTGCTTGATGGCCGTTGTCTGAGCACGTGTCCAAGTGGTTATTACGCAGATAAGAAAAGGAAAGAATGCATGAAATGTCCCATTGGTTGTGCAACTTGTTTGGCTTCTTTGTGCCAATCTTGTAACTCAAATTGGGAATTGAACAGAAAAGGGAAATGTGTGGCTGCTGGAAGTGACAGGTGTAATGCTGGTGAATTTTCGGATGGTAGCCAATGTCAGCTGTGTCACAATGACTGCGATTCGTGTTACGGTGAAACTGAGGGCAACTGTCTAACGTGTCCATCGCCCAACCTTTTACAAAATCACAAATGTGTACCAGAATGTAGTCGTGGGTACTACTCTGAAGCCGGTCGCTGCACTCGTTGTATCCACGGTTGCAGCGAGTGCGCATCGAGACTAAACTGCACTTTCTGCACTGGGTCTCTCAGACTTCAGTCTGGTACTTGTAGAACAGCCTGTGCAGAAGGTTACTACGCTGATCGTGGTACATGTTCCAAGTGCTACTTATCGTGTGCTACTTGCATTGGTCCACGTCGTGATCAGTGCGCCTCGTGTCCCCGTGGCTGGAGGCTGGCAGCTGGTGAATGTCACCCTGAATGTCCACAGGGTTTCTATAAGACCGCCGACGGTTGCCGCCACTGTCACCACTACTGCCGCGAGTGTGACGGCTCCGGGCCGTTACACTGCACGTCGTGTCCTCAACGCTTCATGTTAGACGGCGGGCTGTGTATGGAGTGTTTGAGCTCTCAATACTATGAAAGCAGCAGTGGATTATGTCGATCGTGTCACGAATCGTGTAGGATTTGCTCTGGACCCGGACAGTACAGCTGTACGGCGTGTTCGAGACCATTGCGGTTGGATAGGTTGAACAACCAATGTGTTCAGTGTTGTTCGGAGCGAGCTAACAACGCTACCTCAGACTGTTGTCACTGTGATTCTGACACAGGTGAGTGTATTAACTCGTCGGGCGCTGTTCGTCGTATCGCGGAGTGGGGCGCGCTACACACCGACGAGAACCACCCAGAACTGGCGACCACTGTGATCGTGTTGTGTGCGGCGGCCGGGCTCGTGTTGGTAGCTGTGGCAGTCGTGTTGCATAAGCGGTCACAGAAGCCGCAGGCACGATCTAAAGGACTAACTTACGCGGCCTTATCCTCCGAGGACGCGGATGTGCTGGTGGTCGGGCGTAATCGGTTGGTCGAGCACGTGCTCGAAGACGAGCACGCGCGGCCCGAGCACGTGCTCGGCTCCGACGATCTAGAGCACGCGCCGCTAATGAAACATTCCACATAG

Protein sequence:

>DPOGS215393-PA
MVLSWRALALLAALQMCSCLPKALYHNHFAIHVPAGEKHADDIATRHGFINHGQIGALKGYYLLSHHGVHKRSTEPSHEHHHKLNNEPEVKWFEQQRERRRMKRDYSPYESTLWSQLSRRLPSHRTRHRAITPSPFFSDPLFKEQWYLNGGAKDGLDMNVMPAWQRGYTGKGVVVSILDDGIQTNHPDLAQNYDPLASTDINGNDDDPMPQDNGDNKHGTRCAGEVAAVAYNQYCGVGIAYNASIGGVRMLDGVVNDAVEARALGLNPDHIDIYSASWGPEDDGKTVDGPGPLARRAFIYGVTSGRRGKGSIFVWASGNGGRHTDSCNCDGYTNSIFTLSISSATQGGFKPWYLEECSSTLASTYSSGTPGHDKSVATVDMDGRLRSDHICTVEHTGTSASAPLAAGICALALEANPNLTWRDMQYLVVLTSRPQPLEKETGWIVNGVKRKVSHKFGYGLMDASEMVNLAEQWVSVPPQHICKSQEINEDKAIESSFGYTLKVHMDVNGCSGTVNEVRYLEHVQCKISLRFFPRGNLRILLTSPMGTTSSLLFERPRDVISSNFDDWPFLSVHFWGERAEGRWTLQIVNAGNRHVNQPGILKKWQLIFYGTSTDPIRLRSKRPAQAAPAFAFPTAADGYEAAGDSFYNTDAFTNYQNFPSLFAAGSNPEKAIARLDGHNVPSPHGENVLADSNDKRVMHDCDPECDSQGCYEKGPTQCIACKHYRLDDACVSRCPPRSFANQGGVCWPCHETCETCVGPGQDSCLTCSPAHLLVADLGLCIQQCPDGYWENSEASACRPCAAHCSTCSERADACTSCEHHLVLYNGTCATSCPPSTYETEDYSCAKCHESCNTCHGPGEQHCVTCPASSYVLDGRCLSTCPSGYYADKKRKECMKCPIGCATCLASLCQSCNSNWELNRKGKCVAAGSDRCNAGEFSDGSQCQLCHNDCDSCYGETEGNCLTCPSPNLLQNHKCVPECSRGYYSEAGRCTRCIHGCSECASRLNCTFCTGSLRLQSGTCRTACAEGYYADRGTCSKCYLSCATCIGPRRDQCASCPRGWRLAAGECHPECPQGFYKTADGCRHCHHYCRECDGSGPLHCTSCPQRFMLDGGLCMECLSSQYYESSSGLCRSCHESCRICSGPGQYSCTACSRPLRLDRLNNQCVQCCSERANNATSDCCHCDSDTGECINSSGAVRRIAEWGALHTDENHPELATTVIVLCAAAGLVLVAVAVVLHKRSQKPQARSKGLTYAALSSEDADVLVVGRNRLVEHVLEDEHARPEHVLGSDDLEHAPLMKHST-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: