MonarchBase - Protein-coding gene

DPOGS214132
Transcript	DPOGS214132-TA	3765 bp
Protein	DPOGS214132-PA	1254 aa
Genomic position	DPSCF300014 - 1408346-1423472
RNAseq coverage	628x (Rank: top 20%)

Annotation
*Heliconius*	HMEL011365	0.0	74.48%
*Bombyx*	BGIBMGA006180-TA	0.0	68.23%
*Drosophila*	CG11034-PB	2e-125	38.12%
EBI UniRef50	UniRef50_E0VJP6	1e-144	50.41%	Protein anon-37Cs, putative n=4 Tax=Neoptera RepID=E0VJP6_PEDHC
NCBI RefSeq	XP_974097.1	4e-146	49.40%	PREDICTED: similar to polyamine oxidase [Tribolium castaneum]
NCBI nr blastp	gi\|380012135	4e-149	51.33%	PREDICTED: spermine oxidase-like [Apis florea]
NCBI nr blastx	gi\|380012135	1e-146	51.44%	PREDICTED: spermine oxidase-like [Apis florea]

Group
Gene Ontology	GO:0016020	2.1e-75	membrane
	GO:0006508	2.1e-75	proteolysis
	GO:0055114	9.9e-60	oxidation-reduction process
	GO:0016491	9.9e-60	oxidoreductase activity
	GO:0008236	1.3e-44	serine-type peptidase activity
KEGG pathway
InterPro domain	[99-460] IPR002469	2.1e-75	Peptidase S9B, dipeptidylpeptidase IV N-terminal
	[786-1232] IPR002937	9.9e-60	Amine oxidase
	[546-726] IPR001375	1.3e-44	Peptidase S9, prolyl oligopeptidase, catalytic domain
Orthology group	MCL10744		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214132-TA
ATGATAGCTACAAAATATAATCTGGTAGTCCTAGCAACGGCATTGGTGTACTTCCTTGCCGATTCTGTTGCTTCACCTCAAGGACTCCTGAAGACATTCACTTTGGAGGAACTGGTGCCTTTGCAACATGAGTTCTTTCCTGACAGAGTGGCTGTACAATGGATATCAGATACGGAATATATTATAGCGGAACCAGATTCAGTAAATAAATATGACGCCATTACCGACACACACAGCACAATACTGGATAAGAAGGAATTGCTCAACATGAGCCAGTTTTCGGTGTCCTCGTTCTCGAACGATCAAAAATATGTACTACTAGTACTTACACCAAGTAGAAAGAAGATTTATAGATATTCAACATTGGCTGAATATTCGCTGTATGATCTTGAGAAGAATAAAATCGCTAACATCGCCCACGGACCGCTCCAGGTTGTTGTATGGGGCAGTGACAAGTCTTTAGCCTACGTTGAAGACAACAATGTGTACTATATACCTGACGTGGCTCAACCCGATGTTGTGACAGCACTGACGAAAGATGGCGTCCCAGGAGAAATATATCATGGTGTGACAGATTGGATTTATGAAGAGGAAGTGTTTAATGCAGCGGAAGCAATGTGGTTTTCACCTCATGGGACCTACTTGGCCGTAGCAACCTTCAATGACACTCAAGTGGAGTCCGCCTTATACCCCTACTACGGGGAACCGTCCGATTTTAATAGTCAATATCCTTTACTCGTTCATTTTAAATATCCTAAGGCAGGTCGCACGAATCCAGATGTGCAACTGCGTGTGTTCAATCTCAATGACACGTCCAGTGAGCCGATGATGATTCCAGCCCCTGTAGATATTGTGGGCCTAGATCACATTTTGGGGAGGGTCAATTGGGCTACTGATCAAAATCTCGTCGTTCTATGGCTTAACAGACGACAGAGTATTAGTGTTTTAGTGAACTGCAATCTAAAAGAGAACAAATGCAATATAGTGAAACAGCATAATGAACCCAATGGTTGGATTGATATTAACGAACCGTTTTTCGATAAAACAGGAAAGAAAATGTTAGAAATTCAACCCATGCATTACGAAGATCAGAGATTTATGCATGTAGCACATTTTGATTTCGAAACTCAAGAAACGACCGATTTGAGTCCAGGAAATTCCACAGTCACAGAAATATTGGGATGGGATCAGAAATCAGACATTGTTCTGTATATTGTATCCCCGGGAAATGAACCTTGGCAAAGACAACTGTGGGGTGCCTCTAAAGGAATCAATAGATGCATTTCGTGCACCAAACCGACTTGTCACAACGTTGACGGTATGTTTTCACCGGCAGGTAGCTATGGAATTGTATCGTGCAGTGCCGTAAATGTACCTCCAGTTACATACTTTTTCAAAAGCCAGAATAGAGGCTTTAAGATCATAACGGAAAACTCGAAATTGCTTGAAAAATTGAGTCGTTATAAAATGCCTTTGGTCTTATTTAACAAGATATCGTTAGAAGAGGATACGATGGCTCATATCAAGTTGTTGTTGCCACCTGAAATGAAACCAGGGAAGAAGTATCCTATGATAGTGAGGTTATACGCTGGACCCGGAACAACTAGAGTCAAAGACACCTATGATCTTGAATACTACAATCTTTATTTAAGCGGCAATCGTAGTTTCATAGTAGCGTCGATCGATGTAAGGGGTTCGGGCGCGATGGGTGTGGAGGCGATGCACGCCCTCAACAACGCTCTTGGGACCGTTGAAATTACCGATACTTTAACAGCTATCAGACGACTTGTGAGTATGTATTCGTTCATTGATACCGACCGTATTGGAGCTTGGGGATGGAGTTATGGTGGTTACGCTACCACTATGATGTTGATCAGAGACCATGACAAGATAGTGACGTGTGGCGCTGCTGTCGCTCCAGTTACTTCGTGGCTATATTATGATACAATTTACACGGAGAGGTATATGGATACACCTCAAAACAACCCAGTGGGCTATGAAAACTCAGACCTGATGATGCAAGCTGAAAAACTCCGAGACCGCCGTTATCTTTTAGTACATGGCACTGGTGATGACAATGTTCACTACCAACACAGCTTGCAACTAGCCAAGGTGCTGCAAAGAGCTGACATTGCATTTGAACAAATGAGTTATACTGATGAAAATCATTCTTTGCGAGGTATCTTCGAAAACATGGCGGCGGATACAGATAAAATGGTAGTACTGCTGTCGGACAAACCGGGTATGCTGTACGACTGTGGGCCAGATTTACGTGACAGGGGCGTGTGTGGAATAGATCCATTCGATCCGAACAAATGTTTCCAAGAACCACGCGTGGTCATCATAGGAGCGGGTATGGCCGGACTCTCTGCCGCCTCAAGACTATCACAACGTGGCATCAATAATCTTGTTGTGCTTGAAGCTTATGAAAGACCAGGAGGCCGCATTCACTCTTGTTGGTTGGGAGATGTTGTTGCTGAGCTCGGCGCTGATTTGGCAAATAGTGATTATTTTACTCATCCTGTATACAACCTCTCTGCCGCAGAAAAACCTCCCCGTCCTGGTGTACCGGGTTCAGAACATACACGTGGACTGTTTAATAGTATTGTTACAAAAAAAGTGCCATATCCACCAACCGTATCTGCATATTATAAATTTCGCCAAATTGAAGAAGAAGCTAGTAATATTTTTTGCCTTGGAGGAAGCAAACAGCATGGATCATTAATTAATTTTATGAGTATAAGAATTCAACAGGAACTTCATGAATATCCAGAAGAACAGCAACATGATGCGGCTCGAATAATGTTTGGACTTACCCATATGATGAATGCTCGTTGTGGTGACGATACGGCAATGCTTTGTGCGGATCACACTGGCTGTTTTATGAACATGCCAGGAGGAGATGTGCGGGTGCCGTTGGGGACAATAGGCACGCTTGCACCACTGTTACGTCAAATACCCGAAGGTGCAATACGGTACTGTAAACCCGTGAACTGTGTATATTGGGGAACTTGCATCAAATCAGGATATCGATCTACAGTTTGTACAACTGATGGAGATGAATTCCCTGCAGATTATGTTATTATTACAGCTTCTATTGGAGTTCTCTATTCAAATTCAACAAGACTTTTTTGCCCATCACTCCCCGCTTCTAAAATAGACGCTCTCAGATGCTTCGGATTCGGGTACTGTAATAAAATTTATTTAGAGTATTGCCGTCCATTTTGGTTTTGGCATAATGGAAGCTTAGATTTTGATTACACTTATGAAACTTTATCTCATCGTAATGATTGGACACGAGGTATTACAGCAATACGTGTGGTGCCAAATAGTAAACATGTAATAAGCGTTCTTGTATTTGGTAAAGAAGCGTTGACACTAGAGGGACTTTGCGATAAAGACGTCGCAGAAGGAGTTACTGACCTTTTAAAAACATCGACGGGGAATCGTTATATTCCCTATCCGATTACAATTTTGCGATCTCATTGGGTTTCTGATCCATATTTTCAAGGTGTGTTTTCTTATGAAGGGAAGTGTACAGATGGAGAAGCACAAAGGGCTTTGGCGTGTCCTTTACCCGGTCCCAGTGAATCAATTCCACCTATTCTTCTATTTGCCGGAGAAGCAACTGTTCCAGCACATTATGGCACAATTGATGGTGCCAGAATAAGTGGAGTAAGGGAAGCGGAACGAATTGTACAATTAACAAAGCAATTCGGAGGACCACCTCTGCCAACTTCAATAAATCCCGTGTGTTGTGGCTGA

Protein sequence:

>DPOGS214132-PA
MIATKYNLVVLATALVYFLADSVASPQGLLKTFTLEELVPLQHEFFPDRVAVQWISDTEYIIAEPDSVNKYDAITDTHSTILDKKELLNMSQFSVSSFSNDQKYVLLVLTPSRKKIYRYSTLAEYSLYDLEKNKIANIAHGPLQVVVWGSDKSLAYVEDNNVYYIPDVAQPDVVTALTKDGVPGEIYHGVTDWIYEEEVFNAAEAMWFSPHGTYLAVATFNDTQVESALYPYYGEPSDFNSQYPLLVHFKYPKAGRTNPDVQLRVFNLNDTSSEPMMIPAPVDIVGLDHILGRVNWATDQNLVVLWLNRRQSISVLVNCNLKENKCNIVKQHNEPNGWIDINEPFFDKTGKKMLEIQPMHYEDQRFMHVAHFDFETQETTDLSPGNSTVTEILGWDQKSDIVLYIVSPGNEPWQRQLWGASKGINRCISCTKPTCHNVDGMFSPAGSYGIVSCSAVNVPPVTYFFKSQNRGFKIITENSKLLEKLSRYKMPLVLFNKISLEEDTMAHIKLLLPPEMKPGKKYPMIVRLYAGPGTTRVKDTYDLEYYNLYLSGNRSFIVASIDVRGSGAMGVEAMHALNNALGTVEITDTLTAIRRLVSMYSFIDTDRIGAWGWSYGGYATTMMLIRDHDKIVTCGAAVAPVTSWLYYDTIYTERYMDTPQNNPVGYENSDLMMQAEKLRDRRYLLVHGTGDDNVHYQHSLQLAKVLQRADIAFEQMSYTDENHSLRGIFENMAADTDKMVVLLSDKPGMLYDCGPDLRDRGVCGIDPFDPNKCFQEPRVVIIGAGMAGLSAASRLSQRGINNLVVLEAYERPGGRIHSCWLGDVVAELGADLANSDYFTHPVYNLSAAEKPPRPGVPGSEHTRGLFNSIVTKKVPYPPTVSAYYKFRQIEEEASNIFCLGGSKQHGSLINFMSIRIQQELHEYPEEQQHDAARIMFGLTHMMNARCGDDTAMLCADHTGCFMNMPGGDVRVPLGTIGTLAPLLRQIPEGAIRYCKPVNCVYWGTCIKSGYRSTVCTTDGDEFPADYVIITASIGVLYSNSTRLFCPSLPASKIDALRCFGFGYCNKIYLEYCRPFWFWHNGSLDFDYTYETLSHRNDWTRGITAIRVVPNSKHVISVLVFGKEALTLEGLCDKDVAEGVTDLLKTSTGNRYIPYPITILRSHWVSDPYFQGVFSYEGKCTDGEAQRALACPLPGPSESIPPILLFAGEATVPAHYGTIDGARISGVREAERIVQLTKQFGGPPLPTSINPVCCG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: