Monarch geneset OGS2.0

DPOGS209838
TranscriptDPOGS209838-TA7983 bp
ProteinDPOGS209838-PA2660 aa
Genomic positionDPSCF300117 + 763101-785468
RNAseq coverage104x (Rank: top 60%)
Annotation
HeliconiusHMEL0084120.069.52% 
BombyxBGIBMGA008063-TA0.055.33% 
DrosophilaCG31198-PA6e-13733.08% 
EBI UniRef50UniRef50_G6DQ920.099.50%Aminopeptidase N-7 n=2 Tax=Obtectomera RepID=G6DQ92_DANPL
NCBI RefSeqXP_001608208.10.028.89%PREDICTED: similar to protease m1 zinc metalloprotease [Nasonia vitripennis]
NCBI nr blastpgi|3253009600.061.29%aminopeptidase N2 [Cnaphalocrocis medinalis]
NCBI nr blastxgi|3253009600.061.36%aminopeptidase N2 [Cnaphalocrocis medinalis]
Group
Gene OntologyGO:00065081.8e-214proteolysis
GO:00082372.7e-113metallopeptidase activity
GO:00082702.7e-113zinc ion binding
KEGG pathwayphu:Phum_PHUM4122004e-135 
 K11140 (ANPEP)maps-> Glutathione metabolism
    Renin-angiotensin system
    Hematopoietic cell lineage
InterPro domain[940-1833] IPR0019301.8e-214Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
[944-1343] IPR0147822.7e-113Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology groupMCL15415 Insect specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS209838-TA
ATGGCTTTGTTGTATAAGCTGGTTTTATTACCAGCGATGATTTCTTTAGTGAAATCTGATTTTCCTTTAGATTTCGATGAACCGATCTATTTTAGTAATATCGACGAAGAAATATATCGTTTACCTGAAGATTTGGATCCCGTTAACATACTTTTGGAAATAACACCTTATTTTGAAGATCCATCGGCAAGCAAGGCGTTTACTTTTGAGGGATTTGTTTTATTAACAGTCAAAGCCGTCAGAGACAACATTTCCACTTTAACTCTGCATGAAAATGTAAGAGATATTCTATCAGTAAACATTACCGACGAGTCTGGTATAACTCTAGCTAGTTCTTTTAAAAGGATTCGTGAACAGCAATTTTTAGAAATTAGTCTCTTAAACGGAACAGTGTTGCAAAAAAATCAAACTTGTAAGATTGGTATTTCGTATATTGGAAATATTAATGAGACTCCACTTTCTCGTGGAATGTTTAGAGGAAGTTACAGAGATAATCAGGGGAGGAGACGCTGGTACGCAGGAACCCACTTGCAGCCGACAAATTCCCGCCAATTATTTCCGTGTTTTGATGAACCAGGGTTTAAATCAACCTTTGACATAATTGTTAATCGACCAATTAATTTTACTGAAACCTTTTCTAATATGAGAATAAAAAGTCAATCTCGTGTCGGAGATCGTCAGCAAGAAATTTTTCAAACGACTCCTAGAATGTCGGCGTATTTAGTGTCTATTCATATAAGTGAGGAGTTTGAAGTAATTGCTGATAATAATAACTATAATGCATCATACCGCATTATTGCTAGACCCAATGCGAGGGGTCAAGGTAAATACGCTTTAGAAGTTGGTCCACCCCTAACAAAATGGTTGGACGATTATTTCAATATATCATATTATACAATGGCAAATGATATAAAAAATGACCAGATCGCCTCGCCAGATTGGGCGTCCGGTGCTACTGAAAATTGGGGATTAGTTTCGTATAGGGAAATGCGTCTTCTTCATGAAGAAGGGGAGACAAATGCTGTCGACAAAATGACCATTGGAACTATAACAGCCCACGAGTTGGCACATAAATGGTTTGGAAATCTTATTACCTGTAGATGGTGGGACAATGTTTGGATAAATGAGGGATTTGCTAGTTATTTTGAAAATTTTGCAATGGATGGTGTTGATCCAAGCTTAGAATTAGCAGAAAAATTTATCACAGGAACAGTACAAAGTGCTCTGTCCAGCGATTCTTCAGCTTCAACCAGGGCGTTGAGACACACTGTAAATACCCCAGCTCAAGTTACTGGTCACTTCAGTGGTATAAGTTATACAAAAGGAGCTGCTTTTCTATTGATGCTTAAACATTTATTAGGAGAGCCTACTTTTAAAAAAGCACTTAACTATTTCCTCATTGAAAGATCATATGAACAAGCACTGCCTTCTGATCTTTATAGTGCTTTCCATAGAGCAGTTAATGAAGATGGAATCATAGAAAATTTAAATATTACAGCCTTTATGAACTACTGGGTAGAAGAAAGAGGATATCCAATTCTTGACGTCAATATTAATATGGATAATGGAATCATGATATTGAAGCAGGAGCGTTTCTTCATAAGTTCATCATCAACACCAACCGATCAAGTTTGGCCCCTCCCTATAACTTTTACAACGTCCCGTAATTCAAATTTTGACAATTTATCTCCAAAAACTGTTATGCTCAACAAAACAATCCAGCTCCGTAAGGATCCGGGAGAGGAATGGGTTATATTTAACTTACAACAAAAAGATTTTTATCGTGTCAATTACGATACTCATACATGGGAACTCATTGCTGCTGCTTTGAAAAATAATCGTAATAGTATCCACCGATTAAATAGAGCTCAGATTGTCGATGACGTATTTGCTTTAATGAGATCTGAAAGATTACCTTTTGAACTTGGCTTTAGGATTCTTGACTTCCTTAAGGAAGAAACAGATTATTATCCATGGACACCAGCAATTACCGGCTTTACCTGGCTTAGAAATCGTCTTTTACATCTACCAGAAAAATTAAAAGAATTCGATGAAATTCTTTCTAGTTTCCTCGATACAATCGTTTCTGATCTGGGGTATGATGTTCATTACGACGAGTCGATAACAAAAACCTTAAACAGATTTTACATTTTGAATTTTGCCTGTAACATCGGTCACGTGGGCTGCATCAATAATGCATTGGCAAAATTCAATTCCTTGAGAAGCAGTGGCGTACCTGTCAATCCGAATCTTAGAAGGCATGTCTTTTGCCAAGGTGTATTACATGGAGGATACGATGATTGGAAGTTCTTACAGCAAAGGTGGTTTGATTCCAACAACCAAGCTGATCAATTTGCAATGTTAAGATCACTTGGATGTACAAGAAATAACGAAGCTGTAAAAGAATACCTTGAAATGATCTTGAGCGATGACTTGAGAGCTCAAGATAGCAGCAATGCTTTTACATTTTTGTTCATGGGTGACAGACAAAATACTAAATACACCTTAGACTTCATGAAAGAAAGATGGGAAGAAGTAAGAAAAAAGGTTGTTCTGCAGACATGGTTTGGAACAGTCCTGAGTAATCTAGCTGCTTATTCAAATGAAGAGGTTCTTGAAGACATGGAGCAGTGGTTAACCACTAACCAAGCCATAATTCCAAGCGCCCAAACTGGTTTGTCTGCTATTAATAGTGCTAGAGCTAACATGAAATGGGGAACTGAGAAAGCTGATGATATTGTTAGAGGAGCGCGTGCGATGATTTGGCAGACTTTATTGGCGGTGGCTTGTATCGCTTTACAGCCAGTTCACAGCGATACAAGGTATAGATTGAATACAACTATCGTGCCATCGGCTTACTCGTTAACAATAACACCATATTTTGACACCAATGATGATAGAGCGTTCTCATTCGACGGTGAAGTATCCATCACATTCGTGACCACGTCAAATATTAACAAAATTAAGCTGCATTCCCAAGATTTAATATACACTTCTGCGAATATTACTCTTAAGAATGGCAATAATATTATTGAATTAAATGAAACCAATCCTCTCGAATTTGAAGAAGATTACACCTTTGCTCATATCAATTTGGCTAGTGATATACTAGTTGGGAGTGAATATACTCTTAATATTGTTTATCAAGGACCAATAAGAACAGACCTTAATGGTTTTTATAGAAATTACTATTTTCAAAATGGTGTGAAAAAATGGTTAGGCGCAACACAAATGGAGCCCACCCATGCAAGAAAAGTTTTCCCTTGTTTCGATGAACCTGAATTAAAAGCTGTATTTACGATGTCCATTGATAGACCTGCGGAATACCAACCTTCTTTAACAAATACAGAAATTATGTCGGTTACCGAAATGAATAACGGATATATTCGCGAAAACTTTTACACTACGCCGAGAATGTCAACATATCTAGTTGCATTTCTTGTGTCTGAGTTTGAGGCTGGTTCCTCAAATACCTTAGGAGCAAACGAATTGGGGATATACACCAGGCCCGATGCTAAAAATCAAACTGAATATGCCTTTGACGTTGCACAAAGAATTGTAAAAGCACTTAGCGATTACTTTGGAATTGATTATTATTCAACTAATAATCATCTAAGGCTTGATCATGTAGCATTAACAGACTTTAGAGCTGGGGCTATGGAAAACTGGGGACTCATTAAATACAGGGAATCTCTTTTGTTGTATGTTCCTGAAGAATCCACGCCATATTTTAAATACAGAGTAGCACAAATTGTGGCCCATGAAACAACTCATATGTGGTTCGGTAACCTCGTCACATGCCACTGGTGGAGCAACACTTGGTTAAATGAAGGTTTTGCAAACTACTTTCAAGATTACATGACCTCTTTGGTCGAGCCCGATGTAGCAGCTGATGATGCACTGGTTATAGGTTCTGTATATTCAGCCTATAATGCTGATGATAATCCTGATTCTCCTGCAATCACAAACAATAATGTTAATTCGCCATCAGAAATAAGTGGACATTTTGGAACTATTACCTATCAAAAAGCTGGATCCGTCATAAGAATGATGCATCATTTAATAGGCGATGATGCCTTTAAATATGGCTTAAACTCCTATCTATCTACTAACCAATTTCAATCTGGTTATCCCGAATTGTTGTATTCTGCCTTAGAGAATGGAGTAAGGAATTTTACTTCTTTGTCTAATTACGAAGGTTTTCATTTCACTGACATAATGAGTTCGTGGATAAGGCAATCAGGACATCCCGTGCTGTATGTCAACGTTGATTATGAAAATTCCTCGATTGAATTAAGCCAGAAACGCTTTTATATAAACTCATCTTACAGTTCAGATGAACTTTACATAATACCAATAACTTACACCCTCGAAAGTAATTTTAACTTTGAAAACACGAAGCCAGCACTTATTATGGATAAGAAGACACATGTTTTGCAAATGAGCGAAATAAAAGAGAAACAAACTTTCCCTATTTTCAACATACAAGAGACAGGTTTATACAGAGTTAATTATGATATTAATACTTGGCATCTAATTTCGGAACACCTAAAGAGTAATCGAAGTGGAGATATTCATTACTTGAATAGAGCCAAGATCGTCAACGATTTATTTGCTTTTCTTTTTGCCGATGAAGTGAAATTCGAACTTTTACATAATTTACTGCATTTCCTATCAAACGAAAATGAATATGCCGTATGGAACGCAGCTCTGAAAGGTTTAACTAAACTTCGAAATTATTACATCGGTTCTGATACATTGGATTTAATAGATGAATTCGCTCTAGAACTATTAGATGGAGTAATTTATAGGATGGGTTATGATGTAAAATCTACAGATGACTTTAAAATATTACGGAACAGGATGCAAATATTGGAATTCGCTTGCAAACTTGGTCATCAAGGTTGTATTGACCGGTCGTTGCAATGGTTTAAAGACTTAAAGAATAACGATACATGGATTCAACCAAGTTTAAGAAGCGTTGCGTATTGCACTGGGTTAAGGTATGGAAATGATGAGGACTATGAATTCTTATGGAACAGGCTTGTCAATACAAATGTTGCCAATGAAGCTTGGATTATTGCTGATGTACTGGGCTGCTCCCAAAGGGAAGACAAACTAAAAAGTTACCTCGTATCCATGTTACTTGAGAATAGTCCGATCAAAACTCAGGATCTTACGGTACCCTTAGCGAGTGTTCTAACAAATTACAGTAATGTACCATTGGTTATGGATGAACTTCAATCAAACATTTCTCTTTGGAAATCCGTTTATTCTTCTCTTGGATCAGTTTTGTCAAGCATTGCCTCGTCACTTCACACACAAGAAGATTTTGAAAAGTTCGAGAGTTTCCTGTCATCATGCAAGGAGTGCAGTGAAGACGAGGTAGCAAGTGCCAAGAACTCTTTGGCCAAAGCCAGGGCAGTGACAGCTTGGGCTGATGACCATAGGAGTGACATTTTAAGCTCTTTGATCTCAGCATATACTATAGAAGAGGAGTGCCTTAATTATACAGTGTATCCAGTGCAATATGAACTCACAATAATTCCGCATATATACCTGGATGGTATGTCTTATTATGATTGTGATATCGTAATAACTATAATAGCAAACGCGCCAAATGTTAACGTAATTGAATTGGACGCGAAAGACTTGGAAATTAAAGGGGAAACTGTTCAAGTATTAGACAACGGTAGCAATTTAGTAAATAAACACAGACCATACGAATATGATGCTAAAAAAGGCAAATTGTATATTTATTTAAGAGAATCGCTTAAACAGTACAGGTTACATCGGACTCAATATAATATAAGGATGTCTTTTAGCAAACAAATTAGCTATAACACCGATGGAATATTCGTCGTGCGATATACGGAGAATGGTAAACCTCAACACGTGTTGGTAACTCGCCTATCGCCAAGTAGAGCAAAATATTTCTTCCCTTGCTTTGATAATTCTCAATTTGAAGCAATTTTCAAATTCAAAGTATACGAGATGCCTCCATACCCTGGATATCAGTATTGTAATACTAGTATTGTAATAGCCAAAGAACTTAAACGACATCAATCTAAGGACAGCTATACCATAGTGGAATATTTACCATCGCCGCAGGTAGCATTACATCAAGTTGGCTTTCATCATTCGAAATTCGGAAGTCAACGAACCACAGCCAAAAACACTAATGATACATTAGTTATATGGGCACCAGTGTCTACTCTACCACAATATACATTCATACTACACTTTGGTGTAATAATTATTAATTTGATTCATGAATATTCTTCTATTAAAAGGCCTCTTGTATATGGACCGATAAATATAATTTCCGTACCAGCAATACTTAATGGGTACGAGATAGGAAGCTGGAATTTACTAACCAATGGGGACAACAGATTGGCAATTATCAACGACTACACGAGCATACAGCAAATCGAAGATATGATGTTTGAGCTATCCCAGCAGTTAAGTCGCATCTGGCTAGGAAATCCTGGAGAGAGTCAGATAACTCGTTGGAGGGAAGAGTGGTTTAAGGAAGGTGTTGCTACTTATTTAGCATATTATTTTTTAACGCAGTATAATCATGGTGAAGCAGCAGCTAGCTATCGACGACCAATCAGTACTTATGGTTTGCTAATGAAACACAGAGCAATGGCAAGGGATTGGCATCACAGCACACCACCTTTAGCATCTTTCAACAGAACTTTGGCTATAGATATACCATCAAGATATAAGGATCTGGTAACGATGAAGACAGCTTCGTTACTATGGATGGTTGAAAATTGGTTAGGATCGGAGAAGTTCCACCAGGCTCTGGTAAATTACATTAACAGCAGAAGAGAACAATACATATCGCTGACCGATTTCATGGCAAGTGTTGATCGTGAAACAGTTGAATGTCTGAATCAATTCTTTAACGGATCAACAACATCTAAAGTACTAAACTCTTGGTTTCACCAATCTGGATATCCTGTGGTCAATGTACAAGTACTTAGAGATAGAACTCCCAATGCTATTCAATTAAAACAAAGAAAGTTTAGTTTTACGGATCAGCACAGATTTGATACAAACTATCTTATACCGATTTCTTATATCGTTCAAAATAATCAGAACTGCTTTAACTGCTACCGACCGAGGTTCACTTTAGACATGCAAAGTTACACCTTTAGAGAAAACCTCAATGACGGTTGGATTTTACTTAATAGAAATGCTTCAGGTTATTATCGAGTTAATTATGATGTTTATACTTGGGGATTGATTGCAAAAACACTTGCGGATGATCACTTATCAATTAATGAATTGAATAGAGCGCAGATTGTAAACGATATATTCGCTCTTTATGCAGCTGGGGATATCCACGAGAACGTCGCTATCAGTGTTTTGAACTACTTGAACAGCGAGTTTAGTTTTGTGGTGTGGGAATCCGTTGTGAACGGTTTCGAGATGTTGAAGATAGAGGGCGCTAAAATGACCAAAGTTTTGTATGGGGAATGGCAGGTTTTCATGCAAAAAAAAGTGGCCACGGTCTATAAACGACTGATGGCAAACGTGGATCAAAGACCGTGGACGAGACGATTTAGAAAATTGATTGTCGATTTTGCATGTGCTGTCAAATACAGACGGTGCCTAAACGAAATGAGAAGATTTTATTCAGATCATAAGAATTCTAATATGAAATTGAATCCTGATTTTCGAGAAATATGTTATTACGTGACTATAAATGAAGGCAACTATGACATTGGAACAGCTTTAAATAGATTCGAACAAGAGGAAAAAACTGTTGCTGAGCACAAAGTACGAGAAGAAAGCAGATTTCTCTACCAAGTGCCCATTGGCCAACCAAGACCTTTGCCTATAATGATGTCGACAACAACAACAACAGAGATTTCAACAACAACAATTGAAAATACTAACAACGAGGGTATTACACTGTACATCTCAAATGTTTTACTGCTAGCTGTAATAATTAAATGTTTATTTCAATAG

Protein sequence:

>DPOGS209838-PA
MALLYKLVLLPAMISLVKSDFPLDFDEPIYFSNIDEEIYRLPEDLDPVNILLEITPYFEDPSASKAFTFEGFVLLTVKAVRDNISTLTLHENVRDILSVNITDESGITLASSFKRIREQQFLEISLLNGTVLQKNQTCKIGISYIGNINETPLSRGMFRGSYRDNQGRRRWYAGTHLQPTNSRQLFPCFDEPGFKSTFDIIVNRPINFTETFSNMRIKSQSRVGDRQQEIFQTTPRMSAYLVSIHISEEFEVIADNNNYNASYRIIARPNARGQGKYALEVGPPLTKWLDDYFNISYYTMANDIKNDQIASPDWASGATENWGLVSYREMRLLHEEGETNAVDKMTIGTITAHELAHKWFGNLITCRWWDNVWINEGFASYFENFAMDGVDPSLELAEKFITGTVQSALSSDSSASTRALRHTVNTPAQVTGHFSGISYTKGAAFLLMLKHLLGEPTFKKALNYFLIERSYEQALPSDLYSAFHRAVNEDGIIENLNITAFMNYWVEERGYPILDVNINMDNGIMILKQERFFISSSSTPTDQVWPLPITFTTSRNSNFDNLSPKTVMLNKTIQLRKDPGEEWVIFNLQQKDFYRVNYDTHTWELIAAALKNNRNSIHRLNRAQIVDDVFALMRSERLPFELGFRILDFLKEETDYYPWTPAITGFTWLRNRLLHLPEKLKEFDEILSSFLDTIVSDLGYDVHYDESITKTLNRFYILNFACNIGHVGCINNALAKFNSLRSSGVPVNPNLRRHVFCQGVLHGGYDDWKFLQQRWFDSNNQADQFAMLRSLGCTRNNEAVKEYLEMILSDDLRAQDSSNAFTFLFMGDRQNTKYTLDFMKERWEEVRKKVVLQTWFGTVLSNLAAYSNEEVLEDMEQWLTTNQAIIPSAQTGLSAINSARANMKWGTEKADDIVRGARAMIWQTLLAVACIALQPVHSDTRYRLNTTIVPSAYSLTITPYFDTNDDRAFSFDGEVSITFVTTSNINKIKLHSQDLIYTSANITLKNGNNIIELNETNPLEFEEDYTFAHINLASDILVGSEYTLNIVYQGPIRTDLNGFYRNYYFQNGVKKWLGATQMEPTHARKVFPCFDEPELKAVFTMSIDRPAEYQPSLTNTEIMSVTEMNNGYIRENFYTTPRMSTYLVAFLVSEFEAGSSNTLGANELGIYTRPDAKNQTEYAFDVAQRIVKALSDYFGIDYYSTNNHLRLDHVALTDFRAGAMENWGLIKYRESLLLYVPEESTPYFKYRVAQIVAHETTHMWFGNLVTCHWWSNTWLNEGFANYFQDYMTSLVEPDVAADDALVIGSVYSAYNADDNPDSPAITNNNVNSPSEISGHFGTITYQKAGSVIRMMHHLIGDDAFKYGLNSYLSTNQFQSGYPELLYSALENGVRNFTSLSNYEGFHFTDIMSSWIRQSGHPVLYVNVDYENSSIELSQKRFYINSSYSSDELYIIPITYTLESNFNFENTKPALIMDKKTHVLQMSEIKEKQTFPIFNIQETGLYRVNYDINTWHLISEHLKSNRSGDIHYLNRAKIVNDLFAFLFADEVKFELLHNLLHFLSNENEYAVWNAALKGLTKLRNYYIGSDTLDLIDEFALELLDGVIYRMGYDVKSTDDFKILRNRMQILEFACKLGHQGCIDRSLQWFKDLKNNDTWIQPSLRSVAYCTGLRYGNDEDYEFLWNRLVNTNVANEAWIIADVLGCSQREDKLKSYLVSMLLENSPIKTQDLTVPLASVLTNYSNVPLVMDELQSNISLWKSVYSSLGSVLSSIASSLHTQEDFEKFESFLSSCKECSEDEVASAKNSLAKARAVTAWADDHRSDILSSLISAYTIEEECLNYTVYPVQYELTIIPHIYLDGMSYYDCDIVITIIANAPNVNVIELDAKDLEIKGETVQVLDNGSNLVNKHRPYEYDAKKGKLYIYLRESLKQYRLHRTQYNIRMSFSKQISYNTDGIFVVRYTENGKPQHVLVTRLSPSRAKYFFPCFDNSQFEAIFKFKVYEMPPYPGYQYCNTSIVIAKELKRHQSKDSYTIVEYLPSPQVALHQVGFHHSKFGSQRTTAKNTNDTLVIWAPVSTLPQYTFILHFGVIIINLIHEYSSIKRPLVYGPINIISVPAILNGYEIGSWNLLTNGDNRLAIINDYTSIQQIEDMMFELSQQLSRIWLGNPGESQITRWREEWFKEGVATYLAYYFLTQYNHGEAAASYRRPISTYGLLMKHRAMARDWHHSTPPLASFNRTLAIDIPSRYKDLVTMKTASLLWMVENWLGSEKFHQALVNYINSRREQYISLTDFMASVDRETVECLNQFFNGSTTSKVLNSWFHQSGYPVVNVQVLRDRTPNAIQLKQRKFSFTDQHRFDTNYLIPISYIVQNNQNCFNCYRPRFTLDMQSYTFRENLNDGWILLNRNASGYYRVNYDVYTWGLIAKTLADDHLSINELNRAQIVNDIFALYAAGDIHENVAISVLNYLNSEFSFVVWESVVNGFEMLKIEGAKMTKVLYGEWQVFMQKKVATVYKRLMANVDQRPWTRRFRKLIVDFACAVKYRRCLNEMRRFYSDHKNSNMKLNPDFREICYYVTINEGNYDIGTALNRFEQEEKTVAEHKVREESRFLYQVPIGQPRPLPIMMSTTTTTEISTTTIENTNNEGITLYISNVLLLAVIIKCLFQ-