Monarch geneset OGS2.0

DPOGS209837
TranscriptDPOGS209837-TA5526 bp
ProteinDPOGS209837-PA1841 aa
Genomic positionDPSCF300117 + 746546-761435
RNAseq coverage98x (Rank: top 61%)
Annotation
HeliconiusHMEL0084100.067.72% 
BombyxBGIBMGA008061-TA0.059.73% 
DrosophilaCG31198-PA1e-12232.20% 
EBI UniRef50UniRef50_B8PYI50.061.42%Aminopeptidase N-6 n=8 Tax=Obtectomera RepID=B8PYI5_HELAM
NCBI RefSeqXP_001608208.10.029.34%PREDICTED: similar to protease m1 zinc metalloprotease [Nasonia vitripennis]
NCBI nr blastpgi|1707910850.061.42%aminopeptidase N-6 [Helicoverpa armigera]
NCBI nr blastxgi|1707910850.061.42%aminopeptidase N-6 [Helicoverpa armigera]
Group
Gene OntologyGO:00065084.2e-172proteolysis
GO:00082375.9e-104metallopeptidase activity
GO:00082705.9e-104zinc ion binding
KEGG pathwaynvi:1001242865e-117 
 K11140 (ANPEP)maps-> Glutathione metabolism
    Renin-angiotensin system
    Hematopoietic cell lineage
InterPro domain[5-1747] IPR0019304.2e-172Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
[58-450] IPR0147825.9e-104Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology groupMCL15415 Insect specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS209837-TA
ATGTATTTACTTAGTCCACTTGTCACCGTCACCAAAATGGGTCCCAAAATAGTAGAGACGGCACTATGGCTTTTATTATTTGGTATTGTAAATGCTCTCCCCGACGACATGCCGTCAGAATTTGAATTTATGGATTACTCTACCAACGTTGACGACCCAAAATACAGGTTACTAGACAACGTGAGACCGACTTACTTCTACGTAAACCTTGATGTTTATCTGGCAGAATCTCGATTCGATGGCTTAGTTCAGGCTCATGTCGAGGTTCAACAAAATGTCACACAAATTGTTATGCACCAAAAAGTTGTATCTATTCGTGCTATAAATGTCATTGACGGAAGCGGTAGAGCCGTAGCAGTTAAAGATTTTGATACCGATTCATATTATGAAATATTAAATATCAACTTTGTAAACGTAGTTACTCCGGGAAGTTACATTATAACCATTAACTATCTTGGCCGCATCAATGAAAATCCACATGACCGAGGATTTTATAAGGGTTACTACTACTACGGCAATGTAAAACGGGAGTATGCAACAACACAATTTCAACCTTATCATGCGAGAAAGGCATTCCCCTGTTTTGATGAACCTCAATTCAAATGCCCTTTCGTGATTTCAATTACCAGGGATTCAAATCTTAATCCATCTTTTTCTAATATGGCTATCAACCAAACCCAAGTGTTACAAAATCGGGTTCGAGAAACATTCCTTCCTACACCAGTTATCTCTGCTTACCTCATCGCTTTTCATGTCAGTGACTTTGTTGCTACTAATTATACAAGTACTGCAGAAAAGCCATTCCAAATCGTTTCTCGTGAAGGTCCAATCGATCAGCACCACTATGCTGCTGAAGTTGGTGTGAACATTACGAATCAAATGAGTGAGTTCTTTGATATTGACTACTATGGAATGGGTCAAGGACAACTTATGAAAAATGATCATATTGCCCTACCTGATTTTCCATCTGGTGCTATGGAAAATTGGGGAATGGTAAATTACAGAGAAGCTTATCTTCTCTACAATGAAGACCATACAAACGTAATTGATCAGATATTTATCGTATCAATAATCGCTCATGAAATGGCTCATAAATGGTTTGGAAATCTGGTAACTTGCTTCTGGTGGAGTAATCTTTGGCTAAATGAATCTTTTGCAAGCTACTTCGAGTATTTCAGTGCTCATCTAGCACAACCAGCATTAGAAATAGCTGATCGTTTTATTACCGCACATGTTCAAAGAGCTTTAACTGCTGATGCAAGTGCATCAGCAACTCCTATGAATTGGTCTGAGGTCGCAAATACCACAACAATTACAAATAATTTTGGTACAAGCAGTTACACGAAGGGATCATCAGTGTTAAGAATGTTGGAACATTTTGTTGGCTATGCTACCTTCAGAAATGCTTTGAGATATTACTTAAAAGACAATCTATATAGCATTGGATATCCCGTTGACATGTACAATGCATTCAGAAAAGCTGTTGGAGAAGATTCTTCTTTTCAAACCTCTTATCCAAATATAGATATTGGAGCAGTATTTGAGAGCTGGGTACAAAATCCCGGATCTCCAGTAATTAATGTTGATGTCAATATGAGAACTGGTCGTATAAATATAACTCAGGAGCGATTCCAACTTAGCGGTACTCCACGTGATTCAATTTGGCAAATTCCAATTACTTGGACTCATGGAGGAAACCCCAATTTCGAGAATCTCAAACCAAGCCTGGTGCTCACAACAAAGTCAACTACCATCCAAAAAGAAGCTGGTCATCATTGGGTCCTCTTTAATAATCAACATTCAGGGCTTTATCGTGTTAATTATGATGACCATAATTGGGAAATGATTGCGTCACAGTTGCGAAGAAATAAAAATGTCATACATAGACTAAATAGAGCACAGATAACCAATGATGTTCTATTTTTCGTCCGTGCCGGAAAAATCAGCATAAGGAGAGCATTTGACGTTCTATCTTATATGAAAGATGAAAGTGATTATTATGCGTGGAATAGGGCCCTTATTCAATTTGATTGGATTCGAAGAAGATTGGAACATTTACCTGCAGCTCATGAAGAATTTAGCAAATACCTTTTATTACAAATGCAAGGAGCAATCGATCAACTTGGTTATGAAGAACGTTCGAGTGATACAGCTTCTGATATTCAAAGTAGAATGCAAATAATGGACTACGCTTGCGAACTTGGGCATGAAGGATGTATCGCTGACAGTCTTAATAAATGGAGACAGTTTAGGACGAACGCTAGTTACATTGTACCGAAGAATGCACGCCGTTATGTCTATTGCACTGGTCTACGTGAGGGGAATGCAGAGGACTTTGAGTTTTTGTTCGACAGATATAATAGCTCAGAACACACTTCCGATATGGTTGTCATGCTTCGGACCCTAGCTTGTACGAAGCATCCGGCATCATTGAGAACATATTTGCATCAGACATTGCATAATGACAAAATAAGAGTCCACGATAGAAACAATGCATTTAGTTTCGCGCTTCAAGGAAATAGAGAAAATCTTAGAACAGTCCTTGAATTCTTATATAGTAACTATAGAGAAATAGAAGAAAAATATGGTGGTCGAGTAAGATTGTCCACGGCTATAGAAGCTTTGACAACATATTTGACTGATTTTAATGATATTGTTAATGTAATGATGTCTTTATCAGTTCTGTTAATACTAATAACCGTTACCGCTGTCACCAACGGAGATCATCCAATATGGTTATCTGATATAGAAGAAGAAAATGTCTTTTCCGCTAAATCGTCCTCAAGAAATTTAGAAACAGTATATAGACTACCAGTAAATGTGATACCACTAGACTACGACGTGTACATTGATTTATATTTTGCTGAGAGATCGGACAGGCCTTTTAGCTACGATGGTCGAGAAACGATTATTATACAAGCTGTTGAAGCAAACGTAACTAGCATAACATTACATTCTAATGTTGACGAGATAAGTGAATGTAGATTAACAAATAATGGTGTTGCGGTAGCTGTAAATGAAATAATTTACAAGCCACTGTATCATTTCATGATATTAAATTTGGAAGAACCCTTGAATGTCGGACAAAATTACACACTTTTTATAAGTTATATGAGTACTATGAATGAAGGTCCCATGAAAAGAGGAATCTGGCGAGGTTGGTATACTGATAATAATGGAAATGAAAGAGTATACGCCACGACCCATTTTCAACCGTATAATGCTAGACAGGCATTTCTATGTTTTGATGAGCCTCTTTTTAAAGCTGTTTTCAAAATTCACTTGTCCATGCCTAATAGCAATACGGGCACGTTTTGTAACACCGGCATTGAAACCAAAGAAACGTTAAATAATACTCGTATTCGTTACAACTTCTTTGCAACACCTAAGATGTCCAGTTATTTGGTAACATTTTTAGTTAGTGAAACATTTACGGTTATAGCTAGTGATGAATCTTATGAACCAGCTATAAGGATCATAGGTAGATCAAACACTGTTGGTCTCGGTGATCACGCTTTGGAACTTACAGTGAAAATGACTGAATATTTTAATGACTATTTTAAAATACCGTATTCGAGTCTTCACCCACATTTGATGAATGATCATATATCTTCTCCCGATTGGGCAAGTGCAGGAACTGAAAATTGGGGGATGGTTAGCTACAGAGAGTTGTATTTAATTATTGACCCCCGGGAAACCATTATGTCCGTTGAACATTACGCTACAACTCTCGTGTCTCATGAGCTTGCTCATAAGTGGTTCGGGAATTTGATCACCTGCTTTTGGTGGAGTAACACTTGGATCAATGAAGGTTTTGCAAGTTATTTTGGATACATGGCAGCCCATCAAATGTTTCCTCAATATGAATTGGACAAACACTTCAATTCTCGTTATCTCCAGACAAGCCTCTCATTTGACTCAGGCGCTTCTACAGTTCCTCTCAATTACGAAGTAAATACGCCAGCTCAAGTCACTGGTCACTTTGGTACGATCAGTTATTCAAAAGGTGCGGCAGTGTTGAGAATGCTGAGTAATATGATCAGTCTCAAGACTTTTCAAAAAGCATGTCGTTACTTTTTATTGGACAACCAGTATGAACCAACCGATCAATACCATTTATACAATGCTTTTAAAAAAGCAATAAATGAAGACAGGTCTCTAAGTGAATTCCCTAACTTCAACTTTACCGATTTTTATAGAATTTGGGTTAATGAACCTGGTTACCCTATTTTGCTTGTAAATGTTGATCGTAGAAATAGCGAAATTAGTTTAAGACAAGAGAGATTTTATATTAGTCCATCAGTTGCTCCAAGTACGTTAATTTATCCTATACCCATTAATTACGCCACTAAATCGACATCAAACTTCACAAATTTGAAACCTACGTATATGATGACGTCTAGTCATGCTGTTTTGAGTGAAGATGTTGGTGAAGAGTGGGTTATATTCAACATTCAGCAACATGGACATTACAGGGTACATTACGATGAGAAAACTTGGATTTTAATATCAGAGGCATTGTTGGCTGACCCTGATTCAATTCATTACCTTAATAGAGCTCAGGTGGTTGACGATGTCTTTGCTTTAATGAGGTCTGAAAGGATGACATACAGTTTTGGTTTTAAAATTTTAAGATTTTTACGGCACGAAGAAAATTATCATGTTTGGACGGTGGCCATTAGTGGATATACTTGGCTTAGAAACAGAATGAGAGAGGTTCCGGAGAGTCAAAAAATTTTTGATTCACACATCCTTAGTTACATGGATCATGTTATTAGTAAAATTGGTTACGAACCTTCTTCTGACGAAACCACTACAGTCACTTTGTTAAGACAAGAAGCTTTACACTTTGCTTGTAATATTGGCTTAGAACAATGCGTTCAAGACTCCCGTGCTAAATTCTTAGCTATGAGAAATTCAAATGCTTGGATTGATCCAAGAATTCGACGTCACGTTTATATAACGGGTATTAGAGAAGGAGGACAGGCAGACTTTGATTTTCTCTTAAACAGATTCCGAACATCGAATTTTGCTAATGATCAATTGGAAATGCTCAGAGGCTTGGCTGCTACTAAAGATCAAAAACTTTTATTTAGATATCTCGAATTGACCTTAAAAAAAGAAGTTCGCGCTCATGATAAAGTGAATTCATTTAATTATGCGCTTCTTGGCAATAAGGAAAATGGTGCAGTAGTTTTAGAATTTGTGAAAAGCAATATTGAGGCTGTTAGAAAAGCTTATGTTGAGGATTCTCCTGCCACGCCTGTACATACAGCTCTCGTCAATCTTGCTGCTTATCTTGATGAATCAGGTTTAACTGACTATGAGAACTGGCTTCAAAGGGATCAATATAATTCAAGTCAATTTAGCCGAGCTATGGCTGCTATAAGATCAGCTCGTAGCAATATTGCTTGGGGGAAAACAAACGCTGAAAAGATTCTTGATGCTGCTAGAGACGGAGCGTCTGCAATAATTGTATCCACATTTTTAATCGCGGCAATGTTGCTATTGAGTGTGAATGCATAA

Protein sequence:

>DPOGS209837-PA
MYLLSPLVTVTKMGPKIVETALWLLLFGIVNALPDDMPSEFEFMDYSTNVDDPKYRLLDNVRPTYFYVNLDVYLAESRFDGLVQAHVEVQQNVTQIVMHQKVVSIRAINVIDGSGRAVAVKDFDTDSYYEILNINFVNVVTPGSYIITINYLGRINENPHDRGFYKGYYYYGNVKREYATTQFQPYHARKAFPCFDEPQFKCPFVISITRDSNLNPSFSNMAINQTQVLQNRVRETFLPTPVISAYLIAFHVSDFVATNYTSTAEKPFQIVSREGPIDQHHYAAEVGVNITNQMSEFFDIDYYGMGQGQLMKNDHIALPDFPSGAMENWGMVNYREAYLLYNEDHTNVIDQIFIVSIIAHEMAHKWFGNLVTCFWWSNLWLNESFASYFEYFSAHLAQPALEIADRFITAHVQRALTADASASATPMNWSEVANTTTITNNFGTSSYTKGSSVLRMLEHFVGYATFRNALRYYLKDNLYSIGYPVDMYNAFRKAVGEDSSFQTSYPNIDIGAVFESWVQNPGSPVINVDVNMRTGRINITQERFQLSGTPRDSIWQIPITWTHGGNPNFENLKPSLVLTTKSTTIQKEAGHHWVLFNNQHSGLYRVNYDDHNWEMIASQLRRNKNVIHRLNRAQITNDVLFFVRAGKISIRRAFDVLSYMKDESDYYAWNRALIQFDWIRRRLEHLPAAHEEFSKYLLLQMQGAIDQLGYEERSSDTASDIQSRMQIMDYACELGHEGCIADSLNKWRQFRTNASYIVPKNARRYVYCTGLREGNAEDFEFLFDRYNSSEHTSDMVVMLRTLACTKHPASLRTYLHQTLHNDKIRVHDRNNAFSFALQGNRENLRTVLEFLYSNYREIEEKYGGRVRLSTAIEALTTYLTDFNDIVNVMMSLSVLLILITVTAVTNGDHPIWLSDIEEENVFSAKSSSRNLETVYRLPVNVIPLDYDVYIDLYFAERSDRPFSYDGRETIIIQAVEANVTSITLHSNVDEISECRLTNNGVAVAVNEIIYKPLYHFMILNLEEPLNVGQNYTLFISYMSTMNEGPMKRGIWRGWYTDNNGNERVYATTHFQPYNARQAFLCFDEPLFKAVFKIHLSMPNSNTGTFCNTGIETKETLNNTRIRYNFFATPKMSSYLVTFLVSETFTVIASDESYEPAIRIIGRSNTVGLGDHALELTVKMTEYFNDYFKIPYSSLHPHLMNDHISSPDWASAGTENWGMVSYRELYLIIDPRETIMSVEHYATTLVSHELAHKWFGNLITCFWWSNTWINEGFASYFGYMAAHQMFPQYELDKHFNSRYLQTSLSFDSGASTVPLNYEVNTPAQVTGHFGTISYSKGAAVLRMLSNMISLKTFQKACRYFLLDNQYEPTDQYHLYNAFKKAINEDRSLSEFPNFNFTDFYRIWVNEPGYPILLVNVDRRNSEISLRQERFYISPSVAPSTLIYPIPINYATKSTSNFTNLKPTYMMTSSHAVLSEDVGEEWVIFNIQQHGHYRVHYDEKTWILISEALLADPDSIHYLNRAQVVDDVFALMRSERMTYSFGFKILRFLRHEENYHVWTVAISGYTWLRNRMREVPESQKIFDSHILSYMDHVISKIGYEPSSDETTTVTLLRQEALHFACNIGLEQCVQDSRAKFLAMRNSNAWIDPRIRRHVYITGIREGGQADFDFLLNRFRTSNFANDQLEMLRGLAATKDQKLLFRYLELTLKKEVRAHDKVNSFNYALLGNKENGAVVLEFVKSNIEAVRKAYVEDSPATPVHTALVNLAAYLDESGLTDYENWLQRDQYNSSQFSRAMAAIRSARSNIAWGKTNAEKILDAARDGASAIIVSTFLIAAMLLLSVNA-