Monarch geneset OGS2.0

DPOGS209836
TranscriptDPOGS209836-TA2907 bp
ProteinDPOGS209836-PA968 aa
Genomic positionDPSCF300117 + 736400-742781
RNAseq coverage87x (Rank: top 63%)
Annotation
HeliconiusHMEL0084070.067.59% 
BombyxBGIBMGA008059-TA0.063.26% 
DrosophilaCG31198-PA8e-15033.90% 
EBI UniRef50UniRef50_Q110010.062.00%Membrane alanyl aminopeptidase (Fragment) n=48 Tax=Ditrysia RepID=AMPM_MANSE
NCBI RefSeqNP_001037013.10.063.23%aminopeptidase N [Bombyx mori]
NCBI nr blastpgi|1129832380.063.23%aminopeptidase N precursor [Bombyx mori]
NCBI nr blastxgi|1129832380.063.23%aminopeptidase N precursor [Bombyx mori]
Group
Gene OntologyGO:00065086.8e-198proteolysis
GO:00082372e-130metallopeptidase activity
GO:00082702e-130zinc ion binding
KEGG pathwaynvi:1001242862e-141 
 K11140 (ANPEP)maps-> Glutathione metabolism
    Renin-angiotensin system
    Hematopoietic cell lineage
InterPro domain[43-931] IPR0019306.8e-198Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
[45-447] IPR0147822e-130Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology groupMCL11206 Insect specific
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS209836-TA
ATGGAAAACCGCTGGTTATCCCTTGTATTTGGGCTCATATTTATCCAGGGTTTACTAGCTCTAAGCCCAATCCCAGTTGCCGATGATGAATGGGAGGAATTTTCCAGAACCCTGCGGAGCCCTGCTTACCGCTTACCAAACACTACGAAGCCATCAAAATATGAAATAAGTTTGATTCCTTATTTCGATGTTGTTCCAACACCTAATATTCCACCATTTTCTTTCGATGGCCAAGTATCAATTTGGATACAGGCCACACAAGCTGGAGTTCGAGAAATAGTTATGCATTGTAATAGTTTAGTCATTAATAGCGTAACAGTTTCGTTGAACAATACTGCTATGAATTTGACCAATTCAAACTTTACTTGTGAAATGCCATATGCTTTTCTTAGAATTGGTACTAATGAACCTCTTCAAATGGGCCAAGAATACCTAATACATATAACCTACAGGGGTTTCTTCCAAACTAACATGCGTGGTTTTTACCGGAGCTGGTATAGGGATTCTACTGGTTTTAAGTGGATGGGTACAACGCAGTTCCAGCCTGGCCACGCTCGTCAAGCTTTTCCTTGTTATGATGAACCCTCTTTTAAAGCATACTTTGATATAACCATTCATAGAGAACGTAGTTTCAGTCCGACTATTTCAAATATGCCGATAAAATCGATTTCAACAACAGCTGTTCCTGGACGTATCTCAGAGACATTCTTCACGACGCCTCTAACTTCCACTTACTTGTTAGCTTTTATTGTATCCCATTATGATCGCGTTGAATCAAATGGTAGCCCTAACAGACCATTTGATATTTATGCACGGAATAATGCTGGTATTACTGGAAACTATTCACTAGTAATGGGAGAAAAACTCCTAGAGGCTATGGAAAATTATACTCAAATACCATATTACACTATGGCAAGAAATATTACTATGCAACAGGCCGCTATTCCTGATTTTTCTGCAGGTGCCATGGAAAACTGGGGATTGTTAACCTACAGAGAAGCTCTTATTTTGTTTGATCCTCAAAATACTAATAACTTCTACAAACAGCGTATTGCTAATATTGTATCTCACGAAATTGCCCACATGTGGTTCGGAAATCTTGTTACTTGTGCTTGGTGGGACAATTTGTGGCTAAATGAAGGATTCGCAAGATTTTACCAATACTATCTAACACATTCGGTTGCTGAAGATCTTGGATTTGATATTCGGTTTATTGTGGAACAACTCCAGACTGCTATGATTTCGGATTCTATTGATTCTGCGCATGCTTTAATCAACCCCGATGTAAATGATCCTACTAGTGTGTCTAATCATTTTTCCACTATAACTTATGCTAGAGGTGCTTCTATATTAAGAATGACGCAGCACTTCTTAGGTGAATCTACATATTTAAAAGGTCTCCGAAAATATCTTAGGGCTAGGCAATTTGATGTAGCGGAACCACAACATTTATTTAATGCTCTGGACGAAGCTGCACGTGAAGATGGTGCTTTGTCAGCATATGGTGGTATCACGATTAATTCATATTTCCGATCATGGGCCGAGAAAGCTGGACATCCACTTCTCACTGTCACTATTAATCAGACTTCTGGACTAATGACTGTTACACAGGCTCGCTGGGAACGCAATACTGGCGTTTCGAATTTCACAAGCATATGGGAAGTGCCAATAACATGGACCAGAGCAGGCGCTCCAGATTTTAACAATCTGAAACCGTCTCAAGTGATAACAGCTGATGTAACTAATATTGAACGTGGAACACGAGGTCTCGAATGGGTAATATTTAATAAACAGGAATCAGGATTCTACAGGGTGAATTATGATGACGTTAATTGGGCCTTGTTAACAAGAGCTTTGAGAAGTTCAAATAGGACCGTTATTCATGAATTGAATCGTGCACAGATCGTGGACGATTTATTCCAATTAGCAAGAGCTGGGGTTATGACATACAATAGAGCTTTTAATATACTCTCGTTCTTAGAGTTTGAAGATTCTTATGCACCTTGGATAGCAGCGATTGCAGGCTTTAATTTCGCCAGGAATAGACTTGTTTATGATACTACTAATATGCAAAGGCTTCAGAATTTGGCAATTAAACTAAGTGCTGCAATAACTCGCCGTCTTGGGCACGTCGAAAGAAATGGAGAATCTTTTATGGATGGTCTATTACGCATGCATGTTAATACCTTCCTTTGCAATGTAGGACATCCTGACTGTTTGGAAGCAGCAAGAGTAAGCTTTGCAAACTGGAGAAATGGTGGATTTATTCCAGCAAACATGCGACAATGGGTATATTGTAGCGGTCTGCGACAAGGGAATTCTTCTGACTTTGACTTTTTCTGGAATGAGTTCCTTAAAGAGGATCTGGCCAATAACGCGGTTATCATGATTGGAGCAGCTGGCTGTACTAACGACGTCGGAAGCCTTGAAAAGTTCTTGGACGCTATTATTACTGTGAATAATAGCGCAGAGATTATAAGGCCTCAAGACAATTCCGCGGCTTGGAGTTCTGCAGTGACTGGAAATAATGCCAACCCCATGAGGATGCTTAATTGGCTGAGACGCAATGTAAACCTTTTCATTGAAAGAAATATTTCTTTACAAACTCCAATCAGCAATATCGCAAGTCGATTAAGAAATGAAAATGAAATTTCGGAGCTGTTGTCTTGGTTAGAAACGAACAGAGAAATTCTCGGAAGCTCTTATAATACAGGTATTACTGGCATTGCTAGTACCAGATCTAACATGGCGTGGTCTAATAGACGTGTATCCGAATTTGCTCGATACTTCGACACTGGTTACATTGAAGATAAAATTGATGATGACAACGGTCACGACTCGGCTAATATTGCAACTTTGAGTATTGCCACCTTATTAGCGACAGTTGCAATCAGCCTCAACTTTTAA

Protein sequence:

>DPOGS209836-PA
MENRWLSLVFGLIFIQGLLALSPIPVADDEWEEFSRTLRSPAYRLPNTTKPSKYEISLIPYFDVVPTPNIPPFSFDGQVSIWIQATQAGVREIVMHCNSLVINSVTVSLNNTAMNLTNSNFTCEMPYAFLRIGTNEPLQMGQEYLIHITYRGFFQTNMRGFYRSWYRDSTGFKWMGTTQFQPGHARQAFPCYDEPSFKAYFDITIHRERSFSPTISNMPIKSISTTAVPGRISETFFTTPLTSTYLLAFIVSHYDRVESNGSPNRPFDIYARNNAGITGNYSLVMGEKLLEAMENYTQIPYYTMARNITMQQAAIPDFSAGAMENWGLLTYREALILFDPQNTNNFYKQRIANIVSHEIAHMWFGNLVTCAWWDNLWLNEGFARFYQYYLTHSVAEDLGFDIRFIVEQLQTAMISDSIDSAHALINPDVNDPTSVSNHFSTITYARGASILRMTQHFLGESTYLKGLRKYLRARQFDVAEPQHLFNALDEAAREDGALSAYGGITINSYFRSWAEKAGHPLLTVTINQTSGLMTVTQARWERNTGVSNFTSIWEVPITWTRAGAPDFNNLKPSQVITADVTNIERGTRGLEWVIFNKQESGFYRVNYDDVNWALLTRALRSSNRTVIHELNRAQIVDDLFQLARAGVMTYNRAFNILSFLEFEDSYAPWIAAIAGFNFARNRLVYDTTNMQRLQNLAIKLSAAITRRLGHVERNGESFMDGLLRMHVNTFLCNVGHPDCLEAARVSFANWRNGGFIPANMRQWVYCSGLRQGNSSDFDFFWNEFLKEDLANNAVIMIGAAGCTNDVGSLEKFLDAIITVNNSAEIIRPQDNSAAWSSAVTGNNANPMRMLNWLRRNVNLFIERNISLQTPISNIASRLRNENEISELLSWLETNREILGSSYNTGITGIASTRSNMAWSNRRVSEFARYFDTGYIEDKIDDDNGHDSANIATLSIATLLATVAISLNF-