MonarchBase - Protein-coding gene

DPOGS209836
Transcript	DPOGS209836-TA	2907 bp
Protein	DPOGS209836-PA	968 aa
Genomic position	DPSCF300117 + 736400-742781
RNAseq coverage	87x (Rank: top 63%)

Annotation
*Heliconius*	HMEL008407	0.0	67.59%
*Bombyx*	BGIBMGA008059-TA	0.0	63.26%
*Drosophila*	CG31198-PA	8e-150	33.90%
EBI UniRef50	UniRef50_Q11001	0.0	62.00%	Membrane alanyl aminopeptidase (Fragment) n=48 Tax=Ditrysia RepID=AMPM_MANSE
NCBI RefSeq	NP_001037013.1	0.0	63.23%	aminopeptidase N [Bombyx mori]
NCBI nr blastp	gi\|112983238	0.0	63.23%	aminopeptidase N precursor [Bombyx mori]
NCBI nr blastx	gi\|112983238	0.0	63.23%	aminopeptidase N precursor [Bombyx mori]

Group
Gene Ontology	GO:0006508	6.8e-198	proteolysis
	GO:0008237	2e-130	metallopeptidase activity
	GO:0008270	2e-130	zinc ion binding
KEGG pathway	nvi:100124286	2e-141
	K11140 (ANPEP)	maps->	Glutathione metabolism
			Renin-angiotensin system
			Hematopoietic cell lineage
InterPro domain	[43-931] IPR001930	6.8e-198	Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
	[45-447] IPR014782	2e-130	Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology group	MCL11206		Insect specific

Nucleotide sequence:

>DPOGS209836-TA
ATGGAAAACCGCTGGTTATCCCTTGTATTTGGGCTCATATTTATCCAGGGTTTACTAGCTCTAAGCCCAATCCCAGTTGCCGATGATGAATGGGAGGAATTTTCCAGAACCCTGCGGAGCCCTGCTTACCGCTTACCAAACACTACGAAGCCATCAAAATATGAAATAAGTTTGATTCCTTATTTCGATGTTGTTCCAACACCTAATATTCCACCATTTTCTTTCGATGGCCAAGTATCAATTTGGATACAGGCCACACAAGCTGGAGTTCGAGAAATAGTTATGCATTGTAATAGTTTAGTCATTAATAGCGTAACAGTTTCGTTGAACAATACTGCTATGAATTTGACCAATTCAAACTTTACTTGTGAAATGCCATATGCTTTTCTTAGAATTGGTACTAATGAACCTCTTCAAATGGGCCAAGAATACCTAATACATATAACCTACAGGGGTTTCTTCCAAACTAACATGCGTGGTTTTTACCGGAGCTGGTATAGGGATTCTACTGGTTTTAAGTGGATGGGTACAACGCAGTTCCAGCCTGGCCACGCTCGTCAAGCTTTTCCTTGTTATGATGAACCCTCTTTTAAAGCATACTTTGATATAACCATTCATAGAGAACGTAGTTTCAGTCCGACTATTTCAAATATGCCGATAAAATCGATTTCAACAACAGCTGTTCCTGGACGTATCTCAGAGACATTCTTCACGACGCCTCTAACTTCCACTTACTTGTTAGCTTTTATTGTATCCCATTATGATCGCGTTGAATCAAATGGTAGCCCTAACAGACCATTTGATATTTATGCACGGAATAATGCTGGTATTACTGGAAACTATTCACTAGTAATGGGAGAAAAACTCCTAGAGGCTATGGAAAATTATACTCAAATACCATATTACACTATGGCAAGAAATATTACTATGCAACAGGCCGCTATTCCTGATTTTTCTGCAGGTGCCATGGAAAACTGGGGATTGTTAACCTACAGAGAAGCTCTTATTTTGTTTGATCCTCAAAATACTAATAACTTCTACAAACAGCGTATTGCTAATATTGTATCTCACGAAATTGCCCACATGTGGTTCGGAAATCTTGTTACTTGTGCTTGGTGGGACAATTTGTGGCTAAATGAAGGATTCGCAAGATTTTACCAATACTATCTAACACATTCGGTTGCTGAAGATCTTGGATTTGATATTCGGTTTATTGTGGAACAACTCCAGACTGCTATGATTTCGGATTCTATTGATTCTGCGCATGCTTTAATCAACCCCGATGTAAATGATCCTACTAGTGTGTCTAATCATTTTTCCACTATAACTTATGCTAGAGGTGCTTCTATATTAAGAATGACGCAGCACTTCTTAGGTGAATCTACATATTTAAAAGGTCTCCGAAAATATCTTAGGGCTAGGCAATTTGATGTAGCGGAACCACAACATTTATTTAATGCTCTGGACGAAGCTGCACGTGAAGATGGTGCTTTGTCAGCATATGGTGGTATCACGATTAATTCATATTTCCGATCATGGGCCGAGAAAGCTGGACATCCACTTCTCACTGTCACTATTAATCAGACTTCTGGACTAATGACTGTTACACAGGCTCGCTGGGAACGCAATACTGGCGTTTCGAATTTCACAAGCATATGGGAAGTGCCAATAACATGGACCAGAGCAGGCGCTCCAGATTTTAACAATCTGAAACCGTCTCAAGTGATAACAGCTGATGTAACTAATATTGAACGTGGAACACGAGGTCTCGAATGGGTAATATTTAATAAACAGGAATCAGGATTCTACAGGGTGAATTATGATGACGTTAATTGGGCCTTGTTAACAAGAGCTTTGAGAAGTTCAAATAGGACCGTTATTCATGAATTGAATCGTGCACAGATCGTGGACGATTTATTCCAATTAGCAAGAGCTGGGGTTATGACATACAATAGAGCTTTTAATATACTCTCGTTCTTAGAGTTTGAAGATTCTTATGCACCTTGGATAGCAGCGATTGCAGGCTTTAATTTCGCCAGGAATAGACTTGTTTATGATACTACTAATATGCAAAGGCTTCAGAATTTGGCAATTAAACTAAGTGCTGCAATAACTCGCCGTCTTGGGCACGTCGAAAGAAATGGAGAATCTTTTATGGATGGTCTATTACGCATGCATGTTAATACCTTCCTTTGCAATGTAGGACATCCTGACTGTTTGGAAGCAGCAAGAGTAAGCTTTGCAAACTGGAGAAATGGTGGATTTATTCCAGCAAACATGCGACAATGGGTATATTGTAGCGGTCTGCGACAAGGGAATTCTTCTGACTTTGACTTTTTCTGGAATGAGTTCCTTAAAGAGGATCTGGCCAATAACGCGGTTATCATGATTGGAGCAGCTGGCTGTACTAACGACGTCGGAAGCCTTGAAAAGTTCTTGGACGCTATTATTACTGTGAATAATAGCGCAGAGATTATAAGGCCTCAAGACAATTCCGCGGCTTGGAGTTCTGCAGTGACTGGAAATAATGCCAACCCCATGAGGATGCTTAATTGGCTGAGACGCAATGTAAACCTTTTCATTGAAAGAAATATTTCTTTACAAACTCCAATCAGCAATATCGCAAGTCGATTAAGAAATGAAAATGAAATTTCGGAGCTGTTGTCTTGGTTAGAAACGAACAGAGAAATTCTCGGAAGCTCTTATAATACAGGTATTACTGGCATTGCTAGTACCAGATCTAACATGGCGTGGTCTAATAGACGTGTATCCGAATTTGCTCGATACTTCGACACTGGTTACATTGAAGATAAAATTGATGATGACAACGGTCACGACTCGGCTAATATTGCAACTTTGAGTATTGCCACCTTATTAGCGACAGTTGCAATCAGCCTCAACTTTTAA

Protein sequence:

>DPOGS209836-PA
MENRWLSLVFGLIFIQGLLALSPIPVADDEWEEFSRTLRSPAYRLPNTTKPSKYEISLIPYFDVVPTPNIPPFSFDGQVSIWIQATQAGVREIVMHCNSLVINSVTVSLNNTAMNLTNSNFTCEMPYAFLRIGTNEPLQMGQEYLIHITYRGFFQTNMRGFYRSWYRDSTGFKWMGTTQFQPGHARQAFPCYDEPSFKAYFDITIHRERSFSPTISNMPIKSISTTAVPGRISETFFTTPLTSTYLLAFIVSHYDRVESNGSPNRPFDIYARNNAGITGNYSLVMGEKLLEAMENYTQIPYYTMARNITMQQAAIPDFSAGAMENWGLLTYREALILFDPQNTNNFYKQRIANIVSHEIAHMWFGNLVTCAWWDNLWLNEGFARFYQYYLTHSVAEDLGFDIRFIVEQLQTAMISDSIDSAHALINPDVNDPTSVSNHFSTITYARGASILRMTQHFLGESTYLKGLRKYLRARQFDVAEPQHLFNALDEAAREDGALSAYGGITINSYFRSWAEKAGHPLLTVTINQTSGLMTVTQARWERNTGVSNFTSIWEVPITWTRAGAPDFNNLKPSQVITADVTNIERGTRGLEWVIFNKQESGFYRVNYDDVNWALLTRALRSSNRTVIHELNRAQIVDDLFQLARAGVMTYNRAFNILSFLEFEDSYAPWIAAIAGFNFARNRLVYDTTNMQRLQNLAIKLSAAITRRLGHVERNGESFMDGLLRMHVNTFLCNVGHPDCLEAARVSFANWRNGGFIPANMRQWVYCSGLRQGNSSDFDFFWNEFLKEDLANNAVIMIGAAGCTNDVGSLEKFLDAIITVNNSAEIIRPQDNSAAWSSAVTGNNANPMRMLNWLRRNVNLFIERNISLQTPISNIASRLRNENEISELLSWLETNREILGSSYNTGITGIASTRSNMAWSNRRVSEFARYFDTGYIEDKIDDDNGHDSANIATLSIATLLATVAISLNF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: