MonarchBase - Protein-coding gene

DPOGS213611
Transcript	DPOGS213611-TA	2601 bp
Protein	DPOGS213611-PA	866 aa
Genomic position	DPSCF300033 + 836334-844466
RNAseq coverage	1003x (Rank: top 13%)

Annotation
*Heliconius*	HMEL013686	88.45%
*Bombyx*	BGIBMGA011674-TA	86.37%
*Drosophila*	Psa-PC	64.13%
EBI UniRef50	UniRef50_P55786	58.53%	Puromycin-sensitive aminopeptidase n=94 Tax=Eumetazoa RepID=PSA_HUMAN
NCBI RefSeq	XP_002428559.1	68.26%	Aminopeptidase N precursor, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242015848	68.26%	Aminopeptidase N precursor, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242015848	68.26%	Aminopeptidase N precursor, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0006508	0	proteolysis
	GO:0004177	0	aminopeptidase activity
	GO:0008237	2e-138	metallopeptidase activity
	GO:0008270	2e-138	zinc ion binding
KEGG pathway
InterPro domain	[1-863] IPR015568	0	Peptidase M1, puromycin-sensitive aminopeptidase
	[1-863] IPR001930	0	Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
	[10-397] IPR014782	2e-138	Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology group	MCL11352		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213611-TA
ATGCCAGAACACAAACCGTTTCAACGTTTACCAAAAAATGTTGTGCCCAAACATTATGAACTGCATTTGGTGCCAAATCTTGAAAAATTTACCTTTACAGGGAAGACTACGGTGAAAGTATCGATTGTTAATACTACCAAAGAAATAGTGCTTAACAGTTTAGATTTGGATTTAAAAAGTGTAAGACTCCAAATCAATGATGGGGGTTCAGTTTCAACACTTAATCCGGTGGAAGTACGACTTGAACCGGCTGATGAAACTGCAATAATAGTTTTTGACAAGCAGCTTCCAGTGGGTGAAGCAACTTTATATTGTGAATTTATTGGGGAAATAAATGATAAAATGAAAGGCCTGTACCGTAGCAAATATCTTACTCCTAGTGGAGAAGAGCGCTACGCTGCCGTTACTCAATTTGAAGCGACTGATGCACGGCGATGTTTCCCATGCTGGGACGAACCTGCCATAAAGGCAACGTTCGATATTACTCTTGAAGTACCGACTGATCGTGTAGCTTTGTCAAATATGCCTGTAAAAGTTGAAAAGGTGAATGGTGATAAGAAAGTAATGCAATTTGACACAACACCGATAATGTCTACATACCTTGTAGCCGTTGTTGTGGGGGAGTATGACTATGTTGAAAAAACATCTCGCGATGGAGTGTTAGTCCGTGTGTATACTCCAGTTGGCAAGAGCAAGCAAGGCATGTTCGCATTAGAGGTAGCCGCAAAAGTACTGCCATATTACAAAGAATACTTTGACATTGCCTATCCTCTACCTAAGATAGATTTGATAGCAATAGCTGATTTCTCTGCTGGTGCCATGGAGAATTGGGGTCTCGTAACCTATAGGGAAACATGCTTGCTAGTTGATGAAGAACACACATCAGCTGTTCGTAGACAATGGATTGCGCTTGTGGTGGGACATGAGCTTGCACACCAGTGGTTTGGCAACCTAGTGACAATGGAATGGTGGACACATCTCTGGCTCAATGAAGGCTATGCTTCATTTGTTGAATTTCTTTGTGTTAATCATTTGTTCCCCGAATATGATATTTGGACACAATTTGTCACAGAAACATACATAAGAGCACTCGAATTAGATTGCTTGAAAAACTCCCATCCTATTGAAGTACCTGTTGGTCACCCATCAGAGATAGATGAAATTTTTGATGACATTTCATACAACAAAGGTGCATCAGTAATCCGCATGTTGCATAGATACATTGGGGATGATGATTTCCGTAAAGGCATGAACATATATCTTACTAGACACCAGTATAAAAATACATTTACTGAGGACCTTTGGGCGGCTTTGGAGGAGGCGTCTAATAAGCCCGTAGGTGCCGTGATGTCAACATGGACCAAACAAATGGGTTTCCCGATGGTTGAAGTCAGTTCCGAGCAGCGTGGCTCTGATAGAGTTTTGAAGTTAACTCAGAAAAAGTTCTGCGCTGATGGCAGTCAGAGCGACGACGCTTTGTGGATGGTGCCCATCACTATATCCACCCAGGAACAACCTTCGAAGGTTGCATTATCAACTGTTTTGGAGAAACGAACACAGGAGGTAGTGTTGAAAAATGTCGCCGAAGATTCGTGGGTCAAGCTCAATCCTGGAACAGTGGGGTATTACCGCACTCGTTACCCGGCCGCCATGCTGGAGCAGCTGGTGCGTGCTGTGAGGGACGGCAGTCTGCCGCCGCTCGACAGGCTCGGACTGCTGGATGATTGTTTCGCACTCGTTCAGGCTGGACACGCACACACATCCGAGTCATTAAAACTCATGGAGGCGTTCAACAACGAAGCCAACTTCACCGTTTGGTCGTCTATTTCAAACTGCCTCGCCAAGCTGAGCGCTTTGTTTTCACACACGCCTCTCGACAAGCCGCTGAAGAACTATGGTAGGAAGTTATTTGCTAACGTCACCCGTCGCCTGGGATGGGATGCCAAAGATAAGGAAAGCCATCTCGACACTTTGCTCAGAAGCTTAGTGTTGAATAAAATGATCAGCTTCGAAGACCCTGACACGATTAAGGAGGCTCAGAGCCGCTTCGAGAAGCACCTGTCGGGCGAGTGTACCCTGCCGGCGGACCTGCGCTCGGCGTGTTACCGCGCGGTGTTGGCGAGCGCCGGCGAGGACACCTTCGGTCGCTTCCTGCAGCTGTACCGCGCCGCTGACCTCCACGAGGAGAAGGACCGCATCAGCCGAGCTCTCGGGGCGGTCAATGACCCCGCGCTGCTCAAAAAAGTGCTGGAGTTCGCTATATCTGACGAGGTTAGGGCACAGGACACCGTCTTCGTCATTGTGTCGGTGGCTTTGAGCCGTAATGGACGGGATTTAGCCTGGCAGTTCTTCAAGGACCATTGGCAGGAATTTATGGACCGTTACCAGGGCGGCTTCCTGCTGGCTCGGCTGGTGAAGTCGACTACTGAGAATTTTGCGTCTGAAGCATGCGCTCAGGAGATCGAGGAGTTCTTCCGCACTCATCACTCGCCCGGCACTGAGCGGTCCGTGCAACAAGCCTTGGAGACCGTCAGGCTGAACGCGGCCTGGCTACGGAGAGACCTCGCCTCCACCACCACATACCTCCAGCCTTATCACTGA

Protein sequence:

>DPOGS213611-PA
MPEHKPFQRLPKNVVPKHYELHLVPNLEKFTFTGKTTVKVSIVNTTKEIVLNSLDLDLKSVRLQINDGGSVSTLNPVEVRLEPADETAIIVFDKQLPVGEATLYCEFIGEINDKMKGLYRSKYLTPSGEERYAAVTQFEATDARRCFPCWDEPAIKATFDITLEVPTDRVALSNMPVKVEKVNGDKKVMQFDTTPIMSTYLVAVVVGEYDYVEKTSRDGVLVRVYTPVGKSKQGMFALEVAAKVLPYYKEYFDIAYPLPKIDLIAIADFSAGAMENWGLVTYRETCLLVDEEHTSAVRRQWIALVVGHELAHQWFGNLVTMEWWTHLWLNEGYASFVEFLCVNHLFPEYDIWTQFVTETYIRALELDCLKNSHPIEVPVGHPSEIDEIFDDISYNKGASVIRMLHRYIGDDDFRKGMNIYLTRHQYKNTFTEDLWAALEEASNKPVGAVMSTWTKQMGFPMVEVSSEQRGSDRVLKLTQKKFCADGSQSDDALWMVPITISTQEQPSKVALSTVLEKRTQEVVLKNVAEDSWVKLNPGTVGYYRTRYPAAMLEQLVRAVRDGSLPPLDRLGLLDDCFALVQAGHAHTSESLKLMEAFNNEANFTVWSSISNCLAKLSALFSHTPLDKPLKNYGRKLFANVTRRLGWDAKDKESHLDTLLRSLVLNKMISFEDPDTIKEAQSRFEKHLSGECTLPADLRSACYRAVLASAGEDTFGRFLQLYRAADLHEEKDRISRALGAVNDPALLKKVLEFAISDEVRAQDTVFVIVSVALSRNGRDLAWQFFKDHWQEFMDRYQGGFLLARLVKSTTENFASEACAQEIEEFFRTHHSPGTERSVQQALETVRLNAAWLRRDLASTTTYLQPYH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: