MonarchBase - Protein-coding gene

DPOGS200548
Transcript	DPOGS200548-TA	2850 bp
Protein	DPOGS200548-PA	949 aa
Genomic position	DPSCF300119 + 10566-23081
RNAseq coverage	947x (Rank: top 13%)

Annotation
*Heliconius*	HMEL016873	6e-137	70.77%
*Bombyx*	BGIBMGA010763-TA	0.0	65.52%
*Drosophila*	SP1029-PA	0.0	38.75%
EBI UniRef50	UniRef50_D6WB37	0.0	40.79%	Aminopeptidase N-like protein n=2 Tax=Tribolium castaneum RepID=D6WB37_TRICA
NCBI RefSeq	XP_968871.2	0.0	40.79%	PREDICTED: similar to protease m1 zinc metalloprotease [Tribolium castaneum]
NCBI nr blastp	gi\|270002889	0.0	40.79%	aminopeptidase N-like protein [Tribolium castaneum]
NCBI nr blastx	gi\|189234124	0.0	40.79%	PREDICTED: similar to protease m1 zinc metalloprotease [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	1.4e-296	proteolysis
	GO:0008237	8.8e-82	metallopeptidase activity
	GO:0008270	8.8e-82	zinc ion binding
KEGG pathway	tca:657312	0.0
	K11140 (ANPEP)	maps->	Glutathione metabolism
			Renin-angiotensin system
			Hematopoietic cell lineage
InterPro domain	[18-949] IPR001930	1.4e-296	Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
	[214-432] IPR014782	8.8e-82	Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology group	MCL10074		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200548-TA
ATGGAGTGCTTGAAGGTGCTGTTCCTCCTGTCCTCCGTCCAGTTGAGCCGGCAGTACTTGCTGCCAGATCACATCGCTCCCTCACACTACCAACTCAGACTCCTGTACGACATCGACCCCAGCACCAACTTCAGCTTCTTCGGCGTCGCTGATATTCAGCTAACAGTAAAAAAGAGCACTTCGAAGATAATTCTCCATGCGCAAGATTATATGATATCAGATGACAAAGTGAGTGTCGTTGGACAAAAAGAGGTTCCCAAAGTGACGGGAGTAAAACTGAATGATACGTACAACTTCTTAGAAATATCACTTGATAAGGATTTAGAGGAAAATGGGAAGTACAAACTCACGATACCCTTCTACGGCAACCTGGTCAAAGGTTTGGACGGAGCCTACATAAGCTCCTACACGAACAGACAGACTCAGAAGACAGAGTATTTAATTTCCACTCAGTTTGAGGCGATATCAGCTCGCAAGGGTTTCCCGTGTTTCGACGAACCCATGTACAAAGCCACCTACTCTATCATCATCGGTCACAGCAAGGAGTACACGGCCGTCTCCAACATGCCACTAGCGGCGTCCGCCTCTGAAAATGCCCTAGAAGATTACTGGCCCTGGGACGTAGTCGGAAAGAGGTTTAGGAAGGAGAGATCTTCATTTGTCTGGGATCAGTTCGCCAAGTCTGTGCCTATGTCTACATATCTGGTCGCGTTCGTGGTGTCCAAGTTCTCGCACGTGGTCAGCCCTCCGGAACTATCGAAGACACAGTTCAGGATATGGGCCAGAGGAGACGCCATCGATCAGACATCCTACGCGGCTAAGATCGGTCCTCAAGTGTTGTCCTACTTTGAGAAGTGGTTCAACGTGTCGTTTCCTCTGCCGAAGCAGGACATGATGGCCATACCAGACTTCTCAGCGGGGGCTATGGAGAACTGGGGCCTCATCACGTACAGAGAGACGGCACTCCTGTACAGCGATAAGGAATCGTCGTTCTTGAACAAGGAGAGGATAGCTGAGGTGGTAGCTCATGAGCTGGCCCATCAGTGGTTCGGTAACCTGGTGACCATGAAGTGGTGGTCGGACCTGTGGCTGAACGAGGGGTTCGCGACCTTCGTGTCTAGTGTGGGCGTGTCGGCCGTGGAGCCGACCTGGCGAGCTGATCGGTCCTACGCCGTGGAGAACACGCTCTCCGTGTTGAGTTTAGACGCCTTGGAGTCATCTCATCCCGTGTCAGCGCCTCTCGATGATCCGAAGCGCATCTCGGAGATCTTCGACGCGATCTCTTACAGGAAGGGCTCCACTCTCATCCGCATGATGCTGATGTTCCTCGGAGAAGGTGTCTTCAGGCAGGCGCTGCACAACTACCTGATGAAGTATTCGTATTCAAACGCCGAGCAGGATGATCTCTGGGCGGAGCTGACGGCAGCCAGCCTGAGGAGTGGAAGCCTTACGAGGAACATCACCGTTAAAGAGGTGATGGACACCTGGACCACACAGACGGGATACCCGATCCTCACCGTCACCAGGGACTACTCCGACAAGTCGCTTACAATCTCACAGAAGCGTTACCTGTCTCTGGGCGTCGGTCGGACCTCCCAAGCGTGGTGGGTCCCTCTAAGCGTTCTCTGTGAGAAAGACAGAAAAAGCGAGAGCGAGAGCGTCCAGTGGTTAGGAGATACGGAGGGAGTGACGAACGAACATAGATACGAACACGGCTCTGGAGCGAGCGAGTGGGTTCTGTTCAACTACAACATGATCGCTCCATACAGAGTCAACTACGATCAGAGAAATTGGAAGCTTCTCATACAGACTCTGACGAGTGACCAGTACACCCTCATCCCGGTCGAAGGTCGAGTGCAGTTGCTGTCCGACGCTTTTGAGCTGGCGTGGAACAATCAGCTCGACTATGGAATGACTTTACAGTTGGCGAGCTACCTGAAGAGGGAGACGGAATACTTGCCTCTCTACACGGGGCTGTCGGCTTTAGCTAAGATTGAGAACGTACTGAAACGAAGTTCCGAGTACGGAGCCTTCCAGAAGTTTATCAGAAGACTCCTCAACAACGTCTACCAGAAAGGAGGTTTGGCTCTGAAGAGGATCGTCGACGGCGACGACTTGAACAGCGTCAAGCTTCAGACGACTGTGAGCTCTTGGGCCTGCAGCGTGAAGATCCCCGGCTGTGAGGAGAACGCTATAGACATGTTCAACGACTGGATGAGGACGGACAGACCCGACGAAAACAATCCGTATGTAGTCCCGCCCTCCGCCCTCCGCCATGGAATCCCTCTATACTCATGTGTTAATCTGATTCCCGTGGACCTCCGCCGCACTGTATATTGTTCGGCTATCCGTCGTGGCGGGGTGTCGTTGTGGCGCTGGTCCCTCGCCCGCCGCCGGGCCTCCAACGTGGCGACTTCCCGGGACGCCCTGCAGCACGCCCTGGCCTGCAGCAGAGACGTCTGGGTTCTGGCGCAGTACTTGGAGTGGACGGTGTCTGACGGCAGCGAGGTGCGTCGTCAGGATGCCGGCAACGTCATCGCAGCCGTCACCCGGTCTGCCACCGGATACTATGTGGCTAAGGACTTCATATACGGACGAATCCAGGAAATTAGCAAAGCGTTCAACGGCCAGGACAGGAGAATGGGCGGCATCATAAAGACCCTGTTGGGGCAGTTCACGACCAAGAAGGAACTCGATGAGTTCTTGGAGTGGAAGAAGCTGAACGAAAAATATTTGTCGGCTTCAAAGATAGCGGTCGCTCAGGGGATAGAGAACGCTAGAGTGAACATAGAGTGGATCCAGAGAAACAAACGTACCGTAGTGGATAAGATGAGGGAGTACTCCATGTGA

Protein sequence:

>DPOGS200548-PA
MECLKVLFLLSSVQLSRQYLLPDHIAPSHYQLRLLYDIDPSTNFSFFGVADIQLTVKKSTSKIILHAQDYMISDDKVSVVGQKEVPKVTGVKLNDTYNFLEISLDKDLEENGKYKLTIPFYGNLVKGLDGAYISSYTNRQTQKTEYLISTQFEAISARKGFPCFDEPMYKATYSIIIGHSKEYTAVSNMPLAASASENALEDYWPWDVVGKRFRKERSSFVWDQFAKSVPMSTYLVAFVVSKFSHVVSPPELSKTQFRIWARGDAIDQTSYAAKIGPQVLSYFEKWFNVSFPLPKQDMMAIPDFSAGAMENWGLITYRETALLYSDKESSFLNKERIAEVVAHELAHQWFGNLVTMKWWSDLWLNEGFATFVSSVGVSAVEPTWRADRSYAVENTLSVLSLDALESSHPVSAPLDDPKRISEIFDAISYRKGSTLIRMMLMFLGEGVFRQALHNYLMKYSYSNAEQDDLWAELTAASLRSGSLTRNITVKEVMDTWTTQTGYPILTVTRDYSDKSLTISQKRYLSLGVGRTSQAWWVPLSVLCEKDRKSESESVQWLGDTEGVTNEHRYEHGSGASEWVLFNYNMIAPYRVNYDQRNWKLLIQTLTSDQYTLIPVEGRVQLLSDAFELAWNNQLDYGMTLQLASYLKRETEYLPLYTGLSALAKIENVLKRSSEYGAFQKFIRRLLNNVYQKGGLALKRIVDGDDLNSVKLQTTVSSWACSVKIPGCEENAIDMFNDWMRTDRPDENNPYVVPPSALRHGIPLYSCVNLIPVDLRRTVYCSAIRRGGVSLWRWSLARRRASNVATSRDALQHALACSRDVWVLAQYLEWTVSDGSEVRRQDAGNVIAAVTRSATGYYVAKDFIYGRIQEISKAFNGQDRRMGGIIKTLLGQFTTKKELDEFLEWKKLNEKYLSASKIAVAQGIENARVNIEWIQRNKRTVVDKMREYSM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: