MonarchBase - Protein-coding gene

DPOGS209837
Transcript	DPOGS209837-TA	5526 bp
Protein	DPOGS209837-PA	1841 aa
Genomic position	DPSCF300117 + 746546-761435
RNAseq coverage	98x (Rank: top 61%)

Annotation
*Heliconius*	HMEL008410	0.0	67.72%
*Bombyx*	BGIBMGA008061-TA	0.0	59.73%
*Drosophila*	CG31198-PA	1e-122	32.20%
EBI UniRef50	UniRef50_B8PYI5	0.0	61.42%	Aminopeptidase N-6 n=8 Tax=Obtectomera RepID=B8PYI5_HELAM
NCBI RefSeq	XP_001608208.1	0.0	29.34%	PREDICTED: similar to protease m1 zinc metalloprotease [Nasonia vitripennis]
NCBI nr blastp	gi\|170791085	0.0	61.42%	aminopeptidase N-6 [Helicoverpa armigera]
NCBI nr blastx	gi\|170791085	0.0	61.42%	aminopeptidase N-6 [Helicoverpa armigera]

Group
Gene Ontology	GO:0006508	4.2e-172	proteolysis
	GO:0008237	5.9e-104	metallopeptidase activity
	GO:0008270	5.9e-104	zinc ion binding
KEGG pathway	nvi:100124286	5e-117
	K11140 (ANPEP)	maps->	Glutathione metabolism
			Renin-angiotensin system
			Hematopoietic cell lineage
InterPro domain	[5-1747] IPR001930	4.2e-172	Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
	[58-450] IPR014782	5.9e-104	Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology group	MCL15415		Insect specific

Nucleotide sequence:

>DPOGS209837-TA
ATGTATTTACTTAGTCCACTTGTCACCGTCACCAAAATGGGTCCCAAAATAGTAGAGACGGCACTATGGCTTTTATTATTTGGTATTGTAAATGCTCTCCCCGACGACATGCCGTCAGAATTTGAATTTATGGATTACTCTACCAACGTTGACGACCCAAAATACAGGTTACTAGACAACGTGAGACCGACTTACTTCTACGTAAACCTTGATGTTTATCTGGCAGAATCTCGATTCGATGGCTTAGTTCAGGCTCATGTCGAGGTTCAACAAAATGTCACACAAATTGTTATGCACCAAAAAGTTGTATCTATTCGTGCTATAAATGTCATTGACGGAAGCGGTAGAGCCGTAGCAGTTAAAGATTTTGATACCGATTCATATTATGAAATATTAAATATCAACTTTGTAAACGTAGTTACTCCGGGAAGTTACATTATAACCATTAACTATCTTGGCCGCATCAATGAAAATCCACATGACCGAGGATTTTATAAGGGTTACTACTACTACGGCAATGTAAAACGGGAGTATGCAACAACACAATTTCAACCTTATCATGCGAGAAAGGCATTCCCCTGTTTTGATGAACCTCAATTCAAATGCCCTTTCGTGATTTCAATTACCAGGGATTCAAATCTTAATCCATCTTTTTCTAATATGGCTATCAACCAAACCCAAGTGTTACAAAATCGGGTTCGAGAAACATTCCTTCCTACACCAGTTATCTCTGCTTACCTCATCGCTTTTCATGTCAGTGACTTTGTTGCTACTAATTATACAAGTACTGCAGAAAAGCCATTCCAAATCGTTTCTCGTGAAGGTCCAATCGATCAGCACCACTATGCTGCTGAAGTTGGTGTGAACATTACGAATCAAATGAGTGAGTTCTTTGATATTGACTACTATGGAATGGGTCAAGGACAACTTATGAAAAATGATCATATTGCCCTACCTGATTTTCCATCTGGTGCTATGGAAAATTGGGGAATGGTAAATTACAGAGAAGCTTATCTTCTCTACAATGAAGACCATACAAACGTAATTGATCAGATATTTATCGTATCAATAATCGCTCATGAAATGGCTCATAAATGGTTTGGAAATCTGGTAACTTGCTTCTGGTGGAGTAATCTTTGGCTAAATGAATCTTTTGCAAGCTACTTCGAGTATTTCAGTGCTCATCTAGCACAACCAGCATTAGAAATAGCTGATCGTTTTATTACCGCACATGTTCAAAGAGCTTTAACTGCTGATGCAAGTGCATCAGCAACTCCTATGAATTGGTCTGAGGTCGCAAATACCACAACAATTACAAATAATTTTGGTACAAGCAGTTACACGAAGGGATCATCAGTGTTAAGAATGTTGGAACATTTTGTTGGCTATGCTACCTTCAGAAATGCTTTGAGATATTACTTAAAAGACAATCTATATAGCATTGGATATCCCGTTGACATGTACAATGCATTCAGAAAAGCTGTTGGAGAAGATTCTTCTTTTCAAACCTCTTATCCAAATATAGATATTGGAGCAGTATTTGAGAGCTGGGTACAAAATCCCGGATCTCCAGTAATTAATGTTGATGTCAATATGAGAACTGGTCGTATAAATATAACTCAGGAGCGATTCCAACTTAGCGGTACTCCACGTGATTCAATTTGGCAAATTCCAATTACTTGGACTCATGGAGGAAACCCCAATTTCGAGAATCTCAAACCAAGCCTGGTGCTCACAACAAAGTCAACTACCATCCAAAAAGAAGCTGGTCATCATTGGGTCCTCTTTAATAATCAACATTCAGGGCTTTATCGTGTTAATTATGATGACCATAATTGGGAAATGATTGCGTCACAGTTGCGAAGAAATAAAAATGTCATACATAGACTAAATAGAGCACAGATAACCAATGATGTTCTATTTTTCGTCCGTGCCGGAAAAATCAGCATAAGGAGAGCATTTGACGTTCTATCTTATATGAAAGATGAAAGTGATTATTATGCGTGGAATAGGGCCCTTATTCAATTTGATTGGATTCGAAGAAGATTGGAACATTTACCTGCAGCTCATGAAGAATTTAGCAAATACCTTTTATTACAAATGCAAGGAGCAATCGATCAACTTGGTTATGAAGAACGTTCGAGTGATACAGCTTCTGATATTCAAAGTAGAATGCAAATAATGGACTACGCTTGCGAACTTGGGCATGAAGGATGTATCGCTGACAGTCTTAATAAATGGAGACAGTTTAGGACGAACGCTAGTTACATTGTACCGAAGAATGCACGCCGTTATGTCTATTGCACTGGTCTACGTGAGGGGAATGCAGAGGACTTTGAGTTTTTGTTCGACAGATATAATAGCTCAGAACACACTTCCGATATGGTTGTCATGCTTCGGACCCTAGCTTGTACGAAGCATCCGGCATCATTGAGAACATATTTGCATCAGACATTGCATAATGACAAAATAAGAGTCCACGATAGAAACAATGCATTTAGTTTCGCGCTTCAAGGAAATAGAGAAAATCTTAGAACAGTCCTTGAATTCTTATATAGTAACTATAGAGAAATAGAAGAAAAATATGGTGGTCGAGTAAGATTGTCCACGGCTATAGAAGCTTTGACAACATATTTGACTGATTTTAATGATATTGTTAATGTAATGATGTCTTTATCAGTTCTGTTAATACTAATAACCGTTACCGCTGTCACCAACGGAGATCATCCAATATGGTTATCTGATATAGAAGAAGAAAATGTCTTTTCCGCTAAATCGTCCTCAAGAAATTTAGAAACAGTATATAGACTACCAGTAAATGTGATACCACTAGACTACGACGTGTACATTGATTTATATTTTGCTGAGAGATCGGACAGGCCTTTTAGCTACGATGGTCGAGAAACGATTATTATACAAGCTGTTGAAGCAAACGTAACTAGCATAACATTACATTCTAATGTTGACGAGATAAGTGAATGTAGATTAACAAATAATGGTGTTGCGGTAGCTGTAAATGAAATAATTTACAAGCCACTGTATCATTTCATGATATTAAATTTGGAAGAACCCTTGAATGTCGGACAAAATTACACACTTTTTATAAGTTATATGAGTACTATGAATGAAGGTCCCATGAAAAGAGGAATCTGGCGAGGTTGGTATACTGATAATAATGGAAATGAAAGAGTATACGCCACGACCCATTTTCAACCGTATAATGCTAGACAGGCATTTCTATGTTTTGATGAGCCTCTTTTTAAAGCTGTTTTCAAAATTCACTTGTCCATGCCTAATAGCAATACGGGCACGTTTTGTAACACCGGCATTGAAACCAAAGAAACGTTAAATAATACTCGTATTCGTTACAACTTCTTTGCAACACCTAAGATGTCCAGTTATTTGGTAACATTTTTAGTTAGTGAAACATTTACGGTTATAGCTAGTGATGAATCTTATGAACCAGCTATAAGGATCATAGGTAGATCAAACACTGTTGGTCTCGGTGATCACGCTTTGGAACTTACAGTGAAAATGACTGAATATTTTAATGACTATTTTAAAATACCGTATTCGAGTCTTCACCCACATTTGATGAATGATCATATATCTTCTCCCGATTGGGCAAGTGCAGGAACTGAAAATTGGGGGATGGTTAGCTACAGAGAGTTGTATTTAATTATTGACCCCCGGGAAACCATTATGTCCGTTGAACATTACGCTACAACTCTCGTGTCTCATGAGCTTGCTCATAAGTGGTTCGGGAATTTGATCACCTGCTTTTGGTGGAGTAACACTTGGATCAATGAAGGTTTTGCAAGTTATTTTGGATACATGGCAGCCCATCAAATGTTTCCTCAATATGAATTGGACAAACACTTCAATTCTCGTTATCTCCAGACAAGCCTCTCATTTGACTCAGGCGCTTCTACAGTTCCTCTCAATTACGAAGTAAATACGCCAGCTCAAGTCACTGGTCACTTTGGTACGATCAGTTATTCAAAAGGTGCGGCAGTGTTGAGAATGCTGAGTAATATGATCAGTCTCAAGACTTTTCAAAAAGCATGTCGTTACTTTTTATTGGACAACCAGTATGAACCAACCGATCAATACCATTTATACAATGCTTTTAAAAAAGCAATAAATGAAGACAGGTCTCTAAGTGAATTCCCTAACTTCAACTTTACCGATTTTTATAGAATTTGGGTTAATGAACCTGGTTACCCTATTTTGCTTGTAAATGTTGATCGTAGAAATAGCGAAATTAGTTTAAGACAAGAGAGATTTTATATTAGTCCATCAGTTGCTCCAAGTACGTTAATTTATCCTATACCCATTAATTACGCCACTAAATCGACATCAAACTTCACAAATTTGAAACCTACGTATATGATGACGTCTAGTCATGCTGTTTTGAGTGAAGATGTTGGTGAAGAGTGGGTTATATTCAACATTCAGCAACATGGACATTACAGGGTACATTACGATGAGAAAACTTGGATTTTAATATCAGAGGCATTGTTGGCTGACCCTGATTCAATTCATTACCTTAATAGAGCTCAGGTGGTTGACGATGTCTTTGCTTTAATGAGGTCTGAAAGGATGACATACAGTTTTGGTTTTAAAATTTTAAGATTTTTACGGCACGAAGAAAATTATCATGTTTGGACGGTGGCCATTAGTGGATATACTTGGCTTAGAAACAGAATGAGAGAGGTTCCGGAGAGTCAAAAAATTTTTGATTCACACATCCTTAGTTACATGGATCATGTTATTAGTAAAATTGGTTACGAACCTTCTTCTGACGAAACCACTACAGTCACTTTGTTAAGACAAGAAGCTTTACACTTTGCTTGTAATATTGGCTTAGAACAATGCGTTCAAGACTCCCGTGCTAAATTCTTAGCTATGAGAAATTCAAATGCTTGGATTGATCCAAGAATTCGACGTCACGTTTATATAACGGGTATTAGAGAAGGAGGACAGGCAGACTTTGATTTTCTCTTAAACAGATTCCGAACATCGAATTTTGCTAATGATCAATTGGAAATGCTCAGAGGCTTGGCTGCTACTAAAGATCAAAAACTTTTATTTAGATATCTCGAATTGACCTTAAAAAAAGAAGTTCGCGCTCATGATAAAGTGAATTCATTTAATTATGCGCTTCTTGGCAATAAGGAAAATGGTGCAGTAGTTTTAGAATTTGTGAAAAGCAATATTGAGGCTGTTAGAAAAGCTTATGTTGAGGATTCTCCTGCCACGCCTGTACATACAGCTCTCGTCAATCTTGCTGCTTATCTTGATGAATCAGGTTTAACTGACTATGAGAACTGGCTTCAAAGGGATCAATATAATTCAAGTCAATTTAGCCGAGCTATGGCTGCTATAAGATCAGCTCGTAGCAATATTGCTTGGGGGAAAACAAACGCTGAAAAGATTCTTGATGCTGCTAGAGACGGAGCGTCTGCAATAATTGTATCCACATTTTTAATCGCGGCAATGTTGCTATTGAGTGTGAATGCATAA

Protein sequence:

>DPOGS209837-PA
MYLLSPLVTVTKMGPKIVETALWLLLFGIVNALPDDMPSEFEFMDYSTNVDDPKYRLLDNVRPTYFYVNLDVYLAESRFDGLVQAHVEVQQNVTQIVMHQKVVSIRAINVIDGSGRAVAVKDFDTDSYYEILNINFVNVVTPGSYIITINYLGRINENPHDRGFYKGYYYYGNVKREYATTQFQPYHARKAFPCFDEPQFKCPFVISITRDSNLNPSFSNMAINQTQVLQNRVRETFLPTPVISAYLIAFHVSDFVATNYTSTAEKPFQIVSREGPIDQHHYAAEVGVNITNQMSEFFDIDYYGMGQGQLMKNDHIALPDFPSGAMENWGMVNYREAYLLYNEDHTNVIDQIFIVSIIAHEMAHKWFGNLVTCFWWSNLWLNESFASYFEYFSAHLAQPALEIADRFITAHVQRALTADASASATPMNWSEVANTTTITNNFGTSSYTKGSSVLRMLEHFVGYATFRNALRYYLKDNLYSIGYPVDMYNAFRKAVGEDSSFQTSYPNIDIGAVFESWVQNPGSPVINVDVNMRTGRINITQERFQLSGTPRDSIWQIPITWTHGGNPNFENLKPSLVLTTKSTTIQKEAGHHWVLFNNQHSGLYRVNYDDHNWEMIASQLRRNKNVIHRLNRAQITNDVLFFVRAGKISIRRAFDVLSYMKDESDYYAWNRALIQFDWIRRRLEHLPAAHEEFSKYLLLQMQGAIDQLGYEERSSDTASDIQSRMQIMDYACELGHEGCIADSLNKWRQFRTNASYIVPKNARRYVYCTGLREGNAEDFEFLFDRYNSSEHTSDMVVMLRTLACTKHPASLRTYLHQTLHNDKIRVHDRNNAFSFALQGNRENLRTVLEFLYSNYREIEEKYGGRVRLSTAIEALTTYLTDFNDIVNVMMSLSVLLILITVTAVTNGDHPIWLSDIEEENVFSAKSSSRNLETVYRLPVNVIPLDYDVYIDLYFAERSDRPFSYDGRETIIIQAVEANVTSITLHSNVDEISECRLTNNGVAVAVNEIIYKPLYHFMILNLEEPLNVGQNYTLFISYMSTMNEGPMKRGIWRGWYTDNNGNERVYATTHFQPYNARQAFLCFDEPLFKAVFKIHLSMPNSNTGTFCNTGIETKETLNNTRIRYNFFATPKMSSYLVTFLVSETFTVIASDESYEPAIRIIGRSNTVGLGDHALELTVKMTEYFNDYFKIPYSSLHPHLMNDHISSPDWASAGTENWGMVSYRELYLIIDPRETIMSVEHYATTLVSHELAHKWFGNLITCFWWSNTWINEGFASYFGYMAAHQMFPQYELDKHFNSRYLQTSLSFDSGASTVPLNYEVNTPAQVTGHFGTISYSKGAAVLRMLSNMISLKTFQKACRYFLLDNQYEPTDQYHLYNAFKKAINEDRSLSEFPNFNFTDFYRIWVNEPGYPILLVNVDRRNSEISLRQERFYISPSVAPSTLIYPIPINYATKSTSNFTNLKPTYMMTSSHAVLSEDVGEEWVIFNIQQHGHYRVHYDEKTWILISEALLADPDSIHYLNRAQVVDDVFALMRSERMTYSFGFKILRFLRHEENYHVWTVAISGYTWLRNRMREVPESQKIFDSHILSYMDHVISKIGYEPSSDETTTVTLLRQEALHFACNIGLEQCVQDSRAKFLAMRNSNAWIDPRIRRHVYITGIREGGQADFDFLLNRFRTSNFANDQLEMLRGLAATKDQKLLFRYLELTLKKEVRAHDKVNSFNYALLGNKENGAVVLEFVKSNIEAVRKAYVEDSPATPVHTALVNLAAYLDESGLTDYENWLQRDQYNSSQFSRAMAAIRSARSNIAWGKTNAEKILDAARDGASAIIVSTFLIAAMLLLSVNA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: