MonarchBase - Protein-coding gene

DPOGS213708
Transcript	DPOGS213708-TA	1395 bp
Protein	DPOGS213708-PA	464 aa
Genomic position	DPSCF300219 + 599286-603200
RNAseq coverage	113x (Rank: top 59%)

Annotation
*Heliconius*	HMEL004822	3e-114	71.86%
*Bombyx*	BGIBMGA010679-TA	2e-73	76.54%
*Drosophila*	CG8773-PB	6e-54	42.80%
EBI UniRef50	UniRef50_B4NKB8	4e-48	42.91%	GK13934 n=5 Tax=Drosophila RepID=B4NKB8_DROWI
NCBI RefSeq	XP_002056091.1	4e-54	45.08%	GJ10415 [Drosophila virilis]
NCBI nr blastp	gi\|195394928	8e-53	45.08%	GJ10415 [Drosophila virilis]
NCBI nr blastx	gi\|195394928	9e-51	44.32%	GJ10415 [Drosophila virilis]

Group
Gene Ontology	GO:0006508	4.7e-79	proteolysis
	GO:0008237	2.2e-58	metallopeptidase activity
	GO:0008270	2.2e-58	zinc ion binding
KEGG pathway	dpo:Dpse_GA21310	5e-53
	K11141 (ENPEP)	maps->	Renin-angiotensin system
InterPro domain	[20-461] IPR001930	4.7e-79	Peptidase M1, alanine aminopeptidase/leukotriene A4 hydrolase
	[213-461] IPR014782	2.2e-58	Peptidase M1, membrane alanine aminopeptidase, N-terminal
Orthology group

Nucleotide sequence:

>DPOGS213708-TA
ATGATGATTTCCCCAATAATAAAATGGATTTGTAATCATAAACTTTTAGCATTCTTGGGTGTAGCGACGTTTTGTTTTTTTGTATCTACAGTTGTTCTTTCTGTACAAAATAGCAAATTGAAAGAGTCCTCTCACATTTCCTCCGAAATGGATAACCGATATAGGCTCCCAGATTACATAAAGCCTACAAATTATCAGTTAAAATTGAGTCCAAACATAGCACAAAAAACTTTTGATGGGATAGTTGCTATCTCACTGTACATTACAAAACCAATCAAGACTATCACATTACACACCAAAGATTTGGAAATAAAATCAGTAGATTTTAAAAACAATTTTAATCAAAGTATAGAAGTGTCTTCTTCAAATATAATAGAAATCGCAGAGGTACTACAAGTCAATCTACAGAAGGAAGTAGTGCCAAATACGAATTATAAGCTAGAAATAGAATTTTCTGGCAGATTAGACAAAGGAATCGTTGGTTTTTATTCGAGCACAATGAGGAACCGAGAATCATTTCACGGTTCATTGAAATTGAAACCTGTTCGGTCTCTAATAATTTCTCGCTTTATATCCAATACTTCCATCGATATAATGGAGAATTCGTATAAAGTTAAACTCTCCGAGAAACTTTCCTCTTTGGTTCGACCAGCGCATTACAAACTATTGTTAAATCCGAATCTTAAAACTGGAACTTTCTCAGGAGAGGTTGAGATAAATGTTGTTGTTAAAGAGACGAGGAATTTTATAGCCCTCCACTCAAAATTTTTGGAAGTAAATGACGTAAAGGTAAACAAAAATCGGGAAGAAGTTTCTGTTTCAAAATTTTTGGAAGTTACGTCTTTGGAACAACTTTTGATTCAATTTGACAACAACCTTCCTCCTGGAAATTGTGATATAAGTATCAAATTTAATGGAAATTTAACTCGGAACATTGTTGGTTTTTATTTGTCCCATTTAAAAGACAAGAGTACAATGGTTGCTAGTAAGTTCCAGCCAACTTATGCTCGACAAGCTTTCCCCTGTTTCGATGAGCCAGAATACAAAGCAACATATGACATAACATTAGTCAAACCCAAGGAGTACATCGCCCTGTCTAATATGAATGAAATATCAAGGTCCTTAGCGAATTCTTCAGACTCCGAGGCAGTCACCTTTGCAACCAGTGTTCCGATGTCGACATACTTAGCATGTTTTGTTGTTTGCAATTTTGATTATAAGGAGGTCGATGTTAATGCAAACGGTATAGGAAGTAACTTTAAGTTGCGAGCCTTTGCTCAGAAAGATCAGACGCATAAAATAGATTTCGCTCATGACATTGGGAAACGTGCCACAGAATTTTATATCAATTATTATGAAGTTCCCTTTCCACTTCCAAAGCTGGGTAAGTGTTGA

Protein sequence:

>DPOGS213708-PA
MMISPIIKWICNHKLLAFLGVATFCFFVSTVVLSVQNSKLKESSHISSEMDNRYRLPDYIKPTNYQLKLSPNIAQKTFDGIVAISLYITKPIKTITLHTKDLEIKSVDFKNNFNQSIEVSSSNIIEIAEVLQVNLQKEVVPNTNYKLEIEFSGRLDKGIVGFYSSTMRNRESFHGSLKLKPVRSLIISRFISNTSIDIMENSYKVKLSEKLSSLVRPAHYKLLLNPNLKTGTFSGEVEINVVVKETRNFIALHSKFLEVNDVKVNKNREEVSVSKFLEVTSLEQLLIQFDNNLPPGNCDISIKFNGNLTRNIVGFYLSHLKDKSTMVASKFQPTYARQAFPCFDEPEYKATYDITLVKPKEYIALSNMNEISRSLANSSDSEAVTFATSVPMSTYLACFVVCNFDYKEVDVNANGIGSNFKLRAFAQKDQTHKIDFAHDIGKRATEFYINYYEVPFPLPKLGKC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: