MonarchBase - Protein-coding gene

DPOGS214444
Transcript	DPOGS214444-TA	1149 bp
Protein	DPOGS214444-PA	382 aa
Genomic position	DPSCF300494 + 53219-54459
RNAseq coverage	7x (Rank: top 87%)

Annotation
*Heliconius*	HMEL002622	8e-119	55.24%
*Bombyx*	BGIBMGA001275-TA	9e-136	61.26%
*Drosophila*			%
EBI UniRef50	UniRef50_E2ALP2	9e-98	48.80%	Plasma glutamate carboxypeptidase n=11 Tax=Endopterygota RepID=E2ALP2_CAMFO
NCBI RefSeq	XP_001601839.1	3e-105	48.70%	PREDICTED: similar to ENSANGP00000013946 [Nasonia vitripennis]
NCBI nr blastp	gi\|321458019	2e-104	48.04%	hypothetical protein DAPPUDRAFT_189393 [Daphnia pulex]
NCBI nr blastx	gi\|321458019	3e-101	48.04%	hypothetical protein DAPPUDRAFT_189393 [Daphnia pulex]

Group
Gene Ontology	GO:0008233	5.1e-17	peptidase activity
	GO:0006508	5.1e-17	proteolysis
KEGG pathway	mxa:MXAN_0100	8e-56
	K01423 (E3.4.-.-)	maps->	Biotin metabolism
			Lysine degradation
InterPro domain	[193-354] IPR007484	5.1e-17	Peptidase M28
	[58-153] IPR003137	2.9e-07	Protease-associated domain, PA
Orthology group

Nucleotide sequence:

>DPOGS214444-TA
ATGAAGGATCTTACAAACAAGAACGGAGTATTTGATGTTCACACAGAGGATGTCATGGTTCCTGAATGGAAACGTGGGCTTGAATCCCTTAAAATGCTAAGACCACGACTAAAGCAACTGTCTATTCTTGGTATTGGACTCAGCGTTCCAACGGATGGAAAAATAACAGCAGAAGTTATTGTGGTGTCTAGTTTCGAAGAATTGGAAAGTATCGATAATGCCATAATTAAAGGCAAAATCATTCTTTTTAATACTAATTTTACTACTTACGAAAATACTATTCAGTACAGAAGAAATAGTGCCGTTAAAGCTGCTAGAAAGGGTGCTGTAGCAGTTTTAGTTCGAAGTATTACTCCGATTTCCTTATATACAACACATACTGGAGATTTAGTTTATGAACCCCACGTTAAAAAAATACCAGCTGCAGCAATTACAATAGAAGATGCTGATTTTTTACAGCGAATTCATAACCGTGGGGAAGTTATTGTTATAGAAATACAAATGTCAAATGAACTGAAAGCAAATATATCTAGAAATTTAATTATTGATGTAAAAGGCTATGATATTCCGGATAAAATGGTTATAGTTTCTGGACATATAGATAGTTGGGATGTCGGTCAGGGTGCTATTGACGATGGGGGCGGTATGATGATTAGTTGGTTTGTGCCTGTTGTTTTAAATTACCTAAAATTAAAACCAAGAAGAACTCTGAGGGCAATACTATGGACGTCTGAAGAAGTAGGCCTTAATGGTGCGAAGGCCTACTTGGAAAGACACAGTGATGAATTAGATAACATAGATTTTATAATGGAATCTGATGAAGGAACATTCAAACCTTTGGGTTTGGAAGTAGCTGGATCTAAAAACGTTACATGCTTAATTAATGAAATTTTACAATTATTTAAACCATGGGATTTAAATAGGCTGAAAGTAGCCAATTCCACAGGATCAGATATTTCAATTTTTATTGATAAGGGCATTCCTGGAGCCTCTCTTTTAAATAAGGATGATCGTTATTTCTGGTATCATCATTCAAATGCTGATACCTTAACTGCCCAAAATAAGTCCGATGTTCTAGACTGCGCTGCGTTTTGGGCTGCAATATCATATCTTATTGCTGAATTACCTGTAGATATTCGCAGAAGTTAA

Protein sequence:

>DPOGS214444-PA
MKDLTNKNGVFDVHTEDVMVPEWKRGLESLKMLRPRLKQLSILGIGLSVPTDGKITAEVIVVSSFEELESIDNAIIKGKIILFNTNFTTYENTIQYRRNSAVKAARKGAVAVLVRSITPISLYTTHTGDLVYEPHVKKIPAAAITIEDADFLQRIHNRGEVIVIEIQMSNELKANISRNLIIDVKGYDIPDKMVIVSGHIDSWDVGQGAIDDGGGMMISWFVPVVLNYLKLKPRRTLRAILWTSEEVGLNGAKAYLERHSDELDNIDFIMESDEGTFKPLGLEVAGSKNVTCLINEILQLFKPWDLNRLKVANSTGSDISIFIDKGIPGASLLNKDDRYFWYHHSNADTLTAQNKSDVLDCAAFWAAISYLIAELPVDIRRS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: