MonarchBase - Protein-coding gene

DPOGS208828
Transcript	DPOGS208828-TA	1539 bp
Protein	DPOGS208828-PA	512 aa
Genomic position	DPSCF300036 + 676189-682951
RNAseq coverage	147x (Rank: top 54%)

Annotation
*Heliconius*	HMEL004191	2e-123	65.14%
*Bombyx*	BGIBMGA007934-TA	4e-131	66.46%
*Drosophila*	CG9581-PA	3e-111	45.34%
EBI UniRef50	UniRef50_E2BM74	2e-126	45.65%	Probable Xaa-Pro aminopeptidase 3 n=2 Tax=Formicidae RepID=E2BM74_HARSA
NCBI RefSeq	XP_001605691.1	3e-131	48.28%	PREDICTED: similar to xaa-pro dipeptidase app(e.coli) [Nasonia vitripennis]
NCBI nr blastp	gi\|345493790	2e-130	45.14%	PREDICTED: probable Xaa-Pro aminopeptidase 3-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345493790	2e-126	45.14%	PREDICTED: probable Xaa-Pro aminopeptidase 3-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0009987	1.8e-58	cellular process
	GO:0004177	2.3e-32	aminopeptidase activity
	GO:0030145	2.3e-32	manganese ion binding
KEGG pathway
InterPro domain	[250-512] IPR000994	1.8e-58	Peptidase M24, structural domain
	[74-205] IPR007865	2.3e-32	Peptidase M24B, X-Pro dipeptidase/aminopeptidase P N-terminal
Orthology group	MCL12142		Single-copy universal gene

Nucleotide sequence:

>DPOGS208828-TA
ATGCAGAGTTTTCGTCGTTTATCATTACAATTAGCGAGTAAAAGTCCTAGAAGACTTCTAAGGAACACGCTAATTCGAGAAAGATGTAGATATAAATCGAGTATAGGCAATCCCCCTGATGTTATGTCAGAAACAACAACTATTCCCAAAGGAATACTTGGCCAACCTACTTGCCACACTCACCCTCACTTGATATCCGATGGCCACCTGACTTGCGGTATCACACAACAAGAGTATAAGGATAGAAGAGATACTTTAGTAGAAAAGCTAGTGGCAAGCAAAGAAAATGAACATAGATCTCATATTATAGTAATTCCAGCAGCACGTAAGCAGTACATGTCGGAGAAGATACCATATGTATTTAGACAGAATTCTGACTTCTTTTATCTGACAGGATGTCTGGAACCTTCTGCCATCCTAGTCATGGTGAAGCAATCACACGAAGATAGTTATAAGAGTATTCTATTTGTAAACGATAAGGACAGCCATGCTGAGTTATGGGAAGGACCGCGCACCGGATGTGCGTTGGCCGCTCCACTCTTCACAGTTGAAGAATCACGGCCCGTAGAGAATTTTAATAACTTTATACACAGAATAGTATCGACATCGAAACCAGCCATACTATGGTATCAGAATGAGTGTCCACCGAACCCTGACATCCACGAGTATGTCCGTTCCTCACTGCGTCAGGGTCATGTAACGCTGGACGAACCCCAAAAAGTACTTCATCAGATGAGGGTTATCAAATCGCCGGCTGAGATTGAGTTGATGAGAGACACTTGTCATATCGGCTCGCAGTCCATAAACCTGGCAATGGCCTGCACAAAACCTGGTATGTCAGAACATAACGTGGCTGCTATATTGGAGTACTCCTGGCGGACGGGGGGCGCGGAACACGGGGCCTTCCCCCCGGTACTGGCGGGGGGAGCGCGAGCCACTCACATACACTATGTGGCCAACAACCAACTCCTCAGACATGGAGAGATGATACTCGTGGACGCTGGGACACAAAGATGGCTGTACAATTCTGATATATCCCGCACGTGGCCCGTGTCCGGGAAGTTCTCTAAGCACCAGAGAATACTCTACGAACTGATACTTTCGGTGCAGAAACGTCTGATCGACCTGCTGGGTCAGCATCGGCCGTCTCTGGACACGTTGTTCGAGCACATGTGTCGCCTACTGGGAAGCCAGCTGCAGCAGGAGGGGATCATACCGAAGAATATTGACAACAACGAGCTTATCGGGCGAGCGTACCGCCTGTGTCCTCACCACGTGTCCCACTACCTCGGCCTGGACGTGCACGACGCGCCGCTGGTCCGGCGCCGTGTGCCCGTCACCAGCGGGATGGTGGTCACCGTCGAGCCAGGTATCTACATAGCTCCAGATGATAGATCCGTTCCAGAAGAATTCCGTGGAGTTGGCATCCGCGTCGAGGACGACGTGTTGTTGACTGACGGGGACCCCGAGGTGCTGACGCGGACCTGCCTTAAGGAGGTGGACGACATAGAGGCTGTGGTCGGCAAGCAGAGCTCGTGA

Protein sequence:

>DPOGS208828-PA
MQSFRRLSLQLASKSPRRLLRNTLIRERCRYKSSIGNPPDVMSETTTIPKGILGQPTCHTHPHLISDGHLTCGITQQEYKDRRDTLVEKLVASKENEHRSHIIVIPAARKQYMSEKIPYVFRQNSDFFYLTGCLEPSAILVMVKQSHEDSYKSILFVNDKDSHAELWEGPRTGCALAAPLFTVEESRPVENFNNFIHRIVSTSKPAILWYQNECPPNPDIHEYVRSSLRQGHVTLDEPQKVLHQMRVIKSPAEIELMRDTCHIGSQSINLAMACTKPGMSEHNVAAILEYSWRTGGAEHGAFPPVLAGGARATHIHYVANNQLLRHGEMILVDAGTQRWLYNSDISRTWPVSGKFSKHQRILYELILSVQKRLIDLLGQHRPSLDTLFEHMCRLLGSQLQQEGIIPKNIDNNELIGRAYRLCPHHVSHYLGLDVHDAPLVRRRVPVTSGMVVTVEPGIYIAPDDRSVPEEFRGVGIRVEDDVLLTDGDPEVLTRTCLKEVDDIEAVVGKQSS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: