MonarchBase - Protein-coding gene

DPOGS206688
Transcript	DPOGS206688-TA	1515 bp
Protein	DPOGS206688-PA	504 aa
Genomic position	DPSCF300048 + 1256807-1262899
RNAseq coverage	1042x (Rank: top 12%)

Annotation
*Heliconius*	HMEL006579	6e-82	55.67%
*Bombyx*	BGIBMGA008521-TA	0.0	68.60%
*Drosophila*	Dip-C-PA	2e-149	51.69%
EBI UniRef50	UniRef50_B4NJE8	2e-153	52.24%	GK12846 n=1 Tax=Drosophila willistoni RepID=B4NJE8_DROWI
NCBI RefSeq	XP_001865452.1	3e-156	54.01%	xaa-pro dipeptidase [Culex quinquefasciatus]
NCBI nr blastp	gi\|170059646	5e-155	54.01%	xaa-pro dipeptidase [Culex quinquefasciatus]
NCBI nr blastx	gi\|345492726	3e-150	53.74%	PREDICTED: xaa-Pro dipeptidase-like isoform 3 [Nasonia vitripennis]

Group
Gene Ontology	GO:0009987	4.6e-70	cellular process
	GO:0004177	1.8e-36	aminopeptidase activity
	GO:0030145	1.8e-36	manganese ion binding
KEGG pathway
InterPro domain	[231-498] IPR000994	4.6e-70	Peptidase M24, structural domain
	[15-137] IPR007865	1.8e-36	Peptidase M24B, X-Pro dipeptidase/aminopeptidase P N-terminal
Orthology group	MCL11536		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206688-TA
ATGGCTGGTGTTTGGTCTATGGGTCCTGGTACATATGAAGTTCCATTGTCCTTGTTTGCTAAGAATAGAGATAGACTTGCAGAAAAGTTGAAGAGTGGCCAAGTAGTTGTTCTGCAAGGTGGAGATGATATAAATCTCTATGATACTGACATCCAATATGTCTTCCGACAGGAAGCATATTTTACATGGGCTTGTGGCGTACGAGAGCCAGGCTGCTATTTTGCTCTTGATGTAAAAACCAAGAAAAGCATTGTCTTTGTGCCTCGTCTGCCAGATGAGTATGAAATTTGGATGGGCAAACTACTTAGTTGTCAAGATTACACCAATATGTATGGGGTTGATGAAGTCCGCTATGTTGATGAGATCTGTGATGTATTAAAATCACTCGAACCTGATACTTTGCTAACACTTGTAATGGACAATGAAACACTATTTCCGATTATTGCTGAACTGCGCGTCATCAAAACGCCAGAGGAGATAGAAGTAATGCGTTACATATGCAAAGTATCGTCCGATGCTCACAAACAGGAGTCTGCTCCTTCTAACAGTGAAAAAATGAGTACAGGGTTTGCTTCGGAAGAGAAATCGCCGGAGACATTGGCCACGACGCTCGACCTGTGGAAGTGGATACTCCCGAAAAGATTGCACATATCGAAAAGGAGGTTCTTAGAGAGCGCCGTTATGCTCTACGCTAAGCCCGGCCTTCTGGAGTATCAATGCGAATCAGTATTCCTCGATCATTGTTACCGTGTGGGCGGGTGTCGCCACGTGTCCTATACATGTATATGCGGCTCGGGTGACAATTCTGCCATTTTGCACTACGGACACGCCGCAGCTCCGAATAATAAGATGTTAAAGGATGGGGATATATGTTTATTCGACATGGGTGGCAACTATGCTGGGTACGCCGCAGACATCACATGCTCTTTCCCTGCTAATGGAAAGTTCACTGAAGATCAGAAGCTCATATATGAAGCTGTGCTCGCTGCAAGAGATGCGGTTATTAGACAAGGAAAACCGGGAGTCAAATGGACGGACATGCATCTAGCTGCGAATAGAGCCATGTTGGAACATCTCAAGAGAGGTGGACTCTTGAAGGGAGAAGTGGAGAAAATGATTGCGTTTGGTGTGAATGGCATCCTTCAACCTCATGGCCTCGGTCACTTGTTGGGTCTAGATGTGCATGATGTAGGGGGTTACCTCAAGCACTGCCCTCCCAGACCCAGCGGGCCCCTTGGAAGACTAAGAACTGCTCGGATCTTGGAAGCCGGCATGATCCTCACTATTGAACCCGGATGTTACTTCATACCAAAGTTGTTGGATGCAGCTAAACGTACCCAGAAACTAGCGCAGTTCTTTAACTGGGATGTAATGGATAGATTCAGAGGCTTTGGCGGAGTTCGCATAGAAGACGACGTGCTCATCACAGACAAGGGCGTCGAAAATCTCACATTCGTGCCAAGAACTGTTGCGGAAATAGAAGAGTTCATGGCCAATGGCGCAAACTTCAAGTAA

Protein sequence:

>DPOGS206688-PA
MAGVWSMGPGTYEVPLSLFAKNRDRLAEKLKSGQVVVLQGGDDINLYDTDIQYVFRQEAYFTWACGVREPGCYFALDVKTKKSIVFVPRLPDEYEIWMGKLLSCQDYTNMYGVDEVRYVDEICDVLKSLEPDTLLTLVMDNETLFPIIAELRVIKTPEEIEVMRYICKVSSDAHKQESAPSNSEKMSTGFASEEKSPETLATTLDLWKWILPKRLHISKRRFLESAVMLYAKPGLLEYQCESVFLDHCYRVGGCRHVSYTCICGSGDNSAILHYGHAAAPNNKMLKDGDICLFDMGGNYAGYAADITCSFPANGKFTEDQKLIYEAVLAARDAVIRQGKPGVKWTDMHLAANRAMLEHLKRGGLLKGEVEKMIAFGVNGILQPHGLGHLLGLDVHDVGGYLKHCPPRPSGPLGRLRTARILEAGMILTIEPGCYFIPKLLDAAKRTQKLAQFFNWDVMDRFRGFGGVRIEDDVLITDKGVENLTFVPRTVAEIEEFMANGANFK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: