MonarchBase - Protein-coding gene

DPOGS201074
Transcript	DPOGS201074-TA	1170 bp
Protein	DPOGS201074-PA	389 aa
Genomic position	DPSCF300185 - 198884-200053
RNAseq coverage	16011x (Rank: top 1%)

Annotation
*Heliconius*	HMEL022314	0.0	89.97%
*Bombyx*	BGIBMGA001595-TA	0.0	87.92%
*Drosophila*	pyd3-PA	5e-134	58.07%
EBI UniRef50	UniRef50_Q9UBR1	6e-130	57.81%	Beta-ureidopropionase n=60 Tax=Eukaryota RepID=BUP1_HUMAN
NCBI RefSeq	NP_001165388.1	0.0	87.66%	aliphatic nitrilase [Bombyx mori]
NCBI nr blastp	gi\|284813565	0.0	87.66%	aliphatic nitrilase [Bombyx mori]
NCBI nr blastx	gi\|284813565	0.0	87.66%	aliphatic nitrilase [Bombyx mori]

Group
Gene Ontology	GO:0006807	9.6e-60	nitrogen compound metabolic process
	GO:0016810	9.6e-60	hydrolase activity, acting on carbon-nitrogen (but not peptide) bonds
KEGG pathway	aga:AgaP_AGAP010229	1e-139
	K01431 (E3.5.1.6)	maps->	Pantothenate and CoA biosynthesis
			Drug metabolism - other enzymes
			Pyrimidine metabolism
			beta-Alanine metabolism
InterPro domain	[63-364] IPR003010	9.6e-60	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Orthology group	MCL11063		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201074-TA
ATGGACGGTGAAACACAGAGCCTCGAATCCATCATCAACACGAACCTCGGGGGAAAAGACCTTGAGGAGTTCAACAGAATCTATTACGGAAGAAAAAATCATCATGAGGTAGACCTAAAGGAGTCCTCGATCGCCGCCGCCAAGGACAACGATTTCGAAATCGCTGCTTACGCCTTCCCCGCGAAAAAGGAATCCACACGACCACCGAGGATCGTGAAGGTGGCCGTCATTCAGCACTCCATCGCCGTGCCGACCGACCGGCCCGTCAACGAACAGAAAAATGCCATACTCGCCAAGGTGAAGAAGATCATAGACGTGGCCGGTCAGGAGGGTGTCAACATCTTGTGCTTTCAAGAACTATGGAACATGCCCTTCGCTTTCTGCACCAGGGAGAAGCAGCCGTGGTGCGAGTTTGCGGAGTCCGCGGAGGACGGGCCCACCACACGCTTCCTGCGCGAGCTCTGCATCAAGTACGCGATGGTCATCGTATCATCCATACTGGAACGTGATGAGAAGCACGCCGACATCATATGGAACACGGCGGTCGTGATCAGCGACACCGGCAGTGTGATCGGAAAACACAGGAAGAATCACATCCCCAGGGTAGGCGACTTCAACGAGTCCAACTATTACATGGAGGGTAACACCGGCCACCCGGTGTTTGCGACGCGGTACGGTAAAATAGGCATCAACATCTGCTTTGGACGTCACCACGTCCTGAACTGGATGATGTTCGGGCAGAACGGAGCGGAAATAGTGTTCAACCCATCAGCCACGATCGCCGCTGAGGCCGGCAGCGAGTACATGTGGAACATCGAGGCGAGGAACGCCGCTATAACCAACTGCTACTTCACGGCTGCGATTAACAGGGTCGGATACGAGGAGTTCCCGAATGAGTTCACCTCCGCTGATGGTAAACCGGCCCACAAGGATTTGGGTTTGTTCTACGGGTCCAGCTACTTCTGTGGTCCGGACGGCGTCAGGTGCCCTGGACTGTCGCGTAATAGAGACGGGCTCCTGATAGCGGTCGTGGACCTCAATATGAACAGGCAGATCCGAGATCGGCGCTGTTACTACATGACACAACGCCTGGACATGTACGTGGAGAGCCTCAAGAGAGTCCTGGACCTGGACTTCAAGCCACAGGTCGTCAATGAAACAGAAAAATGA

Protein sequence:

>DPOGS201074-PA
MDGETQSLESIINTNLGGKDLEEFNRIYYGRKNHHEVDLKESSIAAAKDNDFEIAAYAFPAKKESTRPPRIVKVAVIQHSIAVPTDRPVNEQKNAILAKVKKIIDVAGQEGVNILCFQELWNMPFAFCTREKQPWCEFAESAEDGPTTRFLRELCIKYAMVIVSSILERDEKHADIIWNTAVVISDTGSVIGKHRKNHIPRVGDFNESNYYMEGNTGHPVFATRYGKIGINICFGRHHVLNWMMFGQNGAEIVFNPSATIAAEAGSEYMWNIEARNAAITNCYFTAAINRVGYEEFPNEFTSADGKPAHKDLGLFYGSSYFCGPDGVRCPGLSRNRDGLLIAVVDLNMNRQIRDRRCYYMTQRLDMYVESLKRVLDLDFKPQVVNETEK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: