MonarchBase - Protein-coding gene

DPOGS208592
Transcript	DPOGS208592-TA	2574 bp
Protein	DPOGS208592-PA	857 aa
Genomic position	DPSCF300052 - 571518-588497
RNAseq coverage	701x (Rank: top 18%)

Annotation
*Heliconius*	HMEL016586	6e-108	67.34%
*Bombyx*	BGIBMGA005717-TA	0.0	77.24%
*Drosophila*	CRMP-PE	7e-145	59.39%
EBI UniRef50	UniRef50_Q8IPQ2	1e-142	59.39%	Collapsin response mediator protein n=21 Tax=Bilateria RepID=Q8IPQ2_DROME
NCBI RefSeq	XP_973416.2	1e-159	61.56%	PREDICTED: similar to dihydropyrimidinase [Tribolium castaneum]
NCBI nr blastp	gi\|380014889	3e-165	65.33%	PREDICTED: dihydropyrimidinase-like [Apis florea]
NCBI nr blastx	gi\|380014889	2e-160	65.33%	PREDICTED: dihydropyrimidinase-like [Apis florea]

Group
Gene Ontology	GO:0016812	3.8e-151	hydrolase activity, acting on carbon-nitrogen (but not peptide) bonds, in cyclic amides
	GO:0005737	3.8e-151	cytoplasm
	GO:0006208	3.8e-151	pyrimidine base catabolic process
	GO:0016810	3.7e-38	hydrolase activity, acting on carbon-nitrogen (but not peptide) bonds
	GO:0016787	3.6e-17	hydrolase activity
KEGG pathway	tca:662209	4e-159
	K01464 (E3.5.2.2, DPYS)	maps->	Pantothenate and CoA biosynthesis
			Drug metabolism - other enzymes
			Pyrimidine metabolism
			beta-Alanine metabolism
InterPro domain	[18-429] IPR011778	3.8e-151	Hydantoinase/dihydropyrimidinase
	[17-721] IPR011059	3.7e-38	Metal-dependent hydrolase, composite domain
	[66-414] IPR006680	3.6e-17	Amidohydrolase 1
Orthology group	MCL10338		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208592-TA
ATGGCCTCACAATCAGTATCCGGTATTAATATTAAAAGCTCTCAAAACCGTCTCCTCATCAAAAATGGCTGTATCGTGAATGCTGATGGGATGGAAGACGCTGATGTTTACATCGAAGATGGTGTCATCAAGCAAGTGGGTAGGAATTTAATAATTCCTGGTGGGACTCGCACCATAGACGCCACCGGCAAGCTGGTCATGCCTGGTGGTATCGATCCCCATACACACTTCGAGTTAGAGATGATGGGCGCCAAGACCGCTGACGACTTCTATAAAGGCACGCGAGCGGCCGTGGCTGGTGGCACCACCACTATCATTGACTTTGTGCTGCCTCAGAAAGGACAGTCGTTGATAGAAGCCTACGGGAATTGGAGGCAGAAGGCTGACAATAAGGCGTGTTGCGATTACGCCTTGCACGTGGGTGTGACTTGGTGGTCAGCTTCCGTTAAGAAGGAGATCTCCCAGTTGGTGCACGATCACGGCGTGAACTCCTTCAAGATGTTCATGGCGTACAAAGACGTTTGGATGCTGGATGACTATAACATGTGCCTGGCGATGGAGGCGTGCGCCGAGCTGAAGGCACTACCCATGGTGCACGCGGAAAATGGTGGGATTATAGCACGTAACTCGGAAAAGTTGCTGGAAGCTGGGGTCAAAGGTCCCGAGGGTCATGCAGCGTCCAGAGACGACCAGGTCGAGGCCGAGGCCGTCAACCGCGCCTGTGTCATCGCTAACCAGATGGACGCTCCGCTGTATATAGTACACATGATGTCTGCCGCCGCCGTGCAGTCACTGCGTAACGCGCGTCGCGTCGCCAAACATCCAATATTCGGTGAAACTTTGGCCGCGACGGTTGGCACTGATGGTTCGCACTACAAGAACGCGTGTTTCCGCCACGCCGCCGCCCACGTCCTCTCCCCGCCACTCCGCGACCCCAGCACACCGGAAGCCATCATCGACGCCCTCGCACAGTCGCTGCTGGTCCAAGTGATAGCCAGCGACAACTGCACCTTCAATGAAAAAGATAAGGAATTGGGGAAAAACGACTTCACCAAGATACCTAACGGCGTGAACGGGGTCGAGGACCGCATGGCTATACTGTGGCAGAAAGCGGTCAACACTGGTGTCATGGACCCTTGTCGTTTCGTGGCCGTGACTAGTACCAACGCTGCGAATATCTTCAACCTACCATCCAAGGGCCGCGTGGCGGTGGGCGCGGACGGTGACGTCATCGTTTGGGACCCTCGCCTCGAGAAGACCATTTCCGCCGCGACCCACCACCACGCCGTGCACGCGGAAAATGGTGGGATTATAGCACGTAACTCGGAAAAGTTGCTGGAAGCTGGGGTCAAAGGTCCCGAGGGTCATGCAGCGTCCAGAGACGACCAGGTGGAGGCCGAAGCCGTCAACCGCGCCTGTGTCATCGCTAACCAGATGGACGCTCCGCTGTATATAGTACACATGATGTCTGCCGCCGCCGTGCAGTCACTGCGTAACGCGCGTCGCGTCGCCAAACATCCAATATTCGGTGAAACTTTGGCCGCGACGGTTGGCACTGATGGCCAGGCAATGTTGGTCTCATTAGTGTATAACCCGCCAGGTTCGCACTACAAGAACGCGTGTTTCCGCCACGCCGCCGCCCACGTCCTCTCCCCGCCACTCCGCGACCCCAGCACACCGGAAGCCATCATCGACGCCCTCGCACACGACGACCTCCAAGTGATAGCCAGCGACAACTGCACCTTCAATGAAAAAGATAAGGAATTGGGGAAAAACGACTTCACCAAGATACCTAACGGCGTGAACGGGGTCGAGGACCGCATGGCTATACTGTGGCAGAAAGCGGTCAACACTGGTGTCATGGACCCTTGTCGTTTCGTGGCCGTGACGAGTACCAACGCTGCGAATATCTTCAACCTACCGTCCAAGGGCCGCGTGGCGGTGGGCGCGGACGGTGACGTCATCGTTTGGGACCCTCGCCTCGAGAAGACCATTTCCGCCGCGACCCACCACCACGCCGTAGATTTTAATATATTTGAGGGTCAGCGCGTGGTCGGTGGACCTCAATACGTTATTGTGAACGGTCGAGTGTGTCTCGATGACGGTGACCTTAGGGTCGCTGAAGGTTACGGTAAATTCTTACCCACACCACCAAATTCTCCGTACGTGTACGGTGAAGTACCCACCACGCCGCAACCGGAAAGGGTTGAATACTTGCCCTCACCCGCCAGGGTCACTAACGGGACTCCCACAGAACTGCAGATATCTCACAAACTAGAAGCTACTTCCGTATCCGGCTGCAGCACGCCCACCGGCCGGAAGATGAGGGAGCCCGGACAGAGAAACCTTCAGAATTCCACCTTCTCCATCAGCCAACTGCAGATATCTCACAAACTAGAAGCTACTTCCGTATCCGGCTGCAGCACGCCCACCGGCCGGAAGATGAGGGAGCCCGGACAGAGAAACCTTCAGAATTCCACCTTCTCCATCAGCCAGGAAATGGAGGGACTCGACACGAAGACGTCAGTGCGCGTACGGAACCCACCCGGCGGGAAGTCATCCGGTTTGTGGTAA

Protein sequence:

>DPOGS208592-PA
MASQSVSGINIKSSQNRLLIKNGCIVNADGMEDADVYIEDGVIKQVGRNLIIPGGTRTIDATGKLVMPGGIDPHTHFELEMMGAKTADDFYKGTRAAVAGGTTTIIDFVLPQKGQSLIEAYGNWRQKADNKACCDYALHVGVTWWSASVKKEISQLVHDHGVNSFKMFMAYKDVWMLDDYNMCLAMEACAELKALPMVHAENGGIIARNSEKLLEAGVKGPEGHAASRDDQVEAEAVNRACVIANQMDAPLYIVHMMSAAAVQSLRNARRVAKHPIFGETLAATVGTDGSHYKNACFRHAAAHVLSPPLRDPSTPEAIIDALAQSLLVQVIASDNCTFNEKDKELGKNDFTKIPNGVNGVEDRMAILWQKAVNTGVMDPCRFVAVTSTNAANIFNLPSKGRVAVGADGDVIVWDPRLEKTISAATHHHAVHAENGGIIARNSEKLLEAGVKGPEGHAASRDDQVEAEAVNRACVIANQMDAPLYIVHMMSAAAVQSLRNARRVAKHPIFGETLAATVGTDGQAMLVSLVYNPPGSHYKNACFRHAAAHVLSPPLRDPSTPEAIIDALAHDDLQVIASDNCTFNEKDKELGKNDFTKIPNGVNGVEDRMAILWQKAVNTGVMDPCRFVAVTSTNAANIFNLPSKGRVAVGADGDVIVWDPRLEKTISAATHHHAVDFNIFEGQRVVGGPQYVIVNGRVCLDDGDLRVAEGYGKFLPTPPNSPYVYGEVPTTPQPERVEYLPSPARVTNGTPTELQISHKLEATSVSGCSTPTGRKMREPGQRNLQNSTFSISQLQISHKLEATSVSGCSTPTGRKMREPGQRNLQNSTFSISQEMEGLDTKTSVRVRNPPGGKSSGLW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: