MonarchBase - Protein-coding gene

DPOGS209337
Transcript	DPOGS209337-TA	1209 bp
Protein	DPOGS209337-PA	402 aa
Genomic position	DPSCF300194 + 188891-191057
RNAseq coverage	35x (Rank: top 74%)

Annotation
*Heliconius*	HMEL003098	6e-145	62.37%
*Bombyx*	BGIBMGA004251-TA	2e-62	40.11%
*Drosophila*	Odc1-PA	4e-64	37.03%
EBI UniRef50	UniRef50_B0WNL1	1e-68	41.60%	Ornithine decarboxylase n=5 Tax=Culicidae RepID=B0WNL1_CULQU
NCBI RefSeq	XP_968571.2	1e-75	39.95%	PREDICTED: similar to ornithine decarboxylase [Tribolium castaneum]
NCBI nr blastp	gi\|270010871	2e-74	39.95%	hypothetical protein TcasGA2_TC015912 [Tribolium castaneum]
NCBI nr blastx	gi\|189239038	4e-73	39.95%	PREDICTED: similar to ornithine decarboxylase [Tribolium castaneum]

Group
Gene Ontology	GO:0003824	2.7e-57	catalytic activity
	GO:0006596	6.7e-23	polyamine biosynthetic process
KEGG pathway	tca:656985	4e-75
	K01581 (E4.1.1.17, ODC1, speC, speF)	maps->	Glutathione metabolism
			Arginine and proline metabolism
InterPro domain	[8-234] IPR022644	2.7e-57	Orn/DAP/Arg decarboxylase 2, N-terminal
	[221-356] IPR009006	3.3e-34	Alanine racemase/group IV decarboxylase, C-terminal
	[23-41] IPR000183	2.8e-23	Ornithine/DAP/Arg decarboxylase
	[21-48] IPR002433	6.7e-23	Ornithine decarboxylase
	[239-349] IPR022643	3.2e-18	Orn/DAP/Arg decarboxylase 2, C-terminal
Orthology group	MCL23341		Lepidoptera specific

Nucleotide sequence:

>DPOGS209337-TA
ATGGACAAGGCTTACCAGTTCATACAGCATTTCAGAAAAATGATGCCAAGGATCAAAATGTTTTATGGTGCCGTGAAATCGAACGATAGTTGCATGATGTTAAAGTTAGCCGCTGCACTCGGTGTTGGCTTCGATTGTGCTTCACCGGGTGAAATATATAGAATATTAAAACTCAAAGTATCGCCACAGAGCATAATTTTAGCAGTTCCGACAAAAACACCGGAGTGGATCTCATATGCAAGACAGTCCGGGATTAAACACGCTACTTTCGACAACATTTGCGAACTAAAAAAAATAAAACAGTATTGGCCAGAGGCAAACTTATTACTGCGTATAAGAGTTCACGCCGACAGTGTTTACGATTTAGGAAAAAAATTCGGTTGCGATTTTGAAACAGAAGCTATTGATTTACTAGAAGAAGCTGCAGCGCTCAATATCCGGGTGGTTGGGGTAGCTTTCCATGTAGGAAGTGGTTGTACATCACCAGACAGCTATGTGATGGGACTTCAACAGGCTAAGCTATTGTTCGAGCATGAGGCTAAGGCGGGGCGGAAAATGGAAATTGTTGATATTGGAGGAGGATATATGAGCGATAAAATCGATAGAATAGACGAGGTGTCTAAGCTCATAAATAAGGCTTTGGATGAACTCTTTCCTGATCCAGATATCCAAGTGATCTCTGAACCAGGACGTTACCTGTGCGATAAAGCATTTACTTTATATTGCAATATTAACACAGTGCGACAGGTACAAGTTGGTGACTCTTCTATAAATATGTTGTATTTGAATGACGGATTGTTTGGTTGTTTGCGGTACAATGAACCGTGGCACACCGTCAGGCGGTATAAGCAATGTAAGGAAGGCGAACAATGTGAACCAGTTATTTTATGGGGTCCATCATGTGACTCAGTGGATCGTGTGATGGAGAACGTTGAAGTTATGTTACCACCTTGTACTGTTGATGATTGGCTCGTTTTCCCCAACCAAGGAGCTTATACCATGACTCTCGCCTCCGATTTTTCTTCGTTACCAGAACCGCGTATCCGAAGTGTTATTTCACAGAAATTGTGTGAAAAAATAAAGGAGTCAGAAGTGTTTGATTCAGATGACTTCTTCAAACAAGACATTTCAGAACCACTTCCATCTAGCTTGCCACCACTTGTCACTCAATCGAAAGTTATGGATTCAAATTATACTTTGAAGGCTTAA

Protein sequence:

>DPOGS209337-PA
MDKAYQFIQHFRKMMPRIKMFYGAVKSNDSCMMLKLAAALGVGFDCASPGEIYRILKLKVSPQSIILAVPTKTPEWISYARQSGIKHATFDNICELKKIKQYWPEANLLLRIRVHADSVYDLGKKFGCDFETEAIDLLEEAAALNIRVVGVAFHVGSGCTSPDSYVMGLQQAKLLFEHEAKAGRKMEIVDIGGGYMSDKIDRIDEVSKLINKALDELFPDPDIQVISEPGRYLCDKAFTLYCNINTVRQVQVGDSSINMLYLNDGLFGCLRYNEPWHTVRRYKQCKEGEQCEPVILWGPSCDSVDRVMENVEVMLPPCTVDDWLVFPNQGAYTMTLASDFSSLPEPRIRSVISQKLCEKIKESEVFDSDDFFKQDISEPLPSSLPPLVTQSKVMDSNYTLKA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: