MonarchBase - Protein-coding gene

DPOGS210836
Transcript	DPOGS210836-TA	2136 bp
Protein	DPOGS210836-PA	711 aa
Genomic position	DPSCF300027 + 40443-49889
RNAseq coverage	519x (Rank: top 24%)

Annotation
*Heliconius*	HMEL009947	0.0	75.17%
*Bombyx*	BGIBMGA003910-TA	0.0	64.20%
*Drosophila*	CG1486-PB	1e-109	34.67%
EBI UniRef50	UniRef50_D6WYJ0	1e-154	43.72%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WYJ0_TRICA
NCBI RefSeq	XP_974004.1	3e-155	43.72%	PREDICTED: similar to CG1486 CG1486-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91089397	5e-154	43.72%	PREDICTED: similar to CG1486 CG1486-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91089397	4e-149	43.51%	PREDICTED: similar to CG1486 CG1486-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0019752	2.1e-78	carboxylic acid metabolic process
	GO:0016831	2.1e-78	carboxy-lyase activity
	GO:0030170	2.1e-78	pyridoxal phosphate binding
	GO:0003824	1.1e-24	catalytic activity
KEGG pathway	ypi:YpsIP31758_2448	4e-10
	K13745 (ddc)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[64-661] IPR002129	2.1e-78	Pyridoxal phosphate-dependent decarboxylase
	[127-386] IPR015421	1.1e-24	Pyridoxal phosphate-dependent transferase, major region, subdomain 1
	[24-507] IPR015424	1.6e-24	Pyridoxal phosphate-dependent transferase, major domain
Orthology group	MCL13438		Single-copy universal gene

Nucleotide sequence:

>DPOGS210836-TA
ATGGGAGATGCCCCGACTTCCGAAATGGACTCAAATAAAGTTAGCCTTGGAAGCGAAAATCCATCCGATGTGGACCGGCGACCGTTTGGAGGACTTGAATTCCAAGTTTCCGAAGTAGTAGAGAGGTTGGAAGCTGGTGTGAATGCTCAAGATGCCATGGAAGAAGAAAAAAAGCCAGAAGAACGAAAAATAAGCACGGGATTCTTCGAGCCAGAAAAAATGGATATGGATGAAATTTTGAAGGTCTTAGAACAACTAGTACTTCAAACTGATCCAAGTTGTGAAAGTTTGGAACCACCCTTATTGCCAACGGATTCTGTGACGCGAGCCGCAATACTTTCTCATAGTATTTCGGCATTATTCTCGAGGTTGGAGAGGAGCCACGCTGCCCGGCTAGGAACGCACATAGCTACTGAAACCACGCGATGGATGGCGCATTTATTTAGGTTGTCCGATTACGACGCGTTTTATCACCAAGAGCAGCTCGAGGGTCTGGTCAGAGTCACTCGGATGCTGTTACACCACAAGTACCCGAGATATCTCGAAGATGGAGCTCTAGCTTTCTCGAACCGTCTCCCCTCCATCTACAGCTGTGTGGCGAGTCCTCTGGGCGTGGTCCAACACCTGTGCCGGCAGCTGGGTCTGCCGCTGGCCTGCGTCAGACCGGTGCCAGTAGATTCATCTGGTAAGGGTATGGATCTGAATGCTCTGGATCGTCTGTGCGAGGAGGACTCGGCTGGTCGTACTCCGCTGCTGGTGTTAGGCGAGGCGGGCGAGCCTCCCCTCGGCGGGGGATCCCCGCTGAAAGCGCTGGCTGAACTATGTGGACGTAGAGGGGTCCACTTACATGTGAGGGGACACGCCCTCGCCCTCCCCGCCGCCGGGGGATTTGAACAGACGTACAGTATAGCGGACTCGCTGACACTACAACCGGGTCCGTGGTTCGGAATACCGGGGCTGCCGACTGTTACGTTTTACAAAATACCGGAACCGCTGACGGCGAACGATCACTCCAAGGTTGTAAATTCGGCGAGTAGTCGCGAGGGTGCTCTGGCCGCACTGGGCGGTCTGACCGCTGGCGCGGCGCGGCTGGCAGCTCTGCCGCTGTGGACGGCGACGAGGGCGGCCGGCGCTAAGAGGCTCGCAAGACGGATAGACGCCGCCTTCCGCTCCGCCCGTACAGCGCGGGCCTTAATAGCCAGCACTGAGCTGAGATTGCTGAGCGATAGACCCGGCGGTGATGAACCTCCTAACATGGATATAGTCGATGCCATAAGTGAATCCTCAGCGTGCGTGTCCTTCCAATTCGCGCCAGCAGGGTGCGCTGACCGGCCACCCCCCTACTACGATAAACTCAACTCGTGGTTGGGGCAAGTGTTGCAACGAGAGGCTGATATGATCAATATAGAAATCTGCGAGACGGAGAGTTACGGCGTGGTGCTCCGCTACTGTCCGCTCGAGGGTATCTTTCTGGAGGAGGACCGTCTGTCGGAGTGGGCGGCCGTGTTAGACGCTCAGCTGCACGTGCTCACCGCTACGGTCGCGCTACGAGAACCCTTCCAGAAGACGCTACAGACACATCCCTGTCTACGACTTGTACATGTACCGGGATGGGCTGGTCTGGGAGGAGTTCGTTACGTGCCACCCGGTTGGGAGAACGCTCCTCTTGAGGAATTGAACTCCTTGAATAGACAGCTAGTGGAGACATTGAGGGCTACCGACGGAGCCTTCTCGTGTGGGGACGGAGAAGACGGTATGGCATGTGTCAGGTTCGGTATGGTCACCGCTGACACAGACGTGGATGAATTGTTGGATCTGGTGTTGTCAGCGGGCAAGGACGTGGAGGAGAACTCCAAGGCTCTCACTGATATGACCGAGGTGTTGAAAAAAGGTATATCAGCGGCTCAAGAAGAACTGAATCGTTCTGCGTGGCAGGAGGGGCTGCTGCGTCGTGTGCCGGTAGTGGGTCGGGTCGTGTCGTGGTGGGCGCCGCCTCAGCCCTGCCCCGGCCGCCGGCTACTGTTGACCCACGGCACCCTGCAGGCGACTGATGATATCTACCGATTCGTTCAGAAGAAAGACAAAGAGGAACCAGCCCGCGCTCACTCCCCAACGAGACAGAACACGGTTCCATAA

Protein sequence:

>DPOGS210836-PA
MGDAPTSEMDSNKVSLGSENPSDVDRRPFGGLEFQVSEVVERLEAGVNAQDAMEEEKKPEERKISTGFFEPEKMDMDEILKVLEQLVLQTDPSCESLEPPLLPTDSVTRAAILSHSISALFSRLERSHAARLGTHIATETTRWMAHLFRLSDYDAFYHQEQLEGLVRVTRMLLHHKYPRYLEDGALAFSNRLPSIYSCVASPLGVVQHLCRQLGLPLACVRPVPVDSSGKGMDLNALDRLCEEDSAGRTPLLVLGEAGEPPLGGGSPLKALAELCGRRGVHLHVRGHALALPAAGGFEQTYSIADSLTLQPGPWFGIPGLPTVTFYKIPEPLTANDHSKVVNSASSREGALAALGGLTAGAARLAALPLWTATRAAGAKRLARRIDAAFRSARTARALIASTELRLLSDRPGGDEPPNMDIVDAISESSACVSFQFAPAGCADRPPPYYDKLNSWLGQVLQREADMINIEICETESYGVVLRYCPLEGIFLEEDRLSEWAAVLDAQLHVLTATVALREPFQKTLQTHPCLRLVHVPGWAGLGGVRYVPPGWENAPLEELNSLNRQLVETLRATDGAFSCGDGEDGMACVRFGMVTADTDVDELLDLVLSAGKDVEENSKALTDMTEVLKKGISAAQEELNRSAWQEGLLRRVPVVGRVVSWWAPPQPCPGRRLLLTHGTLQATDDIYRFVQKKDKEEPARAHSPTRQNTVP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: