MonarchBase - Protein-coding gene

DPOGS207953
Transcript	DPOGS207953-TA	2811 bp
Protein	DPOGS207953-PA	936 aa
Genomic position	DPSCF300090 - 90689-96135
RNAseq coverage	257x (Rank: top 41%)

Annotation
*Heliconius*	HMEL014327	92.95%
*Bombyx*	BGIBMGA000391-TA	91.03%
*Drosophila*	CG3999-PA	71.22%
EBI UniRef50	UniRef50_P23378	64.67%	Glycine dehydrogenase [decarboxylating], mitochondrial n=133 Tax=root RepID=GCSP_HUMAN
NCBI RefSeq	XP_970082.1	74.41%	PREDICTED: similar to CG3999 CG3999-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91092464	74.41%	PREDICTED: similar to CG3999 CG3999-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91092464	74.41%	PREDICTED: similar to CG3999 CG3999-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0006544	0	glycine metabolic process
	GO:0055114	3.5e-173	oxidation-reduction process
	GO:0004375	3.5e-173	glycine dehydrogenase (decarboxylating) activity
	GO:0003824	2.2e-26	catalytic activity
	GO:0030170	2.2e-26	pyridoxal phosphate binding
KEGG pathway	tca:658613	0.0
	K00281 (GLDC, gcvP)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[1-932] IPR020581	0	Glycine cleavage system P protein
	[1-929] IPR003437	0	Glycine cleavage system P protein, homodimeric
	[1-414] IPR020580	3.5e-173	Glycine cleavage system P-protein, N-terminal
	[454-931] IPR015424	8e-96	Pyridoxal phosphate-dependent transferase, major domain
	[476-708] IPR015421	2.2e-26	Pyridoxal phosphate-dependent transferase, major region, subdomain 1
Orthology group	MCL11146		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207953-TA
ATGCTGGATCTCTTAGGTTATAAGAGTTTAGACCAACTAACTAATGATGCTGTGCCTAAGAAAATCCAGTTAGAAGGTCTTATGAACATCACAGAACCAATGAGCGAATATGATCTTATTAAAAGAATTCGCAAAATAGCAGAAACAAATCAAATATGGCGTTCCTATATTGGTATGGGATATCATAATTGCTGTGTGCCGCATTCCATAATGAGAAACATGTTTGAGAACCCTGGATGGACTACACAGTACACTCCTTATCAACCCGAAGTGGCTCAAGGACGGCTAGAAGGTTTATTAAACTATCAAACAATGGTCAGTGATCTAACAGGGTTAGACGTTGCTAACGCGTCTCTCCTAGATGAAGGAACTGCTGCAGCTGAGGCTTTGTCTTTGTGTCATAGACACAATAGGAGGACAAAATTTGTAGTATCAGAACGATTGCATCCGCAAACTTTAGCTGTTGTTCAAACTCGGTTAGATGCGTTGGGCCTAGAAGTTATGGTAGTACCTGATGTTAGACAAGCAGACTTCGCACAACGAGACATATCTGCTGTATTATTACAATGTCCAGACACAAGAGGATTGGTTTATGATTACTCAGGCCTTGCTGCAGCTGCACAAGAACATGGGACTTTGGTGGTCGTTGCGACTGATCTTCTAGCTATGGCACTTTTACGCCCCCCCGCAGAGTGTGGTGCTGCTTTAGCAGTTGGTACTTCACAGAGGTTAGGTGTTCCTCTTGGATATGGTGGACCTCATGCCGGATTTTTCGCAGCTGAACATGCGTTAGTTCGTTTGATGCCAGGTCGCATGGTTGGCGTGACTCGGGACGCGGCTGGAAGAGATGCTTACAGACTAGCTCTCCAGACAAGGGAACAGCATATCCGGAGAGACAAAGCCACGTCAAATATATGTACAGCTCAGGCTCTTTTAGCAAATATGTCAGCCATGTTCGCTGTTTATCACGGGCCACAAGGTCTGAGGGACATTGCGGTGCGAGTTCATAACGCTACTCTGGTTCTTGATGACGGAATTCAAAAACGTGGTCATAGGCAGTTGAACGACGTATATTTTGACACACTCTACATCATTCCAAGTGCGGATCATGATGCTACTGCTATAAAGGCAAGAGCTCAAGAAAAGAAAATTAATTTGCGATATTTTGATGATGGAGCTGTCGGAGTAGCATTAGACGAAACCACTACAATGGAAGACGTTGATGATTTGCTCTGGGTATTTGACTGCGAGAGGGTTGCTGAGGTGATGAAGAGTGGTGATGTCAAGTCAAGAAGTATCTTAAAGGGTCCGTTCAGAAGAACTTCTCCATACTTAACACATCCTGTGTTTAATATGCATCACTCTGAAACAAGAATAGTAAGGTATATGAAGAGACTGGAAAATAAGGATATATCATTGGTTCACTCTATGATTCCTCTCGGTTCCTGTACAATGAAGTTAAATTCTACAACCGAAATGATGCCATGTTCATTTAAACATTTTACTGACATCCATCCATTTGCACCTCTTGAGCAATGCCAGGGCTACCATACACTTTTTGAAGAGCTTGCTAAGGATTTGTGTGCTATCACAGGTTACGATCGTGTATCTTTCCAACCGAACAGTGGAGCTCAAGGCGAATACGCTGGTCTTAGAACAATCAAACGCTACCATGAATTCCGAGGTGACACAGGGCGTAACATATGTTTAATACCAGTTAGTGCTCATGGTACAAATCCAGCCTCGGCACACATGGCCGGCATGAGGGTCTGTGCAATCCGCGTCACACCCACTGGAGATATTGATATGGCACACCTTAAAGATATGGTGGAAGAACATAGTGAAAAATTATCATGTCTGATGTTAACTTATCCGAGTACATTCGGTGTGTTTGAGGAACGCACAGCCGACGTGTGCTCGCTCGTTCACCAACATGGGGGACAGGTCTATTTGGATGGTGCTAACATGAATGCACAGGTTGGACTTTGTAGGCCAGGAGACTATGGCAGTGATGTATCCCATTTGAATTTACATAAAACTTTCTGTATACCACACGGCGGAGGCGGCCCAGGAATGGGTCCAATAGGAGTAAAAGCTCATCTTGCTCCATTTTTACCGTCACATCCCGTGGTGAATCCGTTAGCTGACTTGGGTGAAGATGCCCATAGTTTTGGCTCCGTCAGTGCAGCGCCATTTGGTTCATCTGCAATATTACCAATATCATGGGCTTACATTAAGATGATGGGCCCTAAAGGCTTAAAGAGGGCGACTCAGGTGGCTATTCTTAATGCTAATTATATGTCGCGAAGATTAGATGGTCATTATAAAACTTTGTACAAAGGTGAAAGAGGACTTGTCGCACATGAATTTATTATAGATGTCCGAGATATGAAAAAAACTGCTAATATTGAACCCGGAGATATTGCAAAACGTCTTATGGACTTCGGTTTTCACGCACCTACAATATCTTGGCCGGTGGCTGGCACCCTTATGATTGAACCTACCGAATCTGAAGACTTACAAGAGTTGGATCGCTTCTGTGAAGCCCTTATTGCTATTAGAAAAGAAATTAAAGATATTGAAGATGGTCTTATTGATAAAAGATTGAATCCTGTAAAGATGGCGCCACACACACAAGAAGAAGTGATTACGGAAGATTGGAGTCGCCCTTACACAAGAGAACAAGCCGCTTTTCCTGCGCCATTTGTAAAGGGAGAAACAAAGATTTGGCCTACGGTTAGTCGCATCGACGATATGTACGGCGACAAACATCTTGTTTGCACGTGTCCTCCGGTAATCGATGACTTCTAA

Protein sequence:

>DPOGS207953-PA
MLDLLGYKSLDQLTNDAVPKKIQLEGLMNITEPMSEYDLIKRIRKIAETNQIWRSYIGMGYHNCCVPHSIMRNMFENPGWTTQYTPYQPEVAQGRLEGLLNYQTMVSDLTGLDVANASLLDEGTAAAEALSLCHRHNRRTKFVVSERLHPQTLAVVQTRLDALGLEVMVVPDVRQADFAQRDISAVLLQCPDTRGLVYDYSGLAAAAQEHGTLVVVATDLLAMALLRPPAECGAALAVGTSQRLGVPLGYGGPHAGFFAAEHALVRLMPGRMVGVTRDAAGRDAYRLALQTREQHIRRDKATSNICTAQALLANMSAMFAVYHGPQGLRDIAVRVHNATLVLDDGIQKRGHRQLNDVYFDTLYIIPSADHDATAIKARAQEKKINLRYFDDGAVGVALDETTTMEDVDDLLWVFDCERVAEVMKSGDVKSRSILKGPFRRTSPYLTHPVFNMHHSETRIVRYMKRLENKDISLVHSMIPLGSCTMKLNSTTEMMPCSFKHFTDIHPFAPLEQCQGYHTLFEELAKDLCAITGYDRVSFQPNSGAQGEYAGLRTIKRYHEFRGDTGRNICLIPVSAHGTNPASAHMAGMRVCAIRVTPTGDIDMAHLKDMVEEHSEKLSCLMLTYPSTFGVFEERTADVCSLVHQHGGQVYLDGANMNAQVGLCRPGDYGSDVSHLNLHKTFCIPHGGGGPGMGPIGVKAHLAPFLPSHPVVNPLADLGEDAHSFGSVSAAPFGSSAILPISWAYIKMMGPKGLKRATQVAILNANYMSRRLDGHYKTLYKGERGLVAHEFIIDVRDMKKTANIEPGDIAKRLMDFGFHAPTISWPVAGTLMIEPTESEDLQELDRFCEALIAIRKEIKDIEDGLIDKRLNPVKMAPHTQEEVITEDWSRPYTREQAAFPAPFVKGETKIWPTVSRIDDMYGDKHLVCTCPPVIDDF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: