MonarchBase - Protein-coding gene

DPOGS204308
Transcript	DPOGS204308-TA	1875 bp
Protein	DPOGS204308-PA	624 aa
Genomic position	DPSCF300046 + 647312-655387
RNAseq coverage	492x (Rank: top 25%)

Annotation
*Heliconius*	HMEL015155	80.51%
*Bombyx*	BGIBMGA007582-TA	83.23%
*Drosophila*	Gclc-PA	71.60%
EBI UniRef50	UniRef50_P48506	59.39%	Glutamate--cysteine ligase catalytic subunit n=86 Tax=Eukaryota RepID=GSH1_HUMAN
NCBI RefSeq	XP_966349.1	69.81%	PREDICTED: similar to glutamate cysteine ligase isoform 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91093659	69.81%	PREDICTED: similar to glutamate cysteine ligase isoform 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91093659	69.81%	PREDICTED: similar to glutamate cysteine ligase isoform 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0004357	3.8e-171	glutamate-cysteine ligase activity
	GO:0006750	3.8e-171	glutathione biosynthetic process
KEGG pathway	tca:656567	0.0
	K11204 (GCLC)	maps->	Glutathione metabolism
InterPro domain	[2-622] IPR004308	0	Glutamate-cysteine ligase catalytic subunit
Orthology group	MCL11255		Single-copy universal gene

Nucleotide sequence:

>DPOGS204308-TA
ATGGGTTTATTGACGGAAGGTAGCCCTCTTTCTTGGGAAGAAACCAAAGCATTGGCGGAACATGTGCGTCGACATGGTGTTGAACAGTTTATTAATCTCTACAGCAAGCTTAGAGACCGTACTGGAGATGTTCTCAAGTGGGGTGATGAGGTGGAGTATATTATAGTTAAATTTGATGATGTTAATCAGCGAGCCACTGTAAGTCTAAGAGCTGAGGAGGTTCTGCCTAAACTGCAAGAAAAAGAATTGAAAGATCCTCAAAATGTAAAAAGTCTCTGGCGGCCAGAATACGGAGCTTATATGATTGAAGGTACTCCAGGGAAGCCCTACGGAGGGCTGCTGGCCCATTTCAACATAGTTGAAGCAAATATGCGCTATCGTAGGGCCGAAGCAAGTGCACTTTTAAAAGACGGTGAAGTCATTATGAGTATTACGAATTTTCCTAGATTAGGCAGTCCAAACTTTACATCTCCACCATACAAACCAACTCCAGACAGGGGTGTGTCATTATCATACTTCTTTCCTGATCAGGCAACATTCCCTGGACACCCACGTTATAAGACACTGGCCGAAAACATTCGGAAGAGAAGAGGAAATAGAATGGCCATAAATATTCCAGTTTTCCGCGATGTGAACACTAAGATTCCTATCGACGATTACCACAAGATACTGCCAGATTTGGCCAAACCAGACTCCGTGTATTTGGATGCTATGGGTTTGGGTATGGGGTGCTGCTGTCTTCAGGTCACATTCCAGGCTTGTTGTATAACTGAAGCTCGCACATTGTACGATCAACTTGCCCCTTTATGTCCAATCATGCTAGCGTTGTCTGCCGCTTCTCCCGTGTACCGAGGTTACCTGACGGATGTTGACTGCCGCTGGAATGTCGTCTCGGCCTCGGTGGATTGCCGTACTAGAGAGGAGTTGGGCTTAGAGCCGCTGAAGAATGACAAGTTCCGCATACACAAATCACGTTACGACTCCATCGATTCCTACCTATCACCTGAACATGAGAAGTACAACGATATCGAGGTGGTGCACGATCCCGCAGTGTACCGCCGTCTTCGCGAGGGTGGTATAGATCACCCTCTGGCGATCCACGTGGCACATCTCTTCATACGAGACACCGTGTCTCTGTTCAGTGAAAAGGTTCACCAGGATGACGAGAATGATACTGATCATTTTGAAAACATTCAATCTACCAACTGGCAGACCATGCGTTTCAAGCCGCCTCCTCCGAACTCGCCGATCGGTTGGCGCGTCGAGTTCCGTCCATGTGACGCTCAACTCACAGACTTTGAGAACGCCGCCTATGTATGTTTCGTGGTGCTCCTCACGCGCGTCATATTAACATACAACCTCAAATTCGTGATGCCCATCAGTAAGGTGGACGAAAACATGCAACGCGCTCAGCGTCGTGGCGCGTGCGCTTCACAGCGCTTCTGGTGGCGTCGCGACGTACGCTCACAAGACGCCGACACGTATCTGGAGATGACCGTACACGAGATCATTAACGGAAAGGAGGGCGTGTTCCCTGGTCTTATCCCTCTCATAGAGTCCTACCTGTCCGGTATGGACGTAGACGCGGACACTCACTGCTCCGTGCAACAGTACCTGAAGCTGATACAACGCCGCGCCTCCGGAGAAATACTCACCATGGCCTCCTGGATGAGAGAATTCATTGACAAACACCCGCAATACAAAAAAGATTCCATCGTCACCGAAAAGATCAACTACGACCTTCTAAAGACAGCGTACGGTATTCAGTCTGGTACGATCCCAGCTCCCACACTCCTCGGCAGTTCCAATGTGTCCAAGACCAACGACGACATCCCAAAAGCCTTCAGCAAGATGATGAGCAAGGACTGTCCTTAG

Protein sequence:

>DPOGS204308-PA
MGLLTEGSPLSWEETKALAEHVRRHGVEQFINLYSKLRDRTGDVLKWGDEVEYIIVKFDDVNQRATVSLRAEEVLPKLQEKELKDPQNVKSLWRPEYGAYMIEGTPGKPYGGLLAHFNIVEANMRYRRAEASALLKDGEVIMSITNFPRLGSPNFTSPPYKPTPDRGVSLSYFFPDQATFPGHPRYKTLAENIRKRRGNRMAINIPVFRDVNTKIPIDDYHKILPDLAKPDSVYLDAMGLGMGCCCLQVTFQACCITEARTLYDQLAPLCPIMLALSAASPVYRGYLTDVDCRWNVVSASVDCRTREELGLEPLKNDKFRIHKSRYDSIDSYLSPEHEKYNDIEVVHDPAVYRRLREGGIDHPLAIHVAHLFIRDTVSLFSEKVHQDDENDTDHFENIQSTNWQTMRFKPPPPNSPIGWRVEFRPCDAQLTDFENAAYVCFVVLLTRVILTYNLKFVMPISKVDENMQRAQRRGACASQRFWWRRDVRSQDADTYLEMTVHEIINGKEGVFPGLIPLIESYLSGMDVDADTHCSVQQYLKLIQRRASGEILTMASWMREFIDKHPQYKKDSIVTEKINYDLLKTAYGIQSGTIPAPTLLGSSNVSKTNDDIPKAFSKMMSKDCP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: