MonarchBase - Protein-coding gene

DPOGS208845
Transcript	DPOGS208845-TA	2577 bp
Protein	DPOGS208845-PA	858 aa
Genomic position	DPSCF300036 + 888832-902739
RNAseq coverage	265x (Rank: top 40%)

Annotation
*Heliconius*	HMEL015416	2e-153	70.45%
*Bombyx*	BGIBMGA007951-TA	3e-144	58.67%
*Drosophila*	CG2543-PA	2e-80	38.38%
EBI UniRef50	UniRef50_C3ZPE3	2e-93	42.14%	Folylpolyglutamate synthase (Fragment) n=2 Tax=Bilateria RepID=C3ZPE3_BRAFL
NCBI RefSeq	XP_001180391.1	3e-91	46.67%	PREDICTED: similar to Folylpolyglutamate synthase [Strongylocentrotus purpuratus]
NCBI nr blastp	gi\|47087409	3e-97	42.43%	folylpolyglutamate synthase, mitochondrial [Danio rerio]
NCBI nr blastx	gi\|47087409	7e-93	42.52%	folylpolyglutamate synthase, mitochondrial [Danio rerio]

Group
Gene Ontology	GO:0004326	2.1e-142	tetrahydrofolylpolyglutamate synthase activity
	GO:0005524	2.1e-142	ATP binding
	GO:0009396	2.1e-142	folic acid-containing compound biosynthetic process
	GO:0009058	3.2e-73	biosynthetic process
	GO:0035434	1.8e-26	copper ion transmembrane transport
	GO:0016021	1.8e-26	integral to membrane
	GO:0005375	1.8e-26	copper ion transmembrane transporter activity
	GO:0016874	2.4e-13	ligase activity
KEGG pathway	dre:406746	5e-98
	K01930 (E6.3.2.17)	maps->	Folate biosynthesis
InterPro domain	[25-479] IPR001645	2.1e-142	Folylpolyglutamate synthetase
	[59-341] IPR013221	3.2e-73	Mur ligase, central
	[484-627] IPR007274	1.8e-26	Ctr copper transporter
	[342-480] IPR004101	2.4e-13	Mur ligase, C-terminal
Orthology group	MCL13777		Single-copy universal gene

Nucleotide sequence:

>DPOGS208845-TA
ATGCTAAGCATTGGGATTGCTCGTGTTATAGTAGTAAATAGAGTATTCAGTTTGAGGATGACTTCCACCAAGATGTCCTATGAGGATGCTGTTCAGAAGTTAAACTTGCTTCAGTCTAATAAATCCACTATTGACCAAATTCGAAAAGGCCTTAGAAATGGTGAAAAATGTAATAACCTAAAAGATATGGAAAACTATTTATCACGAACAGGAGTCACCATGTCTATGTTAGACACTCTGTCTGTCATACATGTGGCAGGCACCAAGGGCAAGGGTTCAACTAGTGCCATGTGTGACTCTATACTACGTTCATATGGATTCCGTACTGGTTTTTACTCATCTCCACATCTTGTAGCTGTCAGGGAGAGAATACAACTTGAGGGACAAATACTTTCCAAAGAAAAATTTGCTTATTACTTTCACCAGGTGTATGGATCTCTCTCGGCTACACAGGCTTTTGAAGGTGATATGCCCAAATATTTTAGTTTCTTAACAGTTTTGGCCTTCAATGTATTTCTGAAAGAGAAAGTAGATGTAGCTATTATTGAAGTGGGTATTGGTGGTGTAGTTGATTATACTAATGTTTTAAGAAAGGTTCCAGTTGTGGGTATAACTCCATTGGGCTTGGATCATACATCAATACTAGGTAATACATTGCCCGAGATTGCAGCTGCAAAGGCTGGAATAATGAAACCTGGCTGTGAAGCATATACCGTCCACCAAGCCCCAGAGGCGATGGATGTCTTAGAAAAAGTTGCAAAAGACGTTAAGTGTTCTCTAAATATAGTTCCTGAACTTAGTTCTTATAAATATGAAAACGGGCTCAAGCTCTCCATATATTTAGAAGCCTATGCAATGAATGCCTCTCTTGCCATACAACTTTCACATGCTTGGATACGAAGAACAAGGGGAAGCATAAAACCAATGGTGCCAAGGAATGGTACTTGCAAAATAGATGATCATATCTTGGTTGACGTCTTAACAAAAGAAACTGTAAAAGGTTTAAAAGAATTTAGATGGCCTGGCCGGTACCAGATTGTTAAGACAGATTATGCCGAGTTTTATTTGGATGGAGCACACACAAAGGAGTCAATGGATATCTGTGCAAAATGGTTCACAGATAGCAACAGATCTTCTGCTCAAGCACTGATCTTCAGCGCAACCGGTGATCGTGATTCAAAAGTTTTATTAGAATCACTGAGAGATATAGATTTTCATAAAGTATATTTTGTTATACCCAGTTCCTACAAAAAGTTGAGCAAAAATAATGACAATTTTTATATGATGGAACACAAAGATCTTCTAACGAGATGTAAGAGTCAAGCCTCTATATGGAAGAACATTAATGGAAACTCTATAGTGAATGTATATGAATGTGTCGCTGATGCATTAGAAAGTATAAAGGAAATTAAAGCCGACAGTTCCGTTCTTGTTACTGCTGAAGTCATGATGCACATGTGGATGTGGTTTGGCTATGACCTGGGCGACTTCCTGTTTTCTGGTCTGGTCGTCAACACGAGGTGGTCGTTCGCTCTCACCTGGATAGTGCTGTTTTTCGTGGCTCTGCTCTTCGAGGGATCGAAGGTATATCTCGCTCGTGTTCAGCGCGAGGCACTTCGGAAATTGCGTCCTCACGGCTCTGACGAAAGACGGAACTTGTTATGTGAGCGCGATCGAGAGCAAGCGAACGCCATGGAAGCGACGACCAGTCGCAACACAAGCTCGGGGCAAGTCAGCAAGACCCTGGTGAACGGTCATCAGACCCTGGTGTTCGTCGTCCATAACGTGGTGGGGTACCTGCTGATGTTGGCCGTCATGATCTACAACGTTCACCTCATGCTGGCCGTGGTCTTCGGCATGATGTTGGGTTACTTCCTGTTCGGGACCAAGTTAACTCGCCTCCAGATGCAATGCTTCAGCACCAAGCGCGTCGTCATCTGTACGCCGGAATGCGACGACACTGACCGCTGCAACACGGAGAAGTGCAGCTGGGAGGTGTGCGAGGGCAAGCTCTGCAAGGAAATGGACGCGCTAGAACTCCAACAGGCAGACACCGCGTACACACGAAAGTACACGCCCACTACCATGTTATATGTAGGAACTGAAAACTCAACGCCTCCGCTACTAAACACTTCCATGGATTCCCAGTCGTCTGACATATTTGTTTGTCAAACTCGTACCTGTATACAGCCCTCTCACTACTTTCCCGCCAATACCCAAGATGGCGGCGAACACAGCAACGCCAGCTGTTACTATGGCGCCAAACGATGTCCGTCTAAGGTTGCCAAGTTTAAAAAGATGCAGTCCGGTGTCCATTGTCACCACGACAGCGAAAAGGAAGACAGTCCTAGCGTCGAGGATGCGCAACTTCTTCATAGTGAGCGGCGCGGCTGTTGCAAGAAATTAGAACCTCCTCCAGAAGAACAACGCTGCAAATCTAGTCAAAACACGACAGTCGTCATCCACGAAGAGAGCCATTCGGAGGACGCCGACACCCAAAGCAGAGAGAACAGTCCTCAGATCTCGTGCTGTCACTCCAAGTCGACGCGGGACAGCCAAGAGCAGATAGTCACGTGA

Protein sequence:

>DPOGS208845-PA
MLSIGIARVIVVNRVFSLRMTSTKMSYEDAVQKLNLLQSNKSTIDQIRKGLRNGEKCNNLKDMENYLSRTGVTMSMLDTLSVIHVAGTKGKGSTSAMCDSILRSYGFRTGFYSSPHLVAVRERIQLEGQILSKEKFAYYFHQVYGSLSATQAFEGDMPKYFSFLTVLAFNVFLKEKVDVAIIEVGIGGVVDYTNVLRKVPVVGITPLGLDHTSILGNTLPEIAAAKAGIMKPGCEAYTVHQAPEAMDVLEKVAKDVKCSLNIVPELSSYKYENGLKLSIYLEAYAMNASLAIQLSHAWIRRTRGSIKPMVPRNGTCKIDDHILVDVLTKETVKGLKEFRWPGRYQIVKTDYAEFYLDGAHTKESMDICAKWFTDSNRSSAQALIFSATGDRDSKVLLESLRDIDFHKVYFVIPSSYKKLSKNNDNFYMMEHKDLLTRCKSQASIWKNINGNSIVNVYECVADALESIKEIKADSSVLVTAEVMMHMWMWFGYDLGDFLFSGLVVNTRWSFALTWIVLFFVALLFEGSKVYLARVQREALRKLRPHGSDERRNLLCERDREQANAMEATTSRNTSSGQVSKTLVNGHQTLVFVVHNVVGYLLMLAVMIYNVHLMLAVVFGMMLGYFLFGTKLTRLQMQCFSTKRVVICTPECDDTDRCNTEKCSWEVCEGKLCKEMDALELQQADTAYTRKYTPTTMLYVGTENSTPPLLNTSMDSQSSDIFVCQTRTCIQPSHYFPANTQDGGEHSNASCYYGAKRCPSKVAKFKKMQSGVHCHHDSEKEDSPSVEDAQLLHSERRGCCKKLEPPPEEQRCKSSQNTTVVIHEESHSEDADTQSRENSPQISCCHSKSTRDSQEQIVT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: