MonarchBase - Protein-coding gene

DPOGS211321
Transcript	DPOGS211321-TA	2802 bp
Protein	DPOGS211321-PA	933 aa
Genomic position	DPSCF300125 + 101162-107444
RNAseq coverage	1662x (Rank: top 8%)

Annotation
*Heliconius*	HMEL021318	86.30%
*Bombyx*	BGIBMGA004950-TA	81.53%
*Drosophila*	pug-PD	68.21%
EBI UniRef50	UniRef50_O96553	68.21%	C-1-tetrahydrofolate synthase, cytoplasmic n=537 Tax=root RepID=C1TC_DROME
NCBI RefSeq	XP_002097109.1	68.64%	GE26043 [Drosophila yakuba]
NCBI nr blastp	gi\|41016826	82.93%	methylenetetrahydrofolate dehydrogenase [Spodoptera frugiperda]
NCBI nr blastx	gi\|41016826	82.93%	methylenetetrahydrofolate dehydrogenase [Spodoptera frugiperda]

Group
Gene Ontology	GO:0005524	9e-248	ATP binding
	GO:0004329	9e-248	formate-tetrahydrofolate ligase activity
	GO:0009396	9e-248	folic acid-containing compound biosynthetic process
	GO:0004488	2.8e-72	methylenetetrahydrofolate dehydrogenase (NADP+) activity
	GO:0003824	2.8e-72	catalytic activity
	GO:0055114	2.8e-72	oxidation-reduction process
	GO:0005488	3.3e-52	binding
KEGG pathway	dya:Dyak_GE26043	0.0
	K00288 (MTHFD)	maps->	One carbon pool by folate
			Glyoxylate and dicarboxylate metabolism
InterPro domain	[315-933] IPR000559	9e-248	Formate-tetrahydrofolate ligase, FTHFS
	[35-57] IPR000672	2.8e-72	Tetrahydrofolate dehydrogenase/cyclohydrolase
	[128-292] IPR020631	1.1e-66	Tetrahydrofolate dehydrogenase/cyclohydrolase, NAD(P)-binding domain
	[145-274] IPR016040	3.3e-52	NAD(P)-binding domain
	[4-124] IPR020630	1.2e-32	Tetrahydrofolate dehydrogenase/cyclohydrolase, catalytic domain
Orthology group	MCL10547		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211321-TA
ATGTCTGCTCAAGTGATTTCTGGTACACAAACAGCTAGATCTATAGAAAATGACCTCCGTCAGCAAGTGGCCGTCATGGGTCAACAGCACCCTGGCTTCCAACCAAAGCTGGCTATCGTGCAGGTCGGAGGACGAGAAGACTCCAACGTTTACATCCGAGCCAAGCTGAAAGCAGCAGAAAACATCGGCATAGCTGCTGAACACATCAAACTTCCCAGAGAAATCTCGCAGGCTGAGCTACTTACAAAGTTGACAGCTCTAAATGATTCGCCGTTAGTACATGGCATAATAGTTCAGATGCCACTGGATTCGGTCGAGAAAATCGACTCGCATCTCATCACCGACGCTGTCTCCTCGCAGAAAGATGTTGACGGATTGAATACTGAAAACGAAGGACGTGTGGCCCTCGGTGATATGTCAGGCTTCGTTTCTTGCACCCCAGCTGGTTGTATAGAACTCATCAAACGTACTGGAATCTCCATCGAAGGCAAACAGGCGGTGGTTATCGGACGCAGTAGGATCGTTGGAACACCAGTAGCTGAACTTCTCAAGTGGGAAAACGCCACTGTTACCGTTTGCCACTCGAAGACTAAGAACTTAAGTGAAATTACCAAAACTGCTGATATTTTAGTGGTAGCGATTGGTAAAGCAGAAATGGTTCGTGGCTCTTGGATTAAACCGGGGGCGGTGGTAATAGACTGCGGTATTAATCCCATCCCAGATACATCAAAACCCAGCGGCCGGAGGTTGGTAGGTGACGTGGCATATTCCGAGGCGGTACAGGTCGCGTCGCATGTAACCCCTGTACCCGGCGGTGTGGGTCCCATGACTGTGGCTATGTTGATGAAAAACACCGTGTTGGCTGCTAGCAGACAACTCCAACGGATCTCTACACCCGTGTGGCCGCTGCAGCCGCTTAGACTTAGCACGGTTTCGCCACCTCCAAGCGACATTGTTATAGCGCGTTCTCAAAAACCTAAATATATTAGTAAGTTGGCGGAGGAGATAGGATTGTTCCCCAGTGAGGTGTCACAATATGGTAATACCAAGGCGAAAATATCTTTGTCTGTGCTGGATCGTCTCCGAGATCAGCGTGGCGGAAAATACATCGTCGTGGCTGGCATAACCCCCACTCCTCTCGGTGAGGGTAAGAGTACGACGTTGATCGGTCTGGTGCAGGCTCTGGGTGCTCATCGCGGAAGGAACGCCTTCGCCGTCATGCGTCAGCCCAGTCAGGGACCAACCTTCGGAGTCAAGGGCGGAGCCGCTGGCGGAGGATACTCACAGGTCATTCCTATGGAAGATTTCAACCTTCATCTCACTGGTGACATTCACGCCGTTTCTGCAGCCAACAATCTCCTCGCAGCTCACATGGATGCCAGGATCTTCCATGAGCTAACACAAAAAGACGGTCCTCTGTATGATCGTTTGGTGCCAGAAATTAAAGGAGTCAGAAAATTCTCCCCCATTCAGTTGAGAAGATTAAAGAGATTGGGAATCGAAAAGACCGATCCGAACGCCTTAACACCAGAAGAAAGAGTTAAATTTGCACGACTTAACATTGACCCCAAAAAAGTTATGTGGAATAGAGTCGTGGATTTGAACGATAGATATTTACGTAAAATTACTATCGGACAATCACCCACTGAGAAAGGTTTTACCCGCGAGACTAGTTTTGACATCGCCGTAGCGTCTGAAATTATGGCTGTGTTGGCTCTGGGCAAGGATGTGAATGATATTAAGGAGAGACTCGCGAATATGGTGGTAGCTCTGGACACAAACGGCAAACCAGTAATAGCTGATGATCTTGGCATTACAGGGGCTTTAATGGTGTTGCTTAAGGACGCATTTGAGCCCACATTGATGCAGACTTTGGAAGGTACTCCTGTATTGGTCCACACGGGACCGTTCGCCAACATAGCTCATGGATGCTCCTCTATACTTGCCGATAAGATAGCCATGAAACTGGCCCGAGAAAATGGCTATGTGGCAACTGAAGCCGGCTTTGGATCTGACATCGGTATGGAAAAGTTCTTTGATATAAAGTGTCGTTCGAGCGGCGACACCCCTCACTGCGCTGTCATCGTGAGTACAGTCCGCGCGCTCAAGATGCACGGCGGAGGACCTACCGTCAGCCCTGGACAACCGCTCCACTCAGTATATGTCCAAGAAAACTTGGAACTGCTTAGCAAAGGACTGTGCAATTTAGGAAAACACATCAGCAACGGCAATAAGTTTGGCGTTCCTGTCGTTATTGCTGTTAACAAACACGGAAACGACACAGAAGCAGAACTGAACATGGTTAGAGAATATGCCTTGAAAAATGGAGCATTCCGTGCTGTTATTTGCGATCACTGGGCTAAGGGAGGCGCTGGCGCCTTGGAACTAGCGGACGCGGTCGTAGAAGCCTGCGACCGTCCCTCGAACTTCCAATATCTCTATCCATTGGAAATGACGATCCAAGATAAAATTAAGAAGATCGCTGTAGAGATGTACGGAGCTGGGACAGTGGAATACACAGATGTGGTTTTGGAGAAAATTAAAGTTTTGAATGATAGGGGCTACGATAAGCTGGCGATATGTATGGCCAAGACTTCTAATTCGCTGACCGGCGACCCCAGTATCAAGGGTGCTCCTACCGGATTCACTCTTCGTATCAATGATATTTTCGTGTCTGCGGGCGCTGGTTTTATTGTTCCTATGGTTGGCGAGATATCCAAAATGCCTGGCCTTCCTACAAGACCCAGCATCTACGATATAGATCTGAACACCGAGACCGGTGAAATCGATGGCCTTTTTTAA

Protein sequence:

>DPOGS211321-PA
MSAQVISGTQTARSIENDLRQQVAVMGQQHPGFQPKLAIVQVGGREDSNVYIRAKLKAAENIGIAAEHIKLPREISQAELLTKLTALNDSPLVHGIIVQMPLDSVEKIDSHLITDAVSSQKDVDGLNTENEGRVALGDMSGFVSCTPAGCIELIKRTGISIEGKQAVVIGRSRIVGTPVAELLKWENATVTVCHSKTKNLSEITKTADILVVAIGKAEMVRGSWIKPGAVVIDCGINPIPDTSKPSGRRLVGDVAYSEAVQVASHVTPVPGGVGPMTVAMLMKNTVLAASRQLQRISTPVWPLQPLRLSTVSPPPSDIVIARSQKPKYISKLAEEIGLFPSEVSQYGNTKAKISLSVLDRLRDQRGGKYIVVAGITPTPLGEGKSTTLIGLVQALGAHRGRNAFAVMRQPSQGPTFGVKGGAAGGGYSQVIPMEDFNLHLTGDIHAVSAANNLLAAHMDARIFHELTQKDGPLYDRLVPEIKGVRKFSPIQLRRLKRLGIEKTDPNALTPEERVKFARLNIDPKKVMWNRVVDLNDRYLRKITIGQSPTEKGFTRETSFDIAVASEIMAVLALGKDVNDIKERLANMVVALDTNGKPVIADDLGITGALMVLLKDAFEPTLMQTLEGTPVLVHTGPFANIAHGCSSILADKIAMKLARENGYVATEAGFGSDIGMEKFFDIKCRSSGDTPHCAVIVSTVRALKMHGGGPTVSPGQPLHSVYVQENLELLSKGLCNLGKHISNGNKFGVPVVIAVNKHGNDTEAELNMVREYALKNGAFRAVICDHWAKGGAGALELADAVVEACDRPSNFQYLYPLEMTIQDKIKKIAVEMYGAGTVEYTDVVLEKIKVLNDRGYDKLAICMAKTSNSLTGDPSIKGAPTGFTLRINDIFVSAGAGFIVPMVGEISKMPGLPTRPSIYDIDLNTETGEIDGLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: