MonarchBase - Protein-coding gene

DPOGS215541
Transcript	DPOGS215541-TA	1329 bp
Protein	DPOGS215541-PA	442 aa
Genomic position	DPSCF300129 - 254920-264811
RNAseq coverage	4042x (Rank: top 3%)

Annotation
*Heliconius*	HMEL011623	1e-110	60.93%
*Bombyx*	BGIBMGA002295-TA	2e-123	79.55%
*Drosophila*	growl-PA	7e-49	33.56%
EBI UniRef50	UniRef50_F4WP28	6e-80	40.49%	Methenyltetrahydrofolate synthetase domain-containing protein n=7 Tax=Formicidae RepID=F4WP28_ACREC
NCBI RefSeq	XP_395864.3	6e-83	38.20%	PREDICTED: similar to CG14648-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|350412922	1e-87	41.24%	PREDICTED: methenyltetrahydrofolate synthase domain-containing protein-like [Bombus impatiens]
NCBI nr blastx	gi\|350412922	3e-84	40.49%	PREDICTED: methenyltetrahydrofolate synthase domain-containing protein-like [Bombus impatiens]

Group
Gene Ontology	GO:0005524	3.8e-27	ATP binding
	GO:0030272	3.8e-27	5-formyltetrahydrofolate cyclo-ligase activity
	GO:0009396	3.8e-27	folic acid-containing compound biosynthetic process
KEGG pathway	tca:654948	8e-78
	K01934 (E6.3.3.2)	maps->	One carbon pool by folate
InterPro domain	[24-206] IPR002698	3.8e-27	5-formyltetrahydrofolate cyclo-ligase
	[23-207] IPR024185	2.5e-20	5-formyltetrahydrofolate cyclo-ligase-like domain
Orthology group	MCL12725		Single-copy universal gene

Nucleotide sequence:

>DPOGS215541-TA
ATGCAGAACGGAGACGAAACTCCGGCAGCTACCGAAACAGCAAAGAAGCCACTACCAGAGGAGGTAACGAAACAATCGTTCAGGCAGAAGATATGGCGTCATTTGGAGACCAACGGACTGGCAATGTTCCCACGACCGGTGTACAACAGGATACCGAACTTCAAGGGGGCTCTGGAAGCAGCGGCTAAGTTGGCAGAATTGGATGTGTTCAAGAATGCCAACACGGTGAAGGTCAATCCTGATAAGCCTCAAGAACCAGTCAGGGTGCTATGCCTGGAGAAGCACAAGACTCTATACGTGCCGGTTCCTCGTCTTCAGTCGGGCTTCCTGAACCGAATCGTCCTCCCGGAGGGTGAAGCTAAGCCGGGCACACTGAGGAAGGCCGTCTCAAGGAACGGAATGGAATCGTTCGGACAACCACTGACCATAGAAGATTCGGTCTCCTTGGACTTGGTCGTGATGGGATCCGTTGCTGTCTCCAAGGAGGGATATCGCATTGGAAAAGGAAAAGGGTACGGGGATCTAGAGTTTGGCCTGATGATGCACATGAAGGCTATCAAACCTAACACGCTGGTTGTGACAACTGTGCACGACTGTCAGGTGTTTGATACACTTCCAGCTGCACTGAAGCCAGGTGTGATAGAGACCCAGCGTATGAGCCAACGGCCAGTCAGTATATTGTGGCATCTGCTGTCACAGCGACGCCTGGAGATGATGCCAGTGCTGGGGCAACTCAGAGACATTGAGATGCTTGCTGGGCGTTCGTGTACTCTTCGTGAGGAGGACAGCGCTGGCGAGGAGGAACGAGCGAGGCCGCGCCGACAGAGAAGGAGGACCAGGAGCCATAAGAGTCATAGCGAGGGAGAGGGCAACACGACGGAGGGCGAGGACGGTAAAAATAATAAGCCTCGGCGTCCGCGGCGCCGCAGCACCAAGTCTCTGAGTAAGGACGGCGAGGGGAGGGAGGGGAAGGAGGGGAGGGAGGGGAAACCCAAACGACCACGACGTCCGAGACCGGTCATTGACTTCACTGTTAAGATTTCAAACATCAGTCCCAACACTCGTGTGCGTGACATCAAATCGGCTCTCTTCGAACGCGGTGTTAAACCGCACGTTATGATTTGGAAGGGTGAAGGGGACATCCCAGCAGCGAACATGGACAGTGTGCTAGCGGCTCTGGCTCAGATGTCTGTGGGTGGTTCAGGGGGAGCACCTGACGAGCGCGAGGAGAAGCCCCGCCTGCTGACAGTGGAGCCGGCGCCGCCGAGGCACGCGGCCGCACCCGCCGCCGCACCAGCCGCGGCTGAGGCGCCGCCCGCGGTACATTAA

Protein sequence:

>DPOGS215541-PA
MQNGDETPAATETAKKPLPEEVTKQSFRQKIWRHLETNGLAMFPRPVYNRIPNFKGALEAAAKLAELDVFKNANTVKVNPDKPQEPVRVLCLEKHKTLYVPVPRLQSGFLNRIVLPEGEAKPGTLRKAVSRNGMESFGQPLTIEDSVSLDLVVMGSVAVSKEGYRIGKGKGYGDLEFGLMMHMKAIKPNTLVVTTVHDCQVFDTLPAALKPGVIETQRMSQRPVSILWHLLSQRRLEMMPVLGQLRDIEMLAGRSCTLREEDSAGEEERARPRRQRRRTRSHKSHSEGEGNTTEGEDGKNNKPRRPRRRSTKSLSKDGEGREGKEGREGKPKRPRRPRPVIDFTVKISNISPNTRVRDIKSALFERGVKPHVMIWKGEGDIPAANMDSVLAALAQMSVGGSGGAPDEREEKPRLLTVEPAPPRHAAAPAAAPAAAEAPPAVH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: