| Treetop——基于Ruby的PEG解析器生成器 |
|
| 作者是 Werner Schuster | |
| 2008-01-22 06:11:24 | |
|
当谈到解析器生成器的时候,解析表达式语法(PEG)最近因为一篇Bryan Ford介绍的一种叫做“Packrat解析”优化的论文而 变得很流行。Packrat解析解决了诸如指数级解析时间的问题。这是由于解析器使用回溯来解析代码,例如,它们会尝试诸多结果的组合直到找到正确的那一 个。Packrat解析的解决方法是使用记忆化,例如将解析的中间结果保存下来,而不是一遍一遍的重新计算。这决定了Packrat解析的时间复杂度是线 性的,但是缺点是需要很大的内存,通常是源代码大小的几倍。注意,其他的解析器生成器也是采用类似的方法,比如ANTLR。 基于这个前提,Treetop网站上如此解释PEG的优点: 解析表达式语法(PEGs)编写简单、易于维护。它们是简单但功能强大的泛化正则表达式,比起传统的LALR或者LR-1语法的解析器生成器来说更易于使用。没有必要再进行符号化解析,或者用于有限度上下文敏感的前向断言。Treetop会自动生成解析树,而且还允许用户添加方法来定制所生成的节点: grammar Arithmetic这段代码的意思是通过additive节点生成的节点有一个叫做value的方法。另外,可以为每条规则指定一个要生成的节点类。(注意:这个斜杠是选择操作符,意思是,additive规则要么是两个操作数和之间的加号,要么是multitive规则的结果)。 在开始使用Treetop之前,你需要先安装它。可以从Rubyforge下载Treetop的源代码,或者通过gem安装,命令为: gem install treetop想要开始使用它的话,可以去查看Treetop的文档或者看看上文中的示例。Treetop需要一个简单的算术表达式解析器、一个非常基本的语言解析器以及运行时间。 Treetop可以通过tt工具将语法定义文件转换成Ruby代码: tt foo.treetop
另一种选择是通过Ruby代码来进行解析器生成:Treetop.load "arithmetic"Treeop创始人的现场演示,参见Nathan Sobo在RubyConf 2007上关于Treetop的报告。 |
|
| 最近更新 ( 2008-01-22 06:11:24 ) |

