QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Treetop——基于 Ruby 的 PEG 解析器生成器

  • 2008-01-22
  • 本文字数:1041 字

    阅读完需:约 3 分钟

Ruby 已经有了一个叫做 RACC 的解析器生成器,是一个 YACC 的移植版本(被用来编写ruby_parser,第一个用Ruby 写成的Ruby 解析器)。

当谈到解析器生成器的时候,解析表达式语法(PEG)最近因为一篇 Bryan Ford 介绍的一种叫做“Packrat 解析”优化的论文而 变得很流行。Packrat 解析解决了诸如指数级解析时间的问题。这是由于解析器使用回溯来解析代码,例如,它们会尝试诸多结果的组合直到找到正确的那一 个。Packrat 解析的解决方法是使用记忆化,例如将解析的中间结果保存下来,而不是一遍一遍的重新计算。这决定了 Packrat 解析的时间复杂度是线 性的,但是缺点是需要很大的内存,通常是源代码大小的几倍。注意,其他的解析器生成器也是采用类似的方法,比如 ANTLR

基于这个前提, Treetop 网站上如此解释 PEG 的优点:

解析表达式语法(PEGs)编写简单、易于维护。它们是简单但功能强大的泛化正则表达式,比起传统的 LALR 或者 LR-1 语法的解析器生成器来说更易于使用。没有必要再进行符号化解析,或者用于有限度上下文敏感的前向断言。

Treetop 会自动生成解析树,而且还允许用户添加方法来定制所生成的节点:
grammar Arithmetic<br></br> rule additive<br></br>  multitive '+' additive {<br></br>  def value<br></br>  multitive.value + additive.value<br></br>  end<br></br>  }<br></br> /<br></br>  multitive<br></br> end<br></br># other rules below ... <br></br>end 这段代码的意思是通过 additive 节点生成的节点有一个叫做 value 的方法。另外,可以为每条规则指定一个要生成的节点类。(注意:这个斜杠是选择操作符,意思是,additive 规则要么是两个操作数和之间的加号,要么是 multitive 规则的结果)。 在开始使用 Treetop 之前,你需要先安装它。可以从Rubyforge 下载Treetop 的源代码,或者通过gem 安装,命令为:

gem install treetop 想要开始使用它的话,可以去查看Treetop 的文档或者看看上文中的示例。Treetop 需要一个简单的算术表达式解析器、一个非常基本的语言解析器以及运行时间。

Treetop 可以通过 tt 工具将语法定义文件转换成 Ruby 代码: <span>tt foo.treetop</span> 另一种选择是通过 Ruby 代码来进行解析器生成
Treetop.load "arithmetic"<br></br>parser = ArithmeticParser.new<br></br><span color="#000000">parser.parse('1+1') </span> Treeop 创始人的现场演示,参见 Nathan Sobo 在 RubyConf 2007 上关于 Treetop 的报告
查看英文原文: Treetop - PEG parser generator for Ruby

2008-01-22 01:171745
用户头像

发布了 80 篇内容, 共 20.4 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

某头部证券公司决策:为什么首选 CloudQuery 数据库管控平台?

BinTools图尔兹

案例 数据库安全 客户体验

Nacos注册中心有几种调用方式?

王磊

Java 面试

FabFilter Total Bundle 2023 for Mac(音频插件合集)修复版 v2023.06.29完整激活版

mac

苹果mac Windows软件 FabFilter 2023 Total FabFilter 插件

盘点帮助系统的需求,提升用户的体验

AlexLei

帮助中心 帮助系统 帮助体系

Linux cp命令:复制文件和目录

芯动大师

文心一言 VS 讯飞星火 VS chatgpt (123)-- 算法导论10.4 4题

福大大架构师每日一题

福大大架构师每日一题

华为云CCE产品文档优化升级

华为云原生团队

云计算 容器 微服务 云原生

Premiere Pro 2024 for Mac(pr 2024视频编辑软件)v24.0完美激活版

mac

苹果mac Windows软件 视频编辑软件 Premiere Pro 2024 pr2024

云游长江大桥,3DCAT实时云渲染助力打造沉浸化数字文旅平台

3DCAT实时渲染

元宇宙 实时渲染 元宇宙解决方案

不同版本OpenJDK 源码调试方案

AiDaddy

Openjdk 远程调试 源码调试 openjdk 源码调试

CQ 社区版 V2.5.0 发布 | 开放在线试用、自定义高危操作、新增数据源Phoenix、Trino等

BinTools图尔兹

oceanbase 数据库管控 polarDB trino CloudQuery

聚合支付重构

xzy

Mac电脑轻级思维导图软件 iMap Builder免激活中文版

mac大玩家j

思维导图 Mac软件 mac思维导图 思维导图软件

人工智能之从零理解人工神经网络

珲少

创建CI/CD流水线中的IaC前,需要考虑哪些事项?

SEAL安全

DevOps CI/CD IaC 企业号10月PK榜

mac电脑温度和风扇速度控制工具 TG Pro最新激活版

胖墩儿不胖y

Mac软件 系统监控软件

一文读懂多云CDN

火山引擎边缘云

CDN CDN加速 CDN技术 CDN带宽

【新产品】DPEasy 一款高效的数据库安全风险扫描工具,即将上线!

BinTools图尔兹

数据库 数据库安全

PingCode 第四届开发者大会成功举办

爱吃小舅的鱼

软件开发 开发 PingCode

Linux rm命令:删除文件或目录

芯动大师

惊艳,根本停不下来!GPT-4 全工具模式开始测试

豆哥

多模态 openai ChatGPT GPT-4

校园物业报修小程序开发笔记一

CC同学

Python 日期和时间处理教程:datetime 模块的使用

小万哥

Python 程序员 软件 后端 开发

三维可视化神器带来无限可能,原来三维场景也可以如此轻松实现

袁袁袁袁满

人工智能 三维城市建模

EVE-NG的环境导入QEMU组件了解一下

小魏写代码

非线性中国式报表引擎NopReport源码解析

canonical

低代码 中国式报表 可逆计算 Nop平台 报表引擎

ES6新特性(五)

阡陌r

JavaScript class ES6

开源合规标准实践-“心寄源”法律沙龙(2023第六期 | 总第十一期)成功召开

开放原子开源基金会

Treetop——基于Ruby的PEG解析器生成器_Ruby_Werner Schuster_InfoQ精选文章