写点什么

Rust 过程宏:用 syn Fold 优雅替换 Panic

作者:Sam Van Overmeire

  • 2024-03-28
    北京
  • 本文字数:4094 字

    阅读完需:约 13 分钟

大小:1.21M时长:07:03
Rust 过程宏:用 syn Fold 优雅替换 Panic

Procedural macros 是操作 Rust 代码的强大工具。编写这些宏的程序员通常会使用像 synquote 这样的库来解析和输出标记流。然而,在更复杂的用例中,syn 库提供的标准工具可能无法满足所有需求。有时,标准工具的功能显得捉襟见肘,导致代码变得脆弱且充满重复。


本文将通过一个玩具示例来揭示这些不足之处,即我们将替换函数中的每个 panic 为 Err。首先,我们将展示通常的代码写法。然后,我们将引入 Fold trait,展示它如何使这种操作的代码变得更加优雅。

示例用例:替换 panic

syn 作为 Rust 中解析过程宏输入的标准库,其功能丰富,能够助力开发者高效地生成和转换代码。其标准功能在处理单一或简单的递归操作时表现良好,但在面对复杂多样的场景时,开发者往往需要自行处理各种可能出现的情况,这无疑增加了工作量和出错的可能性。


当我们面对需要编写大量重复代码以处理不同情况时,可能会开始质疑选择 syn 是否明智。为了克服这一挑战,我们可以转向 syn 库中的 Fold trait。尽管这个 trait 被隐藏在某个特性标志之下,但它在递归地改变代码结构时表现出了强大的能力。Fold trait 提供了多种方法,允许开发者在输入的特定部分进行 “挂钩” 操作。


为了更直观地展示 Fold trait 的实际应用,我们可以参考《Write Powerful Rust Macros》一书中的例子。在这个例子中,我们展示了如何使用过程宏将函数中的 panic 调用替换为返回 Err 枚举变体的操作。以下是 panic_to_result 宏的一个简化版代码片段,它展示了这一转换过程的具体实现:


#[panic_to_result] // use our macrofn create_person_with_result(name: String, age: u32) -> Result<Person, String> {   if age > 30 {       panic!("I hope I die before I get old"); // <- panic will be replaced by an Err   }   Ok(Person {       name,       age,   })}
fn main() { // the assertion shows we got back an Err instead of a panic! assert!(create_person_with_result("name".to_string(), 31).is_err());}
复制代码


在现代编程领域中,各种编程语言在处理错误时都展现出了独特的风格。其中,Rust 语言以其对代数数据类型的深度依赖而脱颖而出。值得注意的是,我们并非旨在将宏应用于所有可能的输入情况。实际上,本书所提供的代码更侧重于识别和处理那些存在于 if 语句内部的 panic 情况。这种设计选择极具实用性,因为这正是我们示例中 panic 出现的典型场景。通过以下宏实现的代码片段,你可以清晰地看到这一点:


match expression {   // check the if expressions for panics   Expr::If(mut ex_if) => {       let new_statements: Vec<Stmt> = // modify existing statements       ex_if.then_branch.stmts = new_statements; // and put them inside the if       Stmt::Expr(Expr::If(ex_if), token)   },   // return all other expressions without modification   _ => Stmt::Expr(expression, token)}
复制代码

Fold trait

syn 库提供了一项强大的工具,即 Fold trait,它尤其适用于我们需要递归遍历输入语法树(AST)的场景。Fold 隐藏在特性标志之后,但根据官方文档描述:


Fold trait 用于遍历并转换拥有权的语法树节点。其每个方法都可以被重写,以定制在转换相应类型节点时的行为。”这一描述凸显了其潜在的有用性。尽管 syn 库中还有另一个特性标志隐藏的 trait,即 Visit,它与 Fold 类似,但使用树的引用(borrow)并不返回任何结果,因此并不适合我们当前的需求。


Fold 允许我们访问程序 AST 中的每个节点。由于它拥有对语法树的所有权,我们可以对这些节点进行修改,并最终得到一个按我们意愿改造后的树。在我们的案例中,我们的目标是遍历 AST 树,将每个 panic 调用替换为 Err 表达式。你将发现,使用 Fold trait 所需的代码量竟异常之少。


接下来,让我们通过运行 cargo init --lib 命令来创建一个新的 Rust 库,并将其转换为过程宏。这可以通过在 Cargo.toml 文件中设置 proc-macro = true 来实现。此外,我们还需要添加一些必要的依赖项,以支持我们的宏实现。


[dependencies]quote = "1.0.33"syn = { version = "2.0.39", features = ["fold", "full"]}
[lib]proc-macro = true
复制代码


接下来,我们定义入口点函数 panic_to_result,它是一个属性宏。属性宏的作用在于将其返回的代码(以令牌流的形式)直接替换原有的代码。因此,我们在此生成的输出将完全取代被标记函数的定义。


panic_to_result 首先会将输入转换为一个 ItemFn 类型,这表示我们期望的输入是一个函数定义。随后,它利用一个自定义的结构和 fold_item_fn 方法来折叠输入,并将结果以 TokenStream 的形式返回。最后,我们将这个 TokenStream 传递给 quote 宏,以便生成最终的替换代码。


use proc_macro::TokenStream;use quote::quote;
#[proc_macro_attribute]pub fn panic_to_result(_attr: TokenStream, input: TokenStream) -> TokenStream { let item: ItemFn = syn::parse(input).unwrap(); // parse the input let result = ChangePanicIntoResult.fold_item_fn(item); // fold it quote!(#result).into() // and return the result}
复制代码


fn extract_panic_content(mac: &Macro) -> Option<TokenStream2> {    let does_panic = mac.path.segments.iter()        .any(|v| v.ident.to_string().eq("panic"));
if does_panic { Some(mac.tokens.clone()) } else { None }}
复制代码


最后,利用 parse2 的巧妙之处,生成的令牌被顺利转换为一个语句,并由函数返回。在此过程中,值得注意的是,这里并不需要显式指定类型规范,因为 Rust 编译器会根据函数的输出类型进行自动推断。当不存在宏或 panic 调用时,我们则直接返回现有的 Stmt 对象。最后,通过调用 fold::fold_stmt,我们确保了 syn 库能够继续对语句进行折叠处理,从而完成整个转换过程。


use quote::quote;use syn::{fold, ItemFn, Macro, Stmt};use syn::fold::Fold;
struct ChangePanicIntoResult; // the struct that we were calling in the entry point
impl Fold for ChangePanicIntoResult { fn fold_stmt(&mut self, stmt: Stmt) -> Stmt { let new_statement: Stmt = match stmt { Stmt::Macro(ref mac) => { let output = extract_panic_content(&mac.mac); // helper to get the panic message output .map(|t| quote! { return Err(#t.to_string()); }) .map(syn::parse2) .map(Result::unwrap) .unwrap_or(stmt) } // panics should be inside a 'Macro', so in every other case we return _ => stmt }; // keep folding fold::fold_stmt(self, new_statement) }}
复制代码


这确实可能引发一系列更深层次的问题。或许你此刻正疑惑,为何我们没有实现一个 fold_macro 功能(如果它存在的话)。毕竟,在 syn 库中,panic 被解析为一个 Macro。事实上,这曾是我最初的设想!然而,随着对问题的深入理解,我意识到这样的操作实际上并不可行。原因是,如果我们尝试对一个宏进行操作,并将其替换为一个 Err 表达式,那么这样的替换结果本身就不再是一个宏了。更遗憾的是,fold_macro 的定义明确要求我们必须返回一个宏,这使得我们的设想无法实现。

完整示例

让我们深入探究一下我们的代码在实际运行时的效果。我特地对之前的示例进行了调整,加入了循环结构。在我们的主函数中,我们将对三种可能的路径进行详尽的测试。


use fold_macro::panic_to_result;
#[derive(Debug)]pub struct Person { name: String, age: u32,}
#[panic_to_result]fn create_person_with_result(name: String, age: u32) -> Result<Person, String> { // 'if' works if age > 30 && age < 50 { panic!("I hope I die before I get old"); } // but now loop does as well loop { if age > 50 { panic!("This person is old... very old"); } break } Ok(Person { name, age, })}
fn main() { let first = create_person_with_result("name".to_string(), 20); println!("{first:?}"); let second = create_person_with_result("name".to_string(), 40); println!("{second:?}"); let third = create_person_with_result("name".to_string(), 51); println!("{third:?}");;}
复制代码


Ok(Person { name: "name", age: 20 }) Err("I hope I die before I get old") Err("This person is old... very old")
复制代码


尽管这并非一个全面完善的错误处理宏解决方案,但它确实为解决特定问题提供了一个颇具启发性的示例。该宏的局限性在于,它目前仅适用于那些已经设计为返回 Result 类型的函数。然而,这并不影响它作为一个展示 Fold trait 和自定义代码如何结合实现强大功能的出色案例。

总结

在本文中,我们深入探讨了如何借助 Fold trait 编写高级宏来遍历并修改 Rust 代码。syn crate 提供的标准工具集使得我们能够以简洁高效的方式转换函数。举例来说,我们成功地利用这些工具将 panic 调用替换为 Err 表达式。然而,此前缺乏一种优雅且自动化的方法来递归遍历整个函数,并在每个适用的位置执行更改。


Fold 和 Visit trait 的出现,打破了这一局限。尽管它们隐藏在特性标志之后,但为我们提供了强大的工具。Fold trait 尤其适用于操作函数的抽象语法树(AST),因此非常符合我们的用例。它提供了多种方法,这些方法尽管带有基本的默认实现,但却极具实用性,能够处理给定类型的每个出现。比如,fold_macro 方法允许我们操纵函数中的每个宏。此外,fold_stmt 方法帮助我们以最小的努力遍历整个函数的内容,从而轻松地更改每个 panic。


原文链接:

https://www.infoq.com/articles/rust-procedural-macros-replace-panic/

2024-03-28 08:002334

评论

发布
暂无评论
发现更多内容

# LeetCode 215. Kth Largest Element in an Array

liu_liu

算法 LeetCode

情绪的力量:如何使用情绪来达成目标

董一凡

情绪

杂谈-JSONP探索

卡尔

Java jsonp

从 0 到 1 搭建技术中台之发布系统实践:集泳道、灰度、四端和多区域于一体的设计与权衡

伴鱼技术团队

架构 系统设计 系统架构 系统性思考 架构设计

一个人,沿着童年的路究竟可以走多远?

zhoo299

童年 NASA 航天

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十三)编写测试-生命周期方法

编程道与术

Java 编程 TDD 单元测试 JUnit

互联网时代的界限管理

非著名程序员

程序员 职场 提升认知 界限管理

Redis持久化了解一波!

不才陈某

redis 程序员 后端

我为什么开始技术写作?

架构精进之路

技术创作

美团可能会强势涉足 ToB

罗小布

创业 互联网巨头 深度思考 互联网

每个人都是领导者的工程团队

hongfei

工程能力 项目实践

知识也会生宝宝?

史方远

个人成长 随笔杂谈

奈学:传授“带权重的负载均衡实现算法”独家设计思路

奈学教育

分布式

【Java 25周年有奖征文获奖名单公布!!!】关于Java,你最想赞扬、吐槽、期待的变化是什么?

InfoQ写作社区官方

写作平台 Java25周年 热门活动

MySQL的各种日志

超超不会飞

MySQL

这是一个测试文档

Geek_073cad

Go语言分布式系统配置治理

田晓亮

微服务

我常用的浏览器插件

彭宏豪95

chrome 效率工具 浏览器 插件

开源分布式文件系统大检阅

焱融科技

开源 sds 存储 焱融科技 文件存储

ARTS 第二周打卡

陈文昕

ARTS - Week Two

shepherd

js algorithm

我的 Windows 利器

玄兴梦影

工具 Win

数据产品经理实战-数据门户搭建(上)

第519区

数据中台 开发数据

线程池续:你必须要知道的线程池submit()实现原理之FutureTask!

一枝花算不算浪漫

源码分析 并发编程

你不知道的SSD那些事

焱融科技

分布式 存储 SSD nvme

Python 自动化办公之"你还在手动操作“文件”或“文件夹”吗?"

JackTian

Python 自动化

patroni 通过服务启动报错

hobson

数据库 高可用 AntDB

程序员修炼的务实哲学

博文视点Broadview

程序员 软件 编程思维 工程师 编程之路

Vue生态篇(一)

shirley

Java Vue

# LeetCode 863. All Nodes Distance K in Binary Tree

liu_liu

算法 LeetCode

Vue生态篇(二)

shirley

Vue

Rust 过程宏:用 syn Fold 优雅替换 Panic_软件工程_InfoQ精选文章