引 言
作为一门面向智能合约的语言,Solidity 与其他经典语言既有差异也有相似之处。
一方面,服务于区块链的属性使其与其他语言存在差异。例如,合约的部署与调用均要经过区块链网络确认;执行成本需要被严格控制,以防止恶意代码消耗节点资源。
另一方面,身为编程语言,Solidity 的实现并未脱离经典语言,比如 Solidity 中包含类似栈、堆的设计,采用栈式虚拟机来进行字节码处理。
本系列前几篇文章介绍了如何开发 Solidity 程序,为了让读者知其然更知其所以然,本文将进一步介绍 Solidity 的内部运行原理,聚焦于 Solidity 程序的生命周期和 EVM 工作机制。
Solidity 的生命周期
与其他语言一样,Solidity 的代码生命周期离不开编译、部署、执行、销毁这四个阶段。下图整理展现了 Solidity 程序的完整生命周期:
经编译后,Solidity 文件会生成字节码。这是一种类似 jvm 字节码的代码。部署时,字节码与构造参数会被构建成交易,这笔交易会被打包到区块中,经由网络共识过程,最后在各区块链节点上构建合约,并将合约地址返还用户。
当用户准备调用该合约上的函数时,调用请求同样也会经历交易、区块、共识的过程,最终在各节点上由 EVM 虚拟机来执行。
下面是一个示例程序,我们通过 remix 探索它的生命周期。
编译
源代码编译完后,可以通过 ByteCode 按钮得到它的二进制:
还可以得到对应的字节码(OpCode):
其中下述指令集为 set 函数对应的代码,后面会解释 set 函数如何运行。
部署
编译完后,即可在 remix 上对代码进行部署,构造参数传入 0x123:
部署成功后,可得到一条交易回执:
点开 input,可以看到具体的交易输入数据:
上面这段数据中,标黄的部分正好是前文中的合约二进制;而标紫的部分,则对应了传入的构造参数 0x123。
这些都表明,合约部署以交易作为介质。结合区块链交易知识,我们可以还原出整个部署过程:
客户端将部署请求(合约二进制,构造参数)作为交易的输入数据,以此构造出一笔交易
交易经过 rlp 编码,然后由发送者进行私钥签名
已签名的交易被推送到区块链上的节点
区块链节点验证交易后,存入交易池
轮到该节点出块时,打包交易构建区块,广播给其他节点
其他节点验证区块并取得共识。不同区块链可能采用不同共识算法,FISCO BCOS 中采用 PBFT 取得共识,这要求经历三阶段提交(pre-prepare,prepare, commit)
节点执行交易,结果就是智能合约 Demo 被创建,状态字段_state 的存储空间被分配,并被初始化为 0x123
执行
根据是否带有修饰符 view,我们可将函数分为两类:调用与交易。由于在编译期就确定了调用不会引起合约状态的变更,故对于这类函数调用,节点直接提供查询即可,无需与其他区块链节点确认。而由于交易可能引起状态变更,故会在网络间确认。
下面将以用户调用了 set(0x10)为假设,看看具体的运行过程。
首先,函数 set 没有配置 view/pure 修饰符,这意味着其可能更改合约状态。所以这个调用信息会被放入一笔交易,经由交易编码、交易签名、交易推送、交易池缓存、打包出块、网络共识等过程,最终被交由各节点的 EVM 执行。
在 EVM 中,由 SSTORE 字节码将参数 0xa 存储到合约字段_state 中。该字节码先从栈上拿到状态字段_state 的地址与新值 0xa,随后完成实际存储。
下图展示了运行过程:
这里仅粗略介绍了 set(0xa)是如何运行,下节将进一步展开介绍 EVM 的工作机制以及数据存储机制。
销毁
由于合约上链后就无法篡改,所以合约生命可持续到底层区块链被彻底关停。若要手动销毁合约,可通过字节码 selfdestruct。销毁合约也需要进行交易确认,在此不多作赘述。
EVM 原理
在前文中,我们介绍了 Solidity 程序的运行原理。经过交易确认后,最终由 EVM 执行字节码。对 EVM,上文只是一笔带过,这一节将具体介绍其工作机制。
运行原理
EVM 是栈式虚拟机,其核心特征就是所有操作数都会被存储在栈上。下面我们将通过一段简单的 Solidity 语句代码看看其运行原理:
这段代码经过编译后,得到的字节码如下:
为了读者更好了解其概念,这里精简为上述 3 条语句,但实际的字节码可能更复杂,且会掺杂 SWAP 和 DUP 之类的语句。
我们可以看到,在上述代码中,包含两个指令:PUSH1 和 ADD,它们的含义如下:
PUSH1:将数据压入栈顶。
ADD:POP 两个栈顶元素,将它们相加,并压回栈顶。
这里用半动画的方式解释其执行过程。下图中,sp 表示栈顶指针,pc 表示程序计数器。当执行完 push1 0x1 后,pc 和 sp 均往下移:
类似地,执行 push1 0x2 后,pc 和 sp 状态如下:
最后,当 add 执行完后,栈顶的两个操作数都被弹出作为 add 指令的输入,两者的和则会被压入栈:
存储探究
在开发过程中,我们常会遇到令人迷惑的 memory 修饰符;阅读开源代码时,也会看到各种直接针对内存进行的 assembly 操作。不了解存储机制的开发者遇到这些情况就会一头雾水,所以,这节将探究 EVM 的存储原理。
在前文《智能合约编写之Solidity的基础特性》中我们介绍过,一段 Solidity 代码,通常会涉及到局部变量、合约状态变量。
而这些变量的存储方式存在差别,下面代码表明了变量与存储方式之间的关系。
栈
栈用于存储字节码指令的操作数。在 Solidity 中,局部变量若是整型、定长字节数组等类型,就会随着指令的运行入栈、出栈。
例如,在下面这条简单的语句中,变量值 1 会被读出,通过 PUSH 操作压入栈顶:
对于这类变量,无法强行改变它们的存储方式,如果在它们之前放置 memory 修饰符,编译会报错。
内存
内存类似 java 中的堆,它用于储存"对象"。在 Solidity 编程中,如果一个局部变量属于变长字节数组、字符串、结构体等类型,其通常会被 memory 修饰符修饰,以表明存储在内存中。
本节中,我们将以字符串为例,分析内存如何存储这些对象。
1. 对象存储结构
下面将用 assembly 语句对复杂对象的存储方式进行分析。
assembly 语句用于调用字节码操作。mload 指令将被用于对这些字节码进行调用。mload§表示从地址 p 读取 32 字节的数据。开发者可将对象变量看作指针直接传入 mload。
在下面代码中,经过 mload 调用,data 变量保存了字符串 str 在内存中的前 32 字节。
掌握 mload,即可用此分析 string 变量是如何存储的。下面的代码将揭示字符串数据的存储方式:
data 变量表示 str 的 0~31 字节,data2 表示 str 的 32~63 字节。运行 strStorage 函数的结果如下:
可以看到,第一个数据字得到的值为 6,正好是字符串"你好"经 UTF-8 编码后的字节数。第二个数据字则保存的是"你好"本身的 UTF-8 编码。
熟练掌握了字符串的存储格式之后,我们就可以运用 assembly 修改、拷贝、拼接字符串。读者可搜索 Solidity 的字符串库,了解如何实现 string 的 concat。
2. 内存分配方式
既然内存用于存储对象,就必然涉及到内存分配方式。
memory 的分配方式非常简单,就是顺序分配。下面我们将分配两个对象,并查看它们的地址:
运行此函数后,返回结果将包含两个数据字:
这说明,第一个字符串 str1 的起始地址是 0x80,第二个字符串 str2 的起始地址是 0xc0,之间 64 字节,正好是 str1 本身占据的空间。此时的内存布局如下,其中一格表示 32 字节(一个数据字,EVM 采用 32 字节作为一个数据字,而非 4 字节):
0x40~0x60:空闲指针,保存可用地址,本例中是 0x100,说明新的对象将从 0x100 处分配。可以用 mload(0x40)获取到新对象的分配地址。
0x80~0xc0:对象分配的起始地址。这里分配了字符串 aaa
0xc0~0x100:分配了字符串 bbb
0x100~…:因为是顺序分配,新的对象将会分配到这里。
状态存储
顾名思义,状态存储用于存储合约的状态字段。
从模型而言,存储由多个 32 字节的存储槽构成。在前文中,我们介绍了 Demo 合约的 set 函数,里面 0x0 表示的是状态变量_state 的存储槽。所有固定长度变量会依序放到这组存储槽中。
对于 mapping 和数组,存储会更复杂,其自身会占据 1 槽,所包含数据则会按相应规则占据其他槽,比如 mapping 中,数据项的存储槽位由键值 k、mapping 自身槽位 p 经 keccak 计算得来。
从实现而言,不同的链可能采用不同实现,比较经典的是以太坊所采用的 MPT 树。由于 MPT 树性能、扩展性等问题,FISCO BCOS 放弃了这一结构,而采用了分布式存储,通过 rocksdb 或 mysql 来存储状态数据,使存储的性能、可扩展性得到提高。
结 语
本文介绍了 Solidity 的运行原理,运行原理总结如下。
首先,Solidity 源码会被编译为字节码,部署时,字节码会以交易为载体在网络间确认,并在节点上形成合约;合约函数调用,如果是交易类型,会经过网络确认,最终由 EVM 执行。
EVM 是栈式虚拟机,它会读取合约的字节码并执行。
在执行过程中,会与栈、内存、合约存储进行交互。其中,栈用于存储普通的局部变量,这些局部变量就是字节码的操作数;内存用于存储对象,采用 length+body 进行存储,顺序分配方式进行内存分配;状态存储用于存储状态变量。
理解 Solidity 的运行方式及其背后原理,是成为 Solidity 编程高手必经之路。
关于作者
储雨知,FISCO BCOS 核心开发者。
评论