本文阐述了 WebAssembly 诞生的背景,并从实践案例中分析了 WebAssembly 到底带来了多少性能提升。本文经授权转载自【IVWEB 社区】。
背景:从 JavaScript 说起
JavaScript 占据着统治地位,不管是公开还是私有的项目、任何组织、世界任何地区,JavaScript 都是第一。 -GitHub 2018 年度报告
随着 JavaScript 的快速发展,目前它已然成为最流行的编程语言之一,这背后正是 Web 的发展所推动的。但是随着 JavaScript 被广泛的应用,它也暴露了很多问题:
语法太灵活导致开发大型 Web 项目困难;
性能不能满足一些场景的需要;
这两大问题成为 JavaScript 头顶上的达摩克利斯之剑,危及着 JavaScript 更广泛的应用。
Brendan Eich 做梦也没想到,自己花了十天仓促设计出来的 JavaScript,一经推出就被广泛接受,获得了全世界范围内大量的用户使用。前人挖坑,后人来填。既然 JavaScript 已经成为了 Web 编程的事实标准,那么这两个亟待解决的问题势必将要被解决。
MS、Google、Mozilla 的探索
MS:TypeScript
第一个问题被著名开源软件大厂 MicroSoft 解决。
MicroSoft 集结了 C#的首席架构师以及 Delphi 和 Turbo Pascal 的创始人 Anders Hejlsberg 等明星整容,打造了 TypeScript。
TypeScript 它是 JavaScript 的一个严格超集,并添加了可选的静态类型和使用看起来像基于类的面向对象编程语法操作 Prototype。所以 TypeScript 可以这样理解:
MicroSoft 利用 TypeScript 这把锋利的武器打造了 VSCode 等史诗级项目,于是乎,第一把达摩克利斯之剑"语法太灵活导致开发大型 Web 项目困难"似乎已经被解决。
但是,由于 TypeScript 最终仍然是被编译成 JavaScript 在浏览器中执行,所以困扰着 JavaScript 开发者的性能问题,仍然没有被解决。
Google:V8
早在 2008 年,Google 就推出了自家的 JavaScript 引擎 V8,试图使用 JIT 技术提升 JavaScript 的执行速度,并且它真的做到了。
由于 JIT 技术的引入,V8 使得 Web 性能得到了数十倍的增长!
上图展示了 Chrome 的 v8 与 IE 的 Chakra benchmark 结果。具体的地址点我
既然性能得到了如此大的提升,那么 JavaScript 广为诟病的性能问题得到了解决吗?为啥 Web 性能还是被挑战?
单线程 -> 阻塞
Web 应用中,性能瓶颈大部分的原因已经不在 JavaScript,而在于 DOM。浏览器中通常会把 DOM 和 JavaScript 独立实现。下图展示了不同浏览器 DOM 和 JavaScript 的实现情况:
由于 Dom 渲染和 JavaScript 引擎是相对独立的,这两个模块相互访问的时候,都是通过接口访问。由于 JavaScript 单线程的特性,这种访问只能是单工的。
可以把 DOM 和 JavaScript 各自想象为一个岛屿,他们之间用桥梁连接,JavaScript 每次访问 DOM,都要经过这座桥,并交纳过桥费,访问的次数越多,费用就越高,因此,推荐的做法是尽可能减少过桥的次数,一直待在 JavaScript 岛上。为了达到这个目的,可以使用 Virtual Dom,Web Worker 来实现。这里就不再赘述。
JIT VS AOT,在重型计算面前仍然力不从心
刚才谈到,V8 引擎首次将 JIT 技术引入 JavaScript 当中,大幅提升了执行速度。那么首先我们需要理解什么是 JIT,以及 AOT。
AOT: Ahead-of-Time compilation
必须是强类型语言,编译在执行之前,编译直接生成 CPU 能够执行的二进制文件,执行时 CPU 不需要做任何编译操作,直接执行,性能最佳。
JIT: Just-in-Time compilation
没有编译环节。执行时根据上下文生成二进制汇编代码,灌入 CPU 执行。JIT 执行时,可以根据代码编译进行优化,代码运行时,不需要每次都翻译成二进制汇编代码,V8 就是这样优化 JavaScript 性能的。
由于 JavaScript 的动态语言类型已无法改变,所以只能采用 JIT 的形式对性能进行优化。
为了进一步 JIT 优化效率,继而提升 JavaScript 性能,浏览器鼻祖 Mozilla 推出了 asm.js。
Mozilla:asm.js
和 TypeScript 比较相似的是,asm.js 同样也是强类型的 JavaScript,但是他的语法则是 JavaScript 的子集,是为了 JIT 性能优化而专门打造的。
一段典型的 asm.js 代码如下:
可以看到,asm.js 使用了按位或 0 的操作,来声明 x 为整形。从而确保 JIT 在执行过程中尽快生成相应的二进制代码,不用再去根据上下文判断变量类型。
Mozilla 给出了 asm.js 的 benchmark:
asm.js To WebAssembly
自从 Mozilla 提出了 asm.js,Google、MicroSoft、Apple 都觉得 asm.js 的思路不错,于是联合起来,一同共建 WebAssembly 生态。
同 asm.js 不同的是,WebAssembly 是一份字节码标准,以字节码的形式依赖虚拟机在浏览器中运行。
可以依赖 Emscripten 等编译器将 C++/Golang/Rust/Kotlin 等强类型语言编译成为 WebAssembly 字节码(.wasm 文件)。所以 WebAssembly 并不是 Assembly(汇编),它只是看起来像汇编而已。一份典型的.wasm 文件如下所示:
实战
环境搭建:编译 Emscripten
本次使用官方推荐的 CPP 语言编译成为 WebAssembly 文件,并在浏览器中执行。首先需要搭建 Emscripten 环境。Emscripten 被用于将 CPP 文件转换成为 WASM 字节码文件。
常规的搭建流程十分繁琐:
不过,早有好心人为我们准备了捷径:使用 Docker 镜像,快速开启你的 WebAssembly 之路吧。只需要以下几步:
编译 CPP 的 MD5 函数至 WASM
首先需要找到一份计算 MD5 的 CPP 代码:
git@github.com:codenoid/md5-cpp.git
使用 emscripten.h 中的 EMSCRIPTEN_KEEPALIVE 宏,确保 emcc 编译器在编译时,不会因为该函数没有被调用而优化掉这个函数。
这里 uint8_t* 被隐式类型转换为 char*
使用 emcc 编译 CPP 文件至 WASM 文件:
-O3: 优化级别,O3 是最高优化级别
-s WASM=1:生成 wasm 代码,而不是 asm.js 代码
-s EXTRA_EXPORTED_RUNTIME_METHODS=‘[“cwrap”]‘:在 JavaScript 中使用 cwrap 函数引用导出函数
最后会生成 a.out.js 和 a.out.wasm 两个文件。分别是 WASM 和 JavaScript 交互的胶水文件以及 WebAssembly 字节码文件。
计算 md5 并输出结果:
这里有两点需要注意:
a.out.js 会自动 fetch wasm 文件,由于获取 wasm 文件也存在跨域的情况,可以使用 http-server 本地起一个 sever。
CPP 的变量类型以及 JavaScript 的变量类型需要进行转换,转换由胶水代码自动执行,具体的转换规则如下:
benchmark
既然 WebAssembly 主打性能提升,那么 benchmark 就必不可少啦,针对"ivweb"短字符加密 100000 次,benchmark 的结果如下:
可以看到 WebAssembly 相较于纯 JavaScript,计算性能大约提升了 39%,这与普遍的 100%+的性能提升有着较大差距。这是为什么呢?
我又对 2M 的长文本进行 benchmark 对比,结果如下:
这一次的提升就比较大了。是什么造成了如此大的差距呢?我猜测有两点原因:
对"ivweb"短字符加密 100000 次时,JIT 优化介入后,不需要每次都去编译,JavasScript 性能得到了极大提升。
对"ivweb"短字符加密 100000 次时,胶水代码执行次数较多,拖慢了性能。
针对与以上两点猜测,又做了一组 benchmark,加密“ivweb”5000000 次
可以看到 WebAssembly 与纯粹的 JavaScript 性能差距已经不大了,验证了我的猜想。
本次 benchmark 代码我已经上传到 GitHub 仓库中:
git@github.com:PeacefulLion/wasm-benchmark.git
启示
鉴于 V8 的强大性能,90%的应用场景下你不需要 WebAssembly.
启示:如何提高 JS 代码性能?
声明变量时提供默认类型,加快 JIT 介入
不要轻易改变变量的类型
Node.js 像 JAVA 一样也存在 JIT 预热?
总结与展望
现在的 WebAssembly 还并不完美。但是线程的支持,异常处理,垃圾收集,尾调用优化等,都已经加入 WebAssembly 的计划列表中了。
将来,WebAssembly 能够被用于:
扩展浏览器端视音频处理能力(H.265)
基于 WebAssembly 的高性能 Web 应用(加密、游戏、挖矿?)
目前 Webpack4 已经支持 import wasm 文件的形式调用 wasm 文件。
未来,WebAssembly 将可能直接通过 HTML 标签进行引用,比如:
或者可以通过 JavaScript ES6 模块的方式引用,比如:
资源分享
一个 WebAssembly 包管理器
在线 CPP 转 WASM
评论