阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

基础为零?如何将 C++ 编译成 WebAssembly(一)

  • 2019-12-16
  • 本文字数:2148 字

    阅读完需:约 7 分钟

基础为零?如何将 C++ 编译成 WebAssembly(一)


本文知识点提炼:

1、如何使用 Emscripten 把 C++ 编译成 wasm。

2、如何使用 wasi-sdk 把 C++ 编译成 wasm。

3、如何运行编译好的 wasm 包。


WebAssembly 是一个 W3C 推出的二进制指令格式,近日它的 1.0 版本也正式定稿成为了规范,关于它的基本概念这里不再展开介绍了,网上已经有很多文章了,大家可以自行了解,推荐阅读官方文档①、spec 仓库②、MDN 的教程③、以及 Lin Clark 的文章④,其他随意。


能编译成 wasm 的语言有很多,C++ 和 Rust 是其中两个比较成熟而且大量被使用的,本文以 C++ 为例,一步一步介绍如何把 C++ 代码编译成 wasm 并且运行起来。例子很简单,相信不了解 C/C++ 开发的同学也能看懂。


说是 C++ 其实本文用到的代码都是纯 C 的。


文章用到的源码和编译脚本都在: https://github.com/Hanks10100/cpp2wasm


Hello World!


首先,我们来编译一个 C 语言的 Hello World,创建一个 hello.c 文件:


#include <stdio.h>
int main() { printf("Hello World!\n"); return 0;}
复制代码

▐ 编译成可执行文件

代码就是输出了一句 Hello World! ,使用 clang 或 gcc 或很多工具都可以把这段代码编译成可执行的二进制,找不到命令的话,可以在网上找教程配置一下。以 clang 为例:


clang hello.c -O3 -o out/hello
复制代码


-O3 表示了优化级别, 生成的可执行文件是 hello ,但是这个文件只能在特定平台上执行,在 windows 上编译出来的文件没办法跑在 mac 上(不绝对),在 32 位系统编译出来的文件无法跑在 64 位系统上。


然而如果把它编译成 wasm 就可以跨平台分发了,这也是 wasm 的一大优势。只需要编译一次,同一个 wasm 包,可以运行在浏览器中、Node.js 中、各种独立的 runtime 里,但是要求目标平台具备执行 wasm 包的能力,而且符合规范。

▐ WebAssembly 的编译和运行流程

在编译 WebAssembly 之前先了解一下它基本的编译和运行流程,想要以何种方式运行 wasm 的包,决定了以何种方式来编译它。


目前来看,大部分使用 WebAssembly 的例子都是运行在浏览器中的,有一部分运行在 Node.js 里,和 JS 的渊源很深,因为在标准里定义了一套 JS API 来编译、实例化 wasm 文件,这部分 API 已经被 JS 引擎实现了,功能已经稳定可用。因此,wasm 最常见的是搭配 js 一起使用,这种场景下用 Emscripten ⑤ 可以搞定,它在编译 wasm 包的同时也会生成一份 js “glue” 代码,把 wasm 包的初始化接口导入导出都封装在 js 里了,使用时引入这个 js 文件即可。


Emscripten 也支持编译成独立的 wasm 包(不含 JS),但是想要运行这个 wasm 包需要宿主环境给它注入很多基础的 API,而且这些  API 是非标准的。如果想在 JS 环境里运行独立 wasm 包的话,要用 JS 实现这些 API。
复制代码


其实 WebAssembly 本质上和 JS 无关,完全可以运行在独立的沙箱环境里,通过标准化的 API (wasi ⑥) 来调用系统能力。现在已经有不少 wasm 的独立运行时了,如 Wasmtime ⑦ 和 wasm-micro-runtime ⑧,它们都可以加载并独立执行 wasm 文件,并且实现了一致的 wasi 接口。


关于 wasi,推荐阅读《Standardizing WASI: A system interface to run WebAssembly outside the web》


https://hacks.mozilla.org/2019/03/standardizing-wasi-a-webassembly-system-interface/



如上图所示,面对自己的 C/C++ 代码,想要把它运行在浏览器或 Node.js 中,就使用 Emscripten 把它编译成 wasm + js 文件;想要把它运行在独立的运行时里,就使用 wasi-sdk ⑨ 进行编译,生成单独的 wasm 包。(此结论简单粗暴,为了方便理解,并不严谨)

▐ 使用 Emscripten 编译

首先安装官方文档安装 Emscripten (https://emscripten.org/) ,安装完成后命令行环境里会有 emcc 命令,使用方式和 gcc 差不多,执行如下代码就可以生成 wasm 的包:


emcc hello.c -O3 -o out/hello-emcc.wasm
复制代码


但是,上面这个命令隐含了 -s STANDALONE_WASM 的配置 ,实际上触发的是 WebAssembly Standalone build ⑩,只生成了一个 wasm 的包,需要自己写 loader 加载和执行。如果不想费这个劲,就可以使用如下命令直接生成 wasm + js 文件:


emcc hello.c -O3 -o out/hello-emcc.js
复制代码


该命令除了生成 js 文件以外,还会生成同名的 hello-emcc.wasm 文件,可以使用 WABT ⑪ (WebAssembly Binary Toolkit) 提供的小工具把 wasm 文件转成对等的文本格式,方便阅读。


wasm2wat out/hello-emcc.wasm -o out/hello-emcc.wat
复制代码


代码比较短,但是生成出来的 wasm 文件有 2.1KB,js 文件 16KB,主要是因为 stdio.h 头文件里有很多依赖,在运行时是由 js 代码来实现的。用 wasm 做 io 本身也不是个好的用法。


最后,直接在 Node.js 环境里执行这个 js 文件就行了,可以看到控制台输出了 Hello World! 。


node out/hello-emcc.js

▐ 使用 wasi-sdk 编译

首先根据自己的系统下载相应的 wasi-sdk ,配置好环境变量之后,就可以调用其中自带的 clang 工具编译生成 wasm 文件:


clang hello.c -O3 -o out/hello-wasi.wasm
复制代码


大概率跑不通…… 因为要配各种环境变量还要指定 sysroot 才行。假如你下载的是 8.0 版本,放到了个人目录之下,可以用下面这个命令编译代码,不需要配置环境变量:


~/wasi-sdk-8.0/bin/clang --sysroot ~/wasi-sdk-8.0/share/wasi-sysroot
复制代码


本文转载自淘系技术公众号。


原文链接:https://mp.weixin.qq.com/s/XrOHuoJB4vwkozBDI4t1yA


2019-12-16 18:291561

评论

发布
暂无评论
发现更多内容

碉堡了!阿里架构师手打的Java10W字面经,已经助我拿了6个offer

Java java面试 Java八股文 Java面试题 Java面试八股文

NLP 入门导论

小付聊测试

AI 入门 nlp

华为数据中心产业论坛 | 打造低碳、绿色数据中心,构建新型数字产业能源基础设施

极客天地

一文看懂THD布局要求

华秋PCB

PCB 布局 PCB设计 布线 波峰焊

如何简单快捷的使用上ChatGPT?

Ricky

人工智能 openai ChatGPT

华为云云原生视窗:一文回顾Q1精彩瞬间

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

时序数据库中的乱序问题-写不动的老程序员带你解读

Greptime 格睿科技

云原生 时序数据库 国产时序数据库 乱序数据

分库分表的 21 条法则,hold 住!

小小怪下士

Java MySQL 程序员 分库分表

低代码开发平台 重塑数字医疗生产力

力软低代码开发平台

Amazon EKS 上有状态服务启用存储加密

亚马逊云科技 (Amazon Web Services)

亚马逊云科技

从可逆计算看声明式编程

canonical

开源 低代码 声明式 命令式

我以为我对Mysql很熟,直到遇到了阿里这份笔记

Java MySQL 数据库

创建各种类型的3D模型:Rhino 7中文激活版

真大的脸盆

Mac Mac 软件 三维建模 建模软件 3d建模

行业实践专栏上线|互娱领域专家解读 Flink 企业应用实践

Apache Flink

大数据 flink 实时计算

飞桨EasyDL月刊:4月功能全新升级,模型训练步骤缩短63%

飞桨PaddlePaddle

飞桨 EasyDL

软件测试 | 安装PyMySQL

测吧(北京)科技有限公司

openEuler 成功适配 LeapFive InFive Poros 开发板

openEuler

Linux 操作系统 openEuler 开发板 risc-v

一图看懂一体化数据安全平台 uDSP

原点安全

数据治理 数据安全 数据安全法 信息泄露 个人信息安全

明道云开放日上海站开启报名

明道云

山东移动:全业务域核心系统升级,实现大幅降本增效

OceanBase 数据库

数据库 oceanbase

阿里大佬在Github分享的Spring Cloud全栈笔记,你想象不到有多全

Java 架构 微服务 Spring Cloud

软件测试 | 配置MySQL

测吧(北京)科技有限公司

测试

手把手教你用代码画架构图 | 京东云技术团队

京东科技开发者

京东云 代码实现 企业号 5 月 PK 榜 C4

Difference between from DR4019 and DR4029 /industrial wifi5 router/support openwrt.

Cindy-wallys

IPQ4019 ipq4029

软件测试 | SQLite管理工具

测吧(北京)科技有限公司

测试

共享电动车制造的厂家有哪些?要注意什么

共享电单车厂家

共享电动车厂家 共享电单车生产 共享电动车制造 本铯电动车厂家

MySQL的varchar存储原理:InnoDB记录存储结构

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

MatrixGate 5.0 性能再升级,加载速度提升三倍!

YMatrix 超融合数据库

数据库 开源数据库 超融合数据库

深入理解 synchronized 的锁升级

Java synchronized 锁升级

一周狂赚50万,GPT-4帮你在线“脱单”,AI女友按分钟收费,男友高达数量1000+

加入高科技仿生人

人工智能 AI 低代码 ChatGPT GPT-4

基础为零?如何将 C++ 编译成 WebAssembly(一)_文化 & 方法_张翰(门柳)_InfoQ精选文章