写点什么

在 V8 引擎中实现后台编译所需应对的挑战

  • 2014-02-18
  • 本文字数:2219 字

    阅读完需:约 7 分钟

对于最近 Chrome V8 JavaScript 引擎中引入的后台编译,这篇文章探讨了其中的一些细节。

在 Google 浏览器 Chrome 的最新版本(Beta v.33)中, JavaScript V8 引擎方面具有一项重要的变化:引入了使用后台线程进行优化编译处理的能力,从而让主线程能够继续对用户保持响应并获得性能提升。据从事此工作的 Google 工程师 Yang Guo 透露, V8 将完成两种类型的编译

为了减少在编译方面消耗的整体时间,V8 将 JavaScript 函数的编译推迟,直到它们首次执行前才会进行此工作。这一编译阶段非常迅速,但是并不以优化代码为重点,而是聚焦于快速完成编译。在 V8 中,频繁运行的代码片段将得到第二次编译——由专用的优化编译器(Crankshaft)完成。在第二遍编译中,使用了许多高级优化技术,这意味着第二遍编译将比第一遍消耗更多的时间,但是其产出的代码运行起来更快。

Guo 介绍的,在使用 Nexus5 运行 Octane 2.0 基准测试套件中的 Mandreel 测试时,我们可以看到,通过由独立线程负责优化编译,应用不仅仅更加具有响应性,而且运行速度提高了 27%。

InfoQ 对 Chrome V.33 进行了一些测试,记录了分别使用(–js-flags="–concurrent-recompilation")或禁止(–js-flags="–no-concurrent-recompilation")并行重编译时的运行结果。对于 Octane 2.0 基准测试,我们观测到了以下性能提升(对连续 5 次测试的结果进行平均,且每次运行时都重新启动了浏览器):

测试

提升

Octane 2.0 (全部 17 项测试)

7.12%

Mandreel

18%

Box2DWeb

32%

zlib

11%

从上表可以看到,对于 Octane 基准测试套件整体的测试来说,性能提升了 7% 升;而在 2D 和 3D 引擎方面,提升则更为显著。 以确保我们知道他并不是为 Google 说好话(当时他尚未加入此团队),我们询问 Guo,为何在 2010 年 12 月发布 Crankshaft 时没有引入优化编译。Guo 表示,最新版本中增加的这些改进,都是源自实际的需求:

在设计 Crankshaft 的时候,延迟并不是很大的问题。考虑到当时 JavaScript 代码的大小,编译时间尚未成为显著的问题,因此低延迟既不算是问题,也不是 CrankShaft 的设计目标。在我看来,在那个时候引入并发,将令刚刚起步的优化编译器的设计,变得毫无必要的复杂;这将引入不成熟的优化,却不能带来任何即刻的好处。

显然,在最近几年中这一情况发生了变化。如果查看最新版本的 Octane 基准测试套件,我们将发现到某些代码的大小已经超过了 1MB。这反映出,现实世界里的一些应用正在推动 JavaScript 引擎逼近其极限。Mandreel 基准测试包含了 4.8MB 的压缩后的代码。为了让这一概念更直观,我们可以以 PhotoShop 1.0 版本为例,其源代码在解压缩后也只有 4.4MB 而已。“搅动”这个量级的代码将需要很多时间,特别是在执行例如动画渲染等工作(期望能够在一张眼间完成)时,这将成为显著的问题。

Guo 没有试图面面俱到地介绍后台编译,而是告诉我们,在 V8 中实现这一特性的过程中,他们所面对的一些挑战:

- 每位计算机科学家都会告诉我们,搞定多线程并不是件容易的事情;难以保证测试的良好覆盖;并发固有的不确定性行为,使 Bug 的重现变得困难,甚至可以说几乎不可能。拥有一套良好的测试用例,使用由断言包含的常量、模糊测试,并且最后很重要的是使用 Canary 测试覆盖。这些将帮助我们树立起对结果正确与否的信心。顺便说一下,在这里我要向 ThreadSanitizer 团队致敬。

- 当编译阻塞执行的时候,我们能够确信在编译前后,JavaScript 堆及以及其中全部对象的状态将保持一致。然而,面对并行编译,该假设不再成立。这将带来如下影响:

-V8 拥有一套负责重新部署的 GC,这意味着任何时候一旦 GC 发挥作用,对象们将被迁移。因此指向这些对象的引用必须得到更新。在执行编译任务的同时,很有可能发生这种情况。而如果编译任务所持有的对象,其引用未能得到更新,那么编译过程最终将内存访问失效的问题。

- 在进行并行编译时,执行仍将继续进行。这意味着虚拟机的状态、对象的内容以及布局将能够恣意改变。基于编译任务开始时的情况所做出的假设条件,或许在编译结束时将不再成立。甚至也许编译结束时产出的代码将不再有效。运行这些代码会引发 Bug 和崩溃。这一现象必须得到妥善处理。

- 实际上,允许后台线程在任何时候访问堆,会很容易引发竞争条件。我们通过提前为编译工作收集所有必要的信息来避免这一情况。

- 要想找到合适的时机启动后台线程中的编译任务,是一件非常棘手的事情:没有什么方法,能够准确预测是否值得在优化某个代码片段上投入时间,以及是否应该更早完成优化以从中受益。制定启发式解决方案来应对这个问题,则更加困难——必须进行许多精细的调整,而这项工作仍处于进行之中。

- 随着源代码片段即将经历的相互关联的状态——例如延迟解析,使用快速编译器进行第一遍编译,接下来由优化编译器进行优化,随后或许会进行“去优化”(deoptimized,如果在编译启动时所做的假设已经不在成立)等等——它的生命周期变得非常复杂。而由于并行编译的出现,这个生命周期中还增加了一些新的状态。对所有状态保持跟踪,确保在状态之间高效转移而不出 Bug,是件很复杂的工作。未经预料的极端情况可能会引发问题。

Guo 表示,“V8 正处于积极发展的阶段,并且正在稳步改进”。例如,大家可以在由 Dart 维护的实时性能图表格中看到,V8 的表现在 2 月 11 日运行的 DeltaBlue 基准测试出现了 30% 的飞跃——这一结果来自编译器本身的优化,而不是后台编译。

查看英文原文: Challenges Performing Background Compilation in V8

2014-02-18 18:492427
用户头像

发布了 256 篇内容, 共 81.1 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

【FAQ】HarmonyOS SDK 闭源开放能力 —Account Kit (6)

HarmonyOS SDK

harmoyos

Zenlayer 推出 AI 模型全球调用解决方案,破局企业部署三大挑战

极客天地

CST软件如何设置分布式计算(Distributed Computing)的 TCP-IP子网

思茂信息

cst操作 CST软件 CST Studio Suite

观测云产品更新 | 外部数据源、日志、监控、事件、基础设施等

观测云

如何使用龙蜥衍生版KOS,2步实现大模型训练环境部署

OpenAnolis小助手

AI 操作系统 龙蜥大讲堂

拼多多店铺订单列表,订单详情,订单物流接口指南

tbapi

拼多多API 拼多多店铺接口 拼多多店铺订单接口 拼多多店铺订单详情接口

建筑矿山设备工厂与 MyEMS 能源管理系统深度应用白皮书

开源能源管理系统

开源 能源管理 节能减排 工厂安全生产

Cursor 如何保障「代码索引」的安全、高效

Baihai IDP

程序员 AI 智能体 cursor AI 编程

卓正医疗如何用 NocoBase 搭建“家庭医生式”服务体系?

NocoBase

开源 低代码 数字化转型 零代码 医疗行业

MES与ERP深度融合:数据报表、可视化大屏及系统集成技术详解

万界星空科技

制造业 mes ERP系统 万界星空科技mes AI低代码MES

国资委深化“AI+”专项行动 AI法务工具AlphaGPT赋能业务升级

科技汇

LED显示屏如何助力企业腾飞?

Dylan

数字 LED显示屏 全彩LED显示屏 户外LED显示屏 led显示屏厂家

区块链 Web3 项目的上线

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

领跑 AI 基础设施存储赛道!焱融科技实力登榜「AI Cloud 100 China」

焱融科技

文件存储 大模型 AI基础设施 2025 AI Cloud 100 China

三方系统集成(低代码)平台实践

vivo互联网技术

Java 架构 后端 低代码

WebGL 软件外包开发流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 RWA开发

科学智能:全球顶尖学者共聚复旦,共探科研范式变革新引擎

ModelWhale

科学智能 AI4S

香港校长团探访博大数据前海智算中心,科技赋能教育共育湾区数字人才

极客天地

Java程序员的职业加速器:飞算JavaAI一键生成完整工程代码,轻松应对开发挑战

猫头虎

Java 人工智能 AI编程 idea intellij

模块化电商解决方案

微擎应用市场

7月1日19点,ModelWhale 大模型应用平台全新升级!

ModelWhale

大模型 modelwhale

私有化部署 IM:即时通讯软件助力团队协作

BeeWorks

即时通讯 IM 私有化部署

咕泡AI课程专家团全拆解 | 技术答疑助你全周期通关!

咕泡科技

人工智能 AI 咕泡人工智能 咕泡ai

20~30K * 15薪,可惜挂了

王中阳Go

Java 面试

区块链 RWA 系统的上线

北京木奇移动技术有限公司

MyEMS开源能源管理系统v5.6.0发布通知

开源能源管理系统

开源 能源管理 开源能源管理

多端一体化教育解决方案

微擎应用市场

网易云信 x Doris:降本70%、提速11倍, 统一 ES/InfluxDB/Hive 多技术栈的落地实践

SelectDB

数据库 App ES Doris 网易云信

鸿蒙+星闪:一场“1+1>2”的音频蝶变

脑极体

AI

大模型成今年高考志愿神器,超千万用户使用百度AI志愿助手、高考大数据服务

科技大数据

多行业活动管理

微擎应用市场

在V8引擎中实现后台编译所需应对的挑战_Google_Abel Avram_InfoQ精选文章