写点什么

Unladen Swallow 的最后时光

  • 2011-04-02
  • 本文字数:1524 字

    阅读完需:约 5 分钟

unladen swallow 尝试将 LLVM 优化引入到 CPython 运行时,但是去年却没有取得重大进展。现在,一篇回顾unladen swallow 的文章已经确认了这个项目的死亡,不会再进行开发。

它的目标曾经是多么野心勃勃;引入 LLVM 运行时架构作为 CPython 的解释器,然后将其作为一个选项,能够在 JIT 编译的时候打开。LLVM 被用在一些高端项目中,例如全新的 Clang 模块编译器以及 LLDB 调试器,这些都在 Apple 的 Xcode4 中被采用。这些高端用户案例看起来非常诱人:

最开始选择使用 LLVM 是因为那个时候我们都没用 x86 汇编语言的丰富经验,而我们又真的希望能够支持 x86 和 x86_64,如果可能的话,将来也希望支持 ARM 架构。我们也坚信 LLVM 是一个更加健壮的 JIT,起码比现在看起来应该健壮很多。Apple 就在其产品中使用了 JIT 引擎,我们认为这是一个积极的信号,它表示 LLVM 也能够在我们的项目中很好工作。使用 LLVM 帮助我们很快地起步,但是它却很快成为了我们的负担,我们不得不在修复大量的对 JIT 进行支持的 bug 中结束我们的工作。不过它也给我们提供了诸多特性的支持,我们不需要开发新特性,但是我们也需要时间来做这件里程碑式的工作。

众所周知,编译器工具链是非常难以做到完美无 bug 的;最近有一篇论文的主题就是寻找和理解 C 编译器 bug ,它展示了一些在工具链不断开发和完善的过程中发现的非常著名的 bug。不过,unladen swallow 的这些问题却和这篇论文关系不大,它更多和例如 Python 这些解释性语言本身的性质相关,而不是单纯的代码问题:

不幸的是,从设计之初,LLVM 就是被作为一个静态编译器,优化器以及后端。LLVM 的代码生成和优化功能非常优秀,但是开销非常昂贵。这些优化都是着力于类似于 C 这样的静态语言生成的中间表示。而大多数对 Python 的优化却需要更高层的知识,例如程序在前一个迭代中是如何执行的,LLVM 并不能在此发挥作用。

在 JVMJIT 中使用的很多优化技术都需要了解程序是如何运行的,这样才能更好地在数据收集之后执行后续 JIT 操作。这个功能的最大好处就是方法调用的内联化;但是,我们也要明白 JVM 并不能够在程序执行前静态地完成这项工作,相反,一些其他的优化技术简化代码直到产生内联方法。例如运行一个基于 Python 的 JIT,那么将函数调用内联化将是一个加速性能的非常关键的技术,这些同样需要一些时间来将这个技术加入到 LLVM 架构中。

(值得提及的是,LLVM 现在正在进行更强大的随机测试,这个消息是在2010 年11 月的LLVM 开发者大会上宣布的)

但是,这些对unladen swallow 都无济于事。也许问题可能出现在资助上;大多数Python 的用户都不会在性能要求非常严格的任务中使用Python,所以优化并不会太多。其次,CPython 的关键开发者们对于LLVM 和产生的结果兴趣寥寥,甚至有可能在默认选项中禁用并且在未来放弃这个功能。

VMKit 的目的是在 LLVM 运行时上构建高层语言,它的特性包括对象支持,自动内存管理,不过这个工具是服务于 Java 或者.NET 运行时。

unladen swallow 小组现在将所有的精力转到 PyPy 上。这个是另外一个 Python 运行时,它自定义了 JIT 以加速执行效率。Python 提速需要考虑的问题之一便是并不是所有的代码都是“纯”Python;有许多原生扩展是使用 C 编写,这就需要妥善处理。(使用 Java 实现的 Python 运行时,Jython 就不直接支持 CPython 中利用 C 实现的特性,而是会使用 Java 重新实现)但是和其他解释语言一样,也许最影响执行效率的便是全局解释锁,它阻碍了多线程 Python 代码的运行。很不幸的是,PyPy 或者 unladen swallow 都不能改变这个现实。

LLVM2.9 预计于下周发布。不过这并不代表着其他的项目,例如 Rubinius ,将会使用 LLVM 作为运行时引擎。

查看英文原文: The Last Flight of the Unladen Swallow

2011-04-02 11:502577
用户头像

发布了 90 篇内容, 共 34.4 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

基于 Flink 流计算实现的股票交易实时资产应用

Apache Flink

大数据 flink 实时计算

GitHub上线重量级分布式事务笔记,再也不怕面试官问分布式了

小小怪下士

Java 程序员 分布式 分布式事务 后端

AI+人类,实现高效网络安全

HummerCloud

人工智能 网络安全

研讨会回顾 | Perforce发布数字资产管理工具Helix DAM,帮助您按时按预算交付虚拟产品

龙智—DevSecOps解决方案

版本控制 数字资产 游戏开发 数字资产管理 芯片研发

CI/CD | 不可忽略的Jenkins基础架构修复问题

龙智—DevSecOps解决方案

ci cicd jenkins CI/CD CloudBees

课程作业及比赛任务,已支持 Notebook 内直接提交|ModelWhale 版本更新

ModelWhale

人工智能 机器学习 数据分析 canvas 模型管理

DBT 收购 Transform,指标平台已成现代数据栈关键拼图

Kyligence

数据分析 指标管理

基于Mindspore2.0的GPT2预训练模型迁移教程

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 3 月 PK 榜

CleanMyMac4.20汉化免费版Mac清理工具

茶色酒

CleanMyMac4.20

Atlassian Server用户新选择 | 云版和本地部署的数据中心版,总有一个适合您

龙智—DevSecOps解决方案

迁移 Server Atlassian

AI脸部美容,一键让你变瘦变美变老变年轻

极客飞兔

php Python AI PaddleGAN 人脸编辑

MQTT 5.0连接属性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 连接属性

Oracle ASM磁盘组配置、日常运维、故障处理等操作资料汇总

墨天轮

数据库 oracle asm 磁盘管理

vivo全球商城:库存系统架构设计与实践

vivo互联网技术

系统架构 电商 库存

Stable Diffusion原理详解

jarodyv

人工智能 机器学习 计算机视觉 Stable Diffusion 生成式AI

云图说丨Astro Canvas一站式数据可视化开发,分钟级构建业务大屏

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

DTO、VO、BO、PO、DO的用法区别,居然这么多人搞不清楚.....

程序知音

思码逸任晶磊:ChatGPT 时代的软件研发数据与效能提升

思码逸研发效能

机器学习 研发效能 ChatGPT

详解命令模式本质及其在高复杂调用中的实践案例

阿里技术

设计模式 命令模式

从代理机制到Spring AOP,这篇给你安排得明明白白的

做梦都在改BUG

Java spring aop 代理机制

FL Studio21最新版DAW数字音频工作站

茶色酒

FL Studio FL Studio 21

“鼎新杯”案例精选 | 中国联通数字化研发低代码平台为一线赋能

信通院IOMM数字化转型团队

低代码 数字化转型 中国联通

关于加解密、加签验签的那些事 | 得物技术

得物技术

java

你没有必要完全辞去工作

宇宙之一粟

创业 个人成长 思维方式 工作 打工人

数据标注工具,多维度体验优化|ModelWhale 版本更新

ModelWhale

人工智能 标注 标注工具 团队协同 模型管理

从“13天”到“0天”延时,揭秘火山引擎DataLeap SLA保障最佳实践

字节跳动数据平台

大数据 数据治理 数据研发 企业号 3 月 PK 榜

隔离级别+事务+连接池+锁

hasWhere

代码质量与安全 | SAST与DAST有什么区别?

龙智—DevSecOps解决方案

klocwork SAST DAST 静态应用程序安全测试 动态应用程序安全测试

首届玄铁 RISC-V 生态大会上海举办 龙蜥操作系统持续深度参与标准共建

OpenAnolis小助手

芯片 risc-v 龙蜥操作系统 平头哥 生态大会

柏拉图会反对ChatGPT吗?~深度好文| 社区征文

李韧

人工智能 ChatGPT

联合解决方案 | 亚信科技AntDB数据库携手浪潮K1 Power赋能关键行业数字化转型,助力新基建

亚信AntDB数据库

数据库 AntDB 国产数据库 AntDB数据库 企业号 3 月 PK 榜

Unladen Swallow的最后时光_Java_Alex Blewitt_InfoQ精选文章