写点什么

又一巨头从 Java 迁移到 Kotlin:关键应用全部开始切换、安卓代码库超过千万行 Kotlin 代码

  • 2022-10-27
    北京
  • 本文字数:3459 字

    阅读完需:约 11 分钟

又一巨头从Java迁移到Kotlin:关键应用全部开始切换、安卓代码库超过千万行Kotlin代码

Facebook 母公司 Meta 正在将其 Android 应用的 Java 代码迁移到 Kotlin。根据 Meta 的官方博客所述截至今天,其 Android 代码库已经有超过 1000 万行 Kotlin 代码,旗下包括 Facebook、Instagram、Messenger、Portal 和 Quest 在内的应用都已经开始从 Java 转向 Kotlin。

将代码库转换为 Kotlin

Kotlin 是一种更年轻的编程语言,也依赖于 Java 虚拟机。Kotlin 由软件工具制造商 JetBrains 创建,于 2011 年首次亮相,2016 年发布 1.0 版本。次年,它被 Google 采用为 Android 开发的一级语言,并由其基金会管理,该基金会由 JetBrains 和 Google 资助。


到 2019 的 Google I/O 大会,Google 正式宣布,Kotlin 编程语言已成为 Android 应用开发人员的首选语言,并在当年年底表示前 1000 个 Android 应用程序中有近 60% 包含 Kotlin 代码。


从 Google 自身来看,明面上它说自己选择 Kotlin 的理由是它更简洁、更安全、支持结构化并发,能更轻松地编写异步代码,并且可以与 Java 互操作。不过,另一个业界推测是可能跟那宗与 Oracle 旷日持久的 Java 侵权案有关—— Oracle 花了十多年的时间追究 Google 在 Android 中使用 Java API 的侵权索赔,最终 Oracle 败诉。


回到 Meta,Facebook 软件工程师 Omer Strulovich 对选择 Kotlin 如此解释道:“Kotlin 通常被认为是一种比 Java 更好的语言,在年度 Stack Overflow 开发人员调查中,其受欢迎程度高于 Java,”他还指出,由于近年来 Kotlin 已成为 Android 开发的流行语言,“因此,在努力使我们的开发工作流程更加高效的过程中,我们在 Meta 的安卓开发中转向 Kotlin 是非常合理的……”


除了受欢迎之外,Meta 认为 Kotlin 拥有的主要优势包括可空性、函数式编程、代码更短、以及领域特定语言(DSL)等等。


不过,Strulovich 指出,过渡到 Kotlin 也有一些不可忽视的缺点,比如混合代码库可能难以维护,以及 Kotlin 虽然流行,但与 Java 相比还是有比较大的差距,工具集还不够成熟。所有 Kotlin 工具都需要考虑 Kotlin 和 Java 的互操作性,这使得它们的实现变得复杂。


但 Meta 最大的担忧还是构建时间。“我们从一开始就知道 Kotlin 的构建时间会比 Java 的要长。该语言及其生态系统更加复杂,Java 在优化其编译器方面领先了 20 年。由于我们拥有多个大型应用程序,较长的构建时间可能会对我们的开发人员体验产生负面影响。”

为什么不只用 Kotlin 来写新代码

Strulovich 没有透露 Meta 何时开始这种转变。Meta 本来可以选择只用 Kotlin 编写新代码,但它最终还是决定将所有的 Android 应用程序都转换过来。


根据 Strulovich 的说法,如果是只使用 Kotlin 来编写新代码,继续保留大部分现有 Java 代码的话,工作量明显更低,但相应的也有两个缺点:首先就是要在 Kotlin 和 Java 代码之间实现互操作性,就需要引入 Kotlin 中的 platform 类型。Platform 类型会导致运行时中的空指针取消引用,进而引发崩溃,这就破坏了纯 Kotlin 代码提供的静态安全优势。在某些复杂情况下,Kotlin 的空检查省略可能会漏掉空值,意外引发空指针异常。例如,如果 Kotlin 代码调用由 Java 接口实现的 Kotlin 接口,就会发生这种情况。其他的问题还包括 Java 无法将类型参数标记为可空(最近才刚刚修复);Kotlin 的重载规则考虑到了可空性,Java 的重载规则却没有考虑到。


第二个缺点是,这种方式要求对 Meta 已经开发的大多数软件进行代码修改。如果继续把大部分代码保留为 Java 形式,那开发人员就没法充分发挥 Kotlin 的优势。

Kotlin 迁移大法

如今,Meta 旗下的 Android 版 Facebook、Messenger 和 Instagram 应用都拥有超过百万行 Kotlin 代码,而且转换率也一路走高。纵观整个 Android 代码库,其中的 Kotlin 代码量已经超过千万行。

起步阶段

事实上,在尝试为现有应用程序引入 Kotlin 时,Meta 遇到了不少麻烦。例如,团队得更新 Redex 才能支持 Java 无法生成的字节码模式。另外,其使用的某些内部库要求在编译期间进行字节码转换来获取更好的性能。而在将这些库纳入 Kotlin 编译过程时,这部分代码无法正常起效。为此,Meta 针对这些问题构建了专门的解决工具。


Meta 还发现,现有工具之间存在不少冲突。例如,代码审查和 wiki 工具无法对 Kotlin 语法进行高亮显示。“我们还更新了之前使用的 Pygments 库,确保其体验与处理 Java 代码时一致。我们更新了一些内部代码修改工具,使其能够支持 Kotlin。我们也构建了 Ktfmt,一款基于 google-java-format 编码理念的确定性 Kotlin 格式化程序。”

迁移加速阶段

在工具准备齐全之后,Meta 现在已经能将代码中的任意部分转换为 Kotlin。但每次迁移都需要大量样板设计工作,只能由员工们手动完成。J2K 是一种通用工具,并不会去理解所转换的代码是在表达什么。因此,某些特定部分就只能进行手动调整。


最典型的例子就是 Junit 测试规则的使用。假设使用 ExpectedException 规则,来验证是否抛出了正确的异常:


@Rule public ExpectedException expectedException = ExpectedException.none();
复制代码


当 J2K 将这部分代码转换成 Kotlin 时,得到的就是:


@Rule var expectedException = ExpectedException.none()
复制代码


这段代码乍看之下与原先的 Java 代码等价,但由于 Kotlin 使用了 site 注解,所以其实际上等价于:


@Rule private ExpectedException expectedException = ExpectedException.none();
public ExpectedException getExpectedException() { return expectedException}
复制代码


尝试运行后,此测试会失败并返回一个错误:“The @Rule expectedException must be public”,这是因为 Junit 发现了一条带有 @Rule 注解的私有字段。这是个常见问题,论坛上面也已经有成熟答案:要么在字段中添加“@JvmField”;要么在注解中添加注解 use-site,也就是“@get:Rule”:


// 方案一:使用“get”作为注解的use-site@get:Rule var expectedException = ExpectedException.none()
// 方案二:只为没有getter的Java字段生成JVM代码@JvmField @Rule var expectedException = ExpectedException.none()
复制代码


由于 J2K 无法(可能也不应该)感知 JUnit 的复杂性,所以没能正确完成转换。但即使 JUnit 不存在这个问题,J2K 在处理其他小众框架的时候也肯定会掉类似的坑。


例如,很多 Android Java 代码会使用 android.text.TextUtils 中的实用方法,例如 isEmpty,来简化对某些字符串的检查。但在 Kotlin 中,其实是有内置的标准库方法 String.isNullOrEmpty 的。该方法之所以更好,是因为它能通过契约来告知 Kotlin 编译器如果它返回 false,则被测试的对象不得再为 null,并将其智能转换为 String。


Java 代码也有不少类似的辅助方法,也有很多库都实现了相同的基本方法。这一切都需要替换成标准的 Kotlin 方法,借此简化代码并保证编译器能正确检测出不可为空的类型。


Strulovich 表示,内部发现了许许多多类似的小小修复实例。有些难度不大(例如替换 isEmpty),有些则需要研究一番才能搞明白(例如 JUnit 规则)。还有一些其实属于 J2K 出的错,可能导致构建错误、运行时行为错乱等问题。


为了解决这些问题,Meta 团队将 J2K 转换流程划分成三个步骤:


  1. 首先,取一个 Java 包并准备将其转换为 Kotlin。这个步骤主要解决错误,并完成相应的内部工具转换。

  2. 第二步就是运行 J2K。团队已经能够以无头模式运行 Android Studio 并调用 J2K,由此将整个管道作为脚本来运行。

  3. 最后一步,对新的 Kotlin 文件进行后处理。具体包括大部分自动重构与修复步骤,例如将 JUnit 规则标记为 @JvmField。在此步骤中,团队还应用了自动更新 linter,并在无头模式下应用各种 Android Studio 建议。“当然,自动化并不足以解决所有问题,但至少能帮我们优先处理那些最常见的问题。”Strulovich 说。


在 Java 重构方面,Meta 使用的是 JavaASTParser 等工具,它能帮助解析某些类型。而在 Kotlin 这边,团队还没有找到能够解析类型的好办法,所以选择使用 Kotlin 编译器 API。


Meta 还发布了一组自动重构方法(https://github.com/fbsamples/kotlin_ast_tools)。虽然不是很多,但希望能帮助更多开发者利用 Kotlin 编译器解析器高效完成工作。

下一步

平均而言,Meta 发现迁移后的代码行数减少了 11%。尽管网上各种案例引用的数字往往要比这高得多,但他们还是对这个数字感到满意。


Strulovich 说,Meta 向 Kotlin 的迁移仍在进行中并在加速。“Kotlin 仍然缺乏一些我们在使用 Java 时已经习惯了的工具和优化,但我们正在努力缩小这些差距。随着我们取得的进展和这些工具和库的成熟,我们也将努力把它们反馈给社区。”


参考链接:

https://www.theregister.com/2022/10/25/meta_java_kotlin/

https://engineering.fb.com/2022/10/24/android/android-java-kotlin-migration/

2022-10-27 17:3718204

评论

发布
暂无评论
发现更多内容

5G+实时云渲染:交互实时云看车革新购车体验

3DCAT实时渲染

5G 汽车之家 汽车 元宇宙 实时云渲染

博云容器云产品族:如何实现让“Any APP on Any Kubernetes”?

BoCloud博云

云原生 容器云

龙蜥开发者说:不忘初心,方得始终 | 第 7 期

OpenAnolis小助手

开源 cpu 龙蜥开发者说 飞腾 不忘初心

【高并发】在高并发环境下该如何构建应用级缓存?

冰河

并发编程 多线程 高并发 异步编程 6月月更

数字先锋| 天翼云牵手中能融合

天翼云开发者社区

华为云GaussDB首席架构师冯柯:摘取皇冠上的明珠,华为云数据库的创新与探索

华为云开发者联盟

数据库 华为云 GaussDB 国产数据库

一篇文章带你彻底了解哈希表

武师叔

算法 哈希表 6月月更

应用流程挖掘,发现潜在RPA可实施的场景,助力银行优化业务流程

易观分析

RPA

科创人·神州数码集团CIO沈旸:最佳实践模式正在失灵,开源加速分布式创新

科创人

选择天翼云混合云管理平台的五大理由

天翼云开发者社区

玩转云端|一文读懂天翼云CDN升级重点

天翼云开发者社区

多模态语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型

Geek_a02d1e

机器学习 深度学习 开源 AI 多模态

天猫精灵语音技能单轮对话表达式的参数定义

汪子熙

人工智能 机器学习 聊天机器人 机器人 6月月更

撑算力之帆,天翼云助力数字时代逐潮者远航

天翼云开发者社区

Flutter 图片库重磅开源!

阿里巴巴终端技术

flutter 开源 native 客户端

当AI抄起了水表

华为云开发者联盟

人工智能 modelarts workflow 智能水务

InfoQ 极客传媒 15 周年庆征文|一文读懂分布式系统本质:高吞吐、高可用、可扩展

No Silver Bullet

架构 分布式系统 可扩展 6月月更 InfoQ极客传媒15周年庆

这个API文档,太拽了吧!

Liam

前端 Postman API API文档 开放api

函数节流和函数防抖和他们的区别

工边页字

JavaScript 性能优化 前端 6月月更

2022年中国新能源汽车换电市场发展洞察

易观分析

新能源汽车

【Spring 学习笔记(一)】第一个Spring程序与IoC思想

倔强的牛角

6月月更

使用 LakeSoul 构建实时机器学习样本库

Geek_a02d1e

机器学习 大数据 开源 新基建 湖仓一体

移动平台打造新生态 | 助力企业跨业务、一站式、全场景的系统建设

BeeWorks

【LeetCode】 删除二叉搜索树中的节点Java题解

Albert

LeetCode 6月月更

AI“爷青回”:一键找回童年记忆

最新动态

样品管理系统解决方案

低代码小观

Lims LIMS实验室信息管理系统 LIMS系统

【云服务器】云计算平台的架构是什么样的?

Finovy Cloud

云服务器 GPU服务器

直播回顾 | 7000字干货,深析区块链+汽车供应链金融的应用价值

旺链科技

区块链 产业区块链 供应链金融

leetcode 417. Pacific Atlantic Water Flow 太平洋大西洋水流问题

okokabcd

LeetCode 搜索 数据结构与算法

Java 中三大类数据类型

迷篱

哈希游戏开发竞猜系统哈希值hash算法

薇電13242772558

哈希算法

又一巨头从Java迁移到Kotlin:关键应用全部开始切换、安卓代码库超过千万行Kotlin代码_语言 & 开发_罗燕珊_InfoQ精选文章