写点什么

Facebook 是如何收集其 Android 应用性能数据的

  • 2015-11-02
  • 本文字数:2068 字

    阅读完需:约 7 分钟

Facebook 一直致力于不断提高 Android 应用的运行速度。虽然他们内部已经有类似 CTScan 这样的性能跟踪系统,但 Android 生态系统的多样性使他们无法在实验室中测试每一种可能。因此,他们希望通过遥测技术从人们真实使用的 Android 手机中收集性能信息来补充测试数据。近日,Facebook 工程师 Delyan Kratunov撰文介绍了他们收集 Android 应用远程性能检测数据的方法。

很长一段时间以来,遥测技术都仅限于费力地插入代码,标识动作的起点和终点。这种方法有诸多弊端:

  • 开发者插入的检测点限制了遥测数据的详细程度,并导致这种方法只能检测可以预见的性能影响;
  • Android 应用的多线程特点以及用户交互的高度异步特点导致很难彻底检测代码;
  • 代码的快速变化会导致已有的检测标记出现“位衰减”。

同时,Delyan 还指出,他们也不希望使用下面这两种方法:

  • 使用 Android 内置的性能检测方法:Dalvik 和 ART 都提供了可以从“Debug”类调用的、方法级的性能分析器。这些方法可以编程触发,输出结果保存在开发人员指定的文件中。但是他们发现,startMethodTracing 方法开销很大。更糟糕的是,在某些 Android 版本中,该方法会禁用 Dalvik 的 JIT 编译器,进一步降低应用性能。总之,该工具会扭曲检测数据。
  • 大幅增加手工插入的检测点:手动插入性能检测点非常耗时且容易出错。工程师的时间不应该花费在可以自动化的事情上。而且,在一个不断变化的代码库中,确保这类检测点的正确性需要做大量的工作。

他们所采用的方法,灵感来自于该领域先前的研究,核心是一个基于规则的字节码重写器(基于 ASM 库)。该重写器可以匹配代码位置,然后插入或操作代码。就是说,在 Java 代码经 javac 编译成 Java 虚拟机字节码之后,但是在传递给 dx 转换成 Dalvik VM 格式之前,它会介入修改 JVM 字节码。

作为构建系统的一部分,该字节码重写器会在 Android 应用的全部 Java 字节码上运行,执行少数几个简单的转换,产生大量发生过重写的代码位置。例如,下面的规则将在特定方法的入口和出口处插入代码:

复制代码
new EntryExitRule.Builder()
.setMatcherConfiguration(
subclassesOf(
getObjectType("android/app/Activity")
).withMethods(
getMethod("void onCreate(android.os.Bundle)"),
getMethod("void onRestart()"),
getMethod("void onStart()"),
getMethod("void onResume()"),
getMethod("void onPause()"),
getMethod("void onStop()"),
getMethod("void onDestroy()")))
.setDetourType(LOG_UTILS_TYPE)
.setDetourMethodEntry(LOG_METHOD_ACTIVITY_START)
.setDetourMethodExit(LOG_METHOD_ACTIVITY_END)
.setCategory(Categories.LIFECYCLE)
.build()

在运行时,这些方法会在日志中记录一个或多个检测事件,并且,这些事件可以组合到一个单独的跟踪文件中。他们的检测粒度是框架调用和回调层。就是说,检测应用如何同 Android 框架交互以及框架反过来如何调用应用。这非常有用,因为应用组件不同生命周期之间的交互对运行时性能有重大影响。而且,由于检测点插入是自动完成的,所以无需担心代码变化会影响检测点。

在字节码中插入检测点还有一个好处,就是让他们能够透明地处理异步跟踪。也就是说,他们可以在线程之间自动传递足够的上下文信息。这样,他们就能将逻辑控制流串连起来。例如,下面的规则是检测Handler API 的:

复制代码
RedirectionRule.builder()
.setMatcherConfiguration(
subclassesOf(
getObjectType("android/os/Handler")
).withMethods(
getMethod("boolean post(Runnable)"),
getMethod("boolean postAtFrontOfQueue(Runnable)"),
getMethod("boolean postAtTime(Runnable, Object, long)"),
getMethod("boolean postAtTime(Runnable, long)"),
getMethod("boolean postDelayed(Runnable, long)"),
getMethod("void removeCallbacks(Runnable)")))
.setDetourClass("com/facebook/tools/dextr/runtime/detour/HandlerDetour")
.setCategory(Categories.ASYNC)
.build()
{1}

虽然有无数种在线程之间切换控制的方法,但实际上,一个很小的规则集合就可以覆盖应用中大多数异步代码。总的来说,这种跨线程跟踪能力让他们对应用执行流程有了更深入的了解,可以暴露出一些难以捉摸的性能缺陷,如调度延迟和不必要的异步跳转。

此外,在实现该方法的过程中,他们还遇到了其它一些需要克服的问题。比如,仅使用基本数据类型。当字节码重写器操作应用代码时,它会在每个代码位置插入一个唯一标识。在应用构建时,它会生成一个标识与代码位置的映射。在运行时,他们只记录 32 位的整型标识,然后在服务器端转换成代码位置。这样,事件大小就可以固定,而且非常小。同时,这也缩小了跟踪文件,减少了运行时开销。此处仅举一例,更多信息请查看原文


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者)。

2015-11-02 18:003269
用户头像

发布了 1008 篇内容, 共 392.7 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

无常中的僵硬与柔软

zhoo299

随笔杂谈 教育 生命 5月日更

鸿蒙系统之Codelab布局组件尝鲜

liuzhen007

华为 鸿蒙 5月日更

Golang 工作区和 GOPATH

escray

学习 极客时间 Go 语言 5月日更

声网、新东方、伴鱼英语的音视频技术解读

Jessie

音视频 视频消音

给Java小白,整理一套能上手的简单编程算法题!!!

小傅哥

Java 程序员 数据结构 算法 小傅哥

华为云官网负责人明哥:我们是如何做到门面不倒,8个月挑战业界翘楚?

华为云开发者联盟

JavaScript node.js Serverless 云原生 大前端

OLAP计算引擎怎么选?

数据社

大数据 OLAP 5月日更

Python自动打印文件

IT蜗壳-Tango

IT蜗壳教学 5月日更

找Matlab代码,看这一篇就够了

攻城先森

matlab 工具分享 5月日更

追寻软件定义的梦想汽车

车骑

自动驾驶 智能汽车 软件定义汽车 汽车制造

VMWare中Ubuntu网络配置

进击的梦清

Linux 运维 vmware 网络配置

网络攻防学习笔记 Day12

穿过生命散发芬芳

5月日更 网络攻防

kotlin基础

ES_her0

5月日更

精选面试题教你应对高级iOS开发面试官(提供底层进阶规划蓝图)

程序员 移动开发 ios开发

cri-o 技术探秘2

xumc

不忘过去,不畏将来

小天同学

5月日更 汶川地震 不忘过去

深度剖析 | 关于数据锁定和读取一致性问题

VoltDB

数据库 数据分析 5G

xSocket框架接入需实现的接口

风翱

xSocket 5月日更

如何让消息队列达到最大吞吐量?

万俊峰Kevin

微服务 消息队列 Queue Go 语言

【LeetCode】停在原地的方案数Java题解

Albert

算法 LeetCode 5月日更

算法训练营 - 学习笔记 - 第六周

心在飞

零基础学习 NLP-DAY3

Qien Z.

动态规划 nlp 5月日更

「学习笔记」《02 | 第一个程序:教你输出彩色的文字》之二

Nydia

学习

Dubbo 本地调用

青年IT男

dubbo

一文带你读懂PyQt:用Python做出与C++一样的GUI界面应用程序

老猿Python

ThreadLocal不好用?那是你没用对!

王磊

Java 后端 多线程 ThreadLocal 5月日更

Python 包管理

若尘

Package Python编程 5月日更

作为最好用的可观测平台,如何监控 Grafana

耳东@Erdong

Grafana Prometheus 5月日更

怎样做好服务提供方

程序员架构进阶

架构设计原则 服务化 28天写作 5月日更

Arthas-技术专题-使用指南

洛神灬殇

Arthas 5月日更

最近又有出什么新电影,要不要停泊片刻,与好友相约一起来去看呢?

叶小鍵

Facebook是如何收集其Android应用性能数据的_Meta_谢丽_InfoQ精选文章