抖音技术能力大揭密!钜惠大礼、深度体验,尽在火山引擎增长沙龙,就等你来! 立即报名>> 了解详情
写点什么

Jonah Kowall 谈应用性能监控与管理

2013 年 7 月 30 日

应用性能管理聚焦于监控和管理企业中运行的软件应用的性能及可用性。其目标是对应用的性能进行监控、分析和报告,以便 IT 团队能够快速识别和解决产品的问题,并保障服务质量(QoS)。

随着云计算技术的出现以及越来越多的商业服务被托管在云端,对一般应用的全部组件进行监控和管理变得尤为重要。Charles Babcock 近期撰文阐述了为何现在APM 系统变得十分重要。他提到,现代APM 系统应当具备以下能力:可视化应用及其依赖关系、编制统计数据、进行实时分析来检测异常并进行诊断以解决产品的问题。

Gartner 团队的 Jonah Kowall,去年联合编写了“魔力象限”报告中的应用性能监控部分。

InfoQ 就 APM 领域、技术和工具及该领域的新兴趋势对 Jonah 进行了采访。

InfoQ:应用性能管理(APM)不仅仅是监控应用和系统。能否讲讲理想的 APM 解决方案应该提供哪些特性?

Jonah:Gartner 使用一个五维模型来定义 APM,因为购买者的需求不同,可能用不着所有的维度。(对他们而言)解决方案满足这些维度的子集要比满足全部的维度更好。而在 APM 魔力象限中所列的产品,必须满足全部五个维度。具体维度如下:

  • 最终用户体验监控(EUM)——获取以下方面的数据:展示在最终用户面前的应用端到端可用性、延迟、执行正确性以及质量。
  • 应用拓扑的发现和可视化——发现应用执行过程中涉及的软硬件基础架构组件,以及它们之间可能的交互路径矩阵,上述内容实现了应用的交付。
  • 用户自定义的事务分析——跟踪组成事务的用户分组事件,它们发生在应用内部,并与第二个维度中发现的组件交互;(事务)是为了响应用户对应用的请求而生成的。
  • 应用组件深度挖掘——对第二个维度中所发现的组件(运行时应用架构发现)消耗的资源和其中发生的事件进行细粒度监控。这可能包括服务器端组件和客户端设备及接口。
  • IT 运营分析——结合或使用不同技术,在 APM 的前个四维度生成的典型大数据集里,发现有价值的、可行的模式,这些技术包括复杂的运营事件处理、统计模型发现和识别、非结构化文本索引、搜索和推断、拓扑分析,以及多维数据库搜索和分析。

InfoQ:云计算正在成为应用部署的热门方法。对云上运行的应用进行监控,与传统应用监控有什么不同?当使用混合云环境时又有什么不同?

Jonah:首先我们必须定义并理解公有云的三种类型:IaaS、PaaS 和 SaaS。大部分产品能够部署在可被远程连接的地方,包括 IaaS 或自有分布式数据中心。当你开始考虑 PaaS 和 SaaS 的时候,问题出现了,这些产品都是 PaaS 提供商整合后的产品。而解决方案通常都是通过 PaaS 提供商自己的 SaaS 服务提供,但那又不是必须的。当你考虑 SaaS 服务的监控问题时,会发现目前的产品非常有限。在 2013 年,这个领域将会出现革新,应该会有一些能够监控 SaaS 性能的解决方案出现在市场上。目前我们不得不使用综合测试,但它只能度量可用性而不是性能。

InfoQ:软件开发和管理领域中,另一个备受关注的分支是 DevOps。近期 APM 领域的潮流和革新如何帮助开发者和运营团队协同工作并在其组织内享有一个持续的性能监控环境?

Jonah:信息分享与协作是 DevOps 的两个关键领域,APM 为开发、业务和质量保证组织提供了数据。这些数据可被用于排解故障或回答其他问题。一些 APM 产品能够对不同的发行版本进行非常细粒度的性能比较,使(用户)能够在代码推出(Roll Out)时更好地理解代码的质量。APM 产品可用于开发、测试(性能及回归)和生产环境。大部分 Gartner 的客户倾向于主要在生产环境中使用 APM,但也会在代码生命周期的其他部分使用。这并不总是因为成本(尽管它是一个原因),这也反映了大部分 IT 组织的反应能力和“救火”(译注:指处理危机)成熟水平。

InfoQ:对应用和系统的监控会产生大量的数据,它们需要近乎于实时地解析和分析,以便及时察觉应在运行时表现出的异常。随着类似大数据和分析等技术受到大量关注,APM 应该如何利用它们?

Jonah:目前没有能够真正在运行时“解决”问题的产品(除了两三个与特定平台结合的例子)。APM 工具一般会使用各种 IT 运营分析能力,从而更好的理解和分析从应用和网络仪器中获取的大容量数据。我们将这些能力划分为以下分类:

  • 复杂运营事件处理(COEP)
  • 统计模式发现与识别(SPDR)
  • 非结构化文本索引、搜索和推断(UTISI)
  • 拓扑分析(TA)
  • 多维数据库搜索和分析(MDSA)

InfoQ:你希望看到 APM 工具和产品中的哪些局限被改进?

Jonah:尽管易用性已得到了全面改善,但仍旧有太多的工具难以实施和使用。从应用服务器或基础架构的角度,将代理和其他功能进一步嵌入产品中,将使实施和遥测数据变得更容易理解。有些公司正在为此努力,但 2014 年之前不大可能发布这些产品。

InfoQ:能否谈谈 APM 领域接下来的发展趋势?

Jonah:我们预期会看到 APM 移动市场从当前鱼龙混杂、实际需求有限的状态成长为真正的市场并出现显著的增长。我还提到了 SaaS 监控,这是另一个将在今年将受到冲击的领域。此外我们还期望见到数据分析的持续增长以及 APM 产品的差异化,那些包含数据分析(的解决方案之间)能够持续拉开距离并提供更强大的优势。

关于访谈对象

Jonah Kowall是 Gartner IT 运营研究组的研究总监。他专注于应用性能监控(APM)、事件关联和分析(ECA)、网络管理系统(NMS)、网络性能管理(NPM)、网络配置与变更管理(NCCM)和通用系统及基础架构监控技术。这些技术是运营的基础,它们使运营团队对于事故、问题和变更的管理成为可能。

英文原文: Jonah Kowall on Application Performance Monitoring and Management

感谢康锦龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2013 年 7 月 30 日 09:402891
用户头像

发布了 256 篇内容, 共 52.8 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

架构师训练营第 2 周作业

netspecial

极客大学架构师训练营

缓存解决方案-技术专题-Caffeine Cache

李浩宇/Alex

TensorFlow 篇 | TensorFlow 2.x 基于 Keras 模型的本地训练与评估

Alex

tensorflow 模型训练 keras

上班路上也是一道美景

xcbeyond

生活 摄影 摄影征文

如何快速制造OOM

Since

JVM OOM

高难度对话读书笔记—认知篇2

wo是一棵草

如何设计Go语言中的channel

soolaugust

go channel goroutines

小朋友都能看懂的 HTTPS

Java架构师迁哥

收藏+下载!Flink 社区最全学习渠道汇总

Apache Flink

flink

数字货币管理,3 大新模式来了!

CECBC区块链专委会

区块链 数字货币

甲方日常 22

句子

Vue 工作 随笔杂谈 日常

三步带你开发一个短链接生成平台

Geek_Willie

Java SpreadJS Node

Python 自动化测试全攻略:五种自动化测试模型实战详解

Geek_Willie

自动化测试

“哥伦布”华为,与智能联接新大陆

脑极体

问世间异步为何物?

架构师修行之路

微服务 异步

关于Java Servlet找不到自定义包或者第三方包

谷鱼

classes

架构师训练营第 1 期第 2 周学习总结

du tiezheng

极客大学架构师训练营

Go中的HTTP请求之——HTTP1.1请求流程分析

Gopher指北

go golang HTTP Go web

Dolphinscheduler系统架构设计

dll

Apache DolphinScheduler

鼓励语言区块链技术的应用

CECBC区块链专委会

区块链

让世界为之赞叹的开源项目,除了Linux,你知道Git吗?

小Q

Java git 学习 程序员 面试

不一样的面向对象(二)

书旅

php 面向对象

java安全编码指南之:可见性和原子性

程序那些事

Java java安全编码 java编码指南 java安全编码指南

关于Java 编译Servlet或者自定义Tag,引入包的问题

谷鱼

Java

使用Grafana + simpod-json-datasource快速搭建数据看板

诸葛小猿

Grafana 数据可视化 simpod-json-datasource

自己动手写SQL执行引擎

无毁的湖光

Java MySQL 数据库 Linux 算法

程序执行太慢?快来学习SIMD加速技术,这个案例下的加速效果我也没想到(附带动手实验)

Optimize-Lab

go 优化代码 优化技巧 开源社区 simd

Redis做分布式锁可能不那么简单

架构师修行之路

分布式 分布式锁

面试官:讲讲Redis的五大数据类型?如何使用?(内含完整测试源码)

冰河

redis Jedis JedisCluster

巡展2020第十三届亚洲国际物联网展览会-南京站

InfoQ_caf7dbb9aa8a

项目实战,动态增删form表单

麦洛

jquery 克隆

Study Go: From Zero to Hero

Study Go: From Zero to Hero

Jonah Kowall谈应用性能监控与管理-InfoQ