应用性能管理聚焦于监控和管理企业中运行的软件应用的性能及可用性。其目标是对应用的性能进行监控、分析和报告,以便 IT 团队能够快速识别和解决产品的问题,并保障服务质量(QoS)。
随着云计算技术的出现以及越来越多的商业服务被托管在云端,对一般应用的全部组件进行监控和管理变得尤为重要。Charles Babcock 近期撰文阐述了为何现在APM 系统变得十分重要。他提到,现代APM 系统应当具备以下能力:可视化应用及其依赖关系、编制统计数据、进行实时分析来检测异常并进行诊断以解决产品的问题。
Gartner 团队的 Jonah Kowall,去年联合编写了“魔力象限”报告中的应用性能监控部分。
InfoQ 就 APM 领域、技术和工具及该领域的新兴趋势对 Jonah 进行了采访。
InfoQ:应用性能管理(APM)不仅仅是监控应用和系统。能否讲讲理想的 APM 解决方案应该提供哪些特性?
Jonah:Gartner 使用一个五维模型来定义 APM,因为购买者的需求不同,可能用不着所有的维度。(对他们而言)解决方案满足这些维度的子集要比满足全部的维度更好。而在 APM 魔力象限中所列的产品,必须满足全部五个维度。具体维度如下:
- 最终用户体验监控(EUM)——获取以下方面的数据:展示在最终用户面前的应用端到端可用性、延迟、执行正确性以及质量。
- 应用拓扑的发现和可视化——发现应用执行过程中涉及的软硬件基础架构组件,以及它们之间可能的交互路径矩阵,上述内容实现了应用的交付。
- 用户自定义的事务分析——跟踪组成事务的用户分组事件,它们发生在应用内部,并与第二个维度中发现的组件交互;(事务)是为了响应用户对应用的请求而生成的。
- 应用组件深度挖掘——对第二个维度中所发现的组件(运行时应用架构发现)消耗的资源和其中发生的事件进行细粒度监控。这可能包括服务器端组件和客户端设备及接口。
- IT 运营分析——结合或使用不同技术,在 APM 的前个四维度生成的典型大数据集里,发现有价值的、可行的模式,这些技术包括复杂的运营事件处理、统计模型发现和识别、非结构化文本索引、搜索和推断、拓扑分析,以及多维数据库搜索和分析。
InfoQ:云计算正在成为应用部署的热门方法。对云上运行的应用进行监控,与传统应用监控有什么不同?当使用混合云环境时又有什么不同?
Jonah:首先我们必须定义并理解公有云的三种类型:IaaS、PaaS 和 SaaS。大部分产品能够部署在可被远程连接的地方,包括 IaaS 或自有分布式数据中心。当你开始考虑 PaaS 和 SaaS 的时候,问题出现了,这些产品都是 PaaS 提供商整合后的产品。而解决方案通常都是通过 PaaS 提供商自己的 SaaS 服务提供,但那又不是必须的。当你考虑 SaaS 服务的监控问题时,会发现目前的产品非常有限。在 2013 年,这个领域将会出现革新,应该会有一些能够监控 SaaS 性能的解决方案出现在市场上。目前我们不得不使用综合测试,但它只能度量可用性而不是性能。
InfoQ:软件开发和管理领域中,另一个备受关注的分支是 DevOps。近期 APM 领域的潮流和革新如何帮助开发者和运营团队协同工作并在其组织内享有一个持续的性能监控环境?
Jonah:信息分享与协作是 DevOps 的两个关键领域,APM 为开发、业务和质量保证组织提供了数据。这些数据可被用于排解故障或回答其他问题。一些 APM 产品能够对不同的发行版本进行非常细粒度的性能比较,使(用户)能够在代码推出(Roll Out)时更好地理解代码的质量。APM 产品可用于开发、测试(性能及回归)和生产环境。大部分 Gartner 的客户倾向于主要在生产环境中使用 APM,但也会在代码生命周期的其他部分使用。这并不总是因为成本(尽管它是一个原因),这也反映了大部分 IT 组织的反应能力和“救火”(译注:指处理危机)成熟水平。
InfoQ:对应用和系统的监控会产生大量的数据,它们需要近乎于实时地解析和分析,以便及时察觉应在运行时表现出的异常。随着类似大数据和分析等技术受到大量关注,APM 应该如何利用它们?
Jonah:目前没有能够真正在运行时“解决”问题的产品(除了两三个与特定平台结合的例子)。APM 工具一般会使用各种 IT 运营分析能力,从而更好的理解和分析从应用和网络仪器中获取的大容量数据。我们将这些能力划分为以下分类:
- 复杂运营事件处理(COEP)
- 统计模式发现与识别(SPDR)
- 非结构化文本索引、搜索和推断(UTISI)
- 拓扑分析(TA)
- 多维数据库搜索和分析(MDSA)
InfoQ:你希望看到 APM 工具和产品中的哪些局限被改进?
Jonah:尽管易用性已得到了全面改善,但仍旧有太多的工具难以实施和使用。从应用服务器或基础架构的角度,将代理和其他功能进一步嵌入产品中,将使实施和遥测数据变得更容易理解。有些公司正在为此努力,但 2014 年之前不大可能发布这些产品。
InfoQ:能否谈谈 APM 领域接下来的发展趋势?
Jonah:我们预期会看到 APM 移动市场从当前鱼龙混杂、实际需求有限的状态成长为真正的市场并出现显著的增长。我还提到了 SaaS 监控,这是另一个将在今年将受到冲击的领域。此外我们还期望见到数据分析的持续增长以及 APM 产品的差异化,那些包含数据分析(的解决方案之间)能够持续拉开距离并提供更强大的优势。
关于访谈对象
Jonah Kowall是 Gartner IT 运营研究组的研究总监。他专注于应用性能监控(APM)、事件关联和分析(ECA)、网络管理系统(NMS)、网络性能管理(NPM)、网络配置与变更管理(NCCM)和通用系统及基础架构监控技术。这些技术是运营的基础,它们使运营团队对于事故、问题和变更的管理成为可能。
英文原文: Jonah Kowall on Application Performance Monitoring and Management
感谢康锦龙对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。
评论