Dynatrace 成立于 2005 年,总部位于马萨诸塞州的 Waltham,曾经是业界资深的提供应用性能管理(APM)解决方案的公司,现在强调超越 APM。近年来,随着人工智能技术的爆发,Dynatrace 也开始将 AI 引入监控过程,为基于微服务和云计算的应用管理提供了全新的网站平台方案。
2019 年初,Dynatrace 上榜 Gartner 魔力象限应用性能监测套件(APM)的领导者象限,连续九年蝉联 APM 领域的领导者地位。2019 年 5 月 13 日,Dynatrace 大中华区总经理琚伟先生和媒体朋友分享了 Dynatrace 在数字化转型时代下如何用自己的全栈式监控运维平台方案为企业云提供支持。
自主云管理 (Autonomous Cloud Management)
上个世纪 90 年代 PC 机大量被使用,开启了信息化时代。数字化的信息开始取代纸张,电脑取代了传统的交付和呈现方式。2016 年,李克强总理提出了“大众创业万众创新”的口号,提出“互联网+”的战略,企业开始走上了数字化转型之路,而这次的转型,其实是面向云计算的转型。上云后,企业云的一些特征包括:
环境复杂:公有云、私有云和混合云难以互通;
大规模:企业上云以后,应用和数据都是 web 规模的;
应用动态变化:容器和微服务的技术都是动态变化的;
部署频率提升:采用 DevOps 提升了软件部署和交付的效率;
用户期望随之变化:用户期望更多的数字化体验。
在 Dynatrace 看来,企业在上云之后,企业云管理需要大量高保真的数据来达到高度自动化、智能化,最终一定会走向“自主云“(Autonomous Cloud Management, ACM)。所谓自主云,目标是构建可以自我管理和自愈的云计算环境,用 AI 为自动运维铺平道路,通过创建自动修复工作流程消除人为干预。
从最早的深蓝赢了国际象棋的大师,到两年前阿尔法狗赢了柯杰以后,大家已经看到了人工智能的力量。实现人工智能的一个重要来源是高保真数据。真实用户产生了高保真的数据以后,才会有更准确的预判。而自发布新的人工智能全栈式监控运维平台以来,Dynatrace 在大中华区的市场业绩在 2018 年全年实现了翻番式的增长,在用户高保真数据量上 Dynatrace 有很大的优势。
上云之后,Dynatrace 从 2018 开始,将自己从“APM 厂商”重新定义为“智能软件“公司,打造智能软件的平台,实现 ACM。平台包括应用性能监控,云基础架构检测,AIOps,和数字体验管理。Dynatrace 的智能平台运用 AIOps 进行根因分析和故障定位,能实现自动回滚和故障自愈。
该平台的构建都源自前面提到的高保真数据。数据的收集端采用 One Agent,可以把用户和云生态的数据收集起来。One Agent 部署在多云环境里,在客户的环境中有 One Agent 的代理部署在全站式交易链路里。这样 One Agent 可以了解各种云环境下的相互依赖,清楚地追踪到服务之间的请求和相互调用关系,并能给用户一个非常清晰的定位,把公有云和私有云的特性完全呈现出来。因此使用 One Agent,用户可以管理不同的公有云和私有云环境。
那是什么在支撑 Dynatrace 新的智能平台系统呢?琚伟介绍说,以前 Dynatrace 核心的 NOC 实验室有大屏幕显示实时 IT 环境,有人工盯大屏幕和报表。而现在,在引入了 AI 技术以后,NOC 里基本上空无一人。AIOps 可以做到故障定位和根因分析,可以在复杂的环境里判断因果关系,在故障发生时可以给出修复建议。
而引入技术并进行文化的改变后,Dynatrace 现在每年的发布次数从 2 次增加到 26 次,每天的部署达到 500 次。以前的生产缺陷 100%由客户报告,现在能自主发现缺陷,客户报告的比例仅占 7%。这样的转变也符合数字化转型的需求。
根据 Gartner 的报告,去年全球 APM 市场的份额约为 40 亿美金,而中国的 APM 市场仅占全球的 2.7%。这说明了 APM 的市场潜力非常巨大,中国的 APM 市场还有很大的发展空间。此外我们也看到,全球受监控的应用只有 5%,应用只有通过监控反馈才能不断优化。这些数字印证了 APM 是非常精和专的行业。在琚伟看来,在现在的技术趋势下,APM 市场一定要和云环境相结合,因为云环境下的微服务、容器、SaaS 层、PaaS 层等市场潜力要大很多。所以 Dynatrace 把自己的转变定义为软件智能(software intelligence),提出了自主云的概念,从 APM 这一象限拓展出去,将自己放在云生态里帮助客户找到问题,发现问题,实现自动化。
如今,在全球数企业的数字化转型进程中,Dynatrace 的全新监控平台正为他们的企业云提供支撑。Dynatrace 的软件智能平台可以轻便快速的安装,支持云原生技术。除了可以帮助企业更好地进行云生态的业务监控,Dynatrace 的解决方案还能大大降低系统故障定位时间,并可以帮助企业预估流量峰值提前做准备等等。
Dynatrace 面临的一下课题就是如何实现 ACM,并形成解决方案提供交付给用户,方便企业更好地运行云端业务。
评论