据 Gartner 最新发布《Infrastructure, Operations and Cloud Management Primer for 2022》报告,数字平台和产品对于支持各级组织任务至关重要,但当前大多数 IT 运营流程无法满足他们的要求。
在全球范围内形成这样的趋势,其背后不只是技术因素,还有 IT 组织利益的共同演绎。驱动各团队更准确地抓住新技术优势和思考未来发展的终局之战,这对于 CIO 等各类技术决策者来说至关重要,否则会冒与业务无关的风险。
Gartner 建议以 Platform Ops(平台运维)理念为核心促进运维创新,将基础设施、运维、云管理纳入一个发展方向规划,从新兴的 I&O 管理策略、云管理、I&O 自动化、技术性能监控、可靠性和弹性、平台工程和 IT 服务管理等方面促进企业交付出“有价值的业务成果”。
从本质来看,Platform Ops(平台运维)更多地是以“平台工程”的角度,从管理到业务,将企业所有不同的部门和需求整合在一起,以软件定义、API 驱动的模块化平台架构来实现快速的产品创新,进而满足企业构建现代分布式和云原生应用的需求。
2022 年 Gartner 报告图
这也恰好代表着,IT 运维的价值正在得到重新思考。即以“平台化”的能力聚焦“业务”价值,从后台走向前台,以更高效也更成熟的方式赋能业务和管理,支撑运维数字化持续演进和发展,推动 IT 运维走向运营。
纵观国内 IT 运维的发展,企业级用户运维工具经历了“集成开发、企业自研、平台众创”三个关键的阶段。
第一阶段:集成开发
早期阶段,国外 IT 运维发展领先,国内企业长期引入国际四大厂商(IBM、HP、CA、BMC)的运维工具和服务,受制于大厂的工具和实施人员经验。而且,对中小型组织来说,成本过于昂贵且服务周期长,导致业务开拓与创新严重依赖外部开发力量,自主力量羸弱。
第二阶段:企业自研
随着国内信息技术的发展,企业进入借鉴国外运维工具技术架构逐步自研和替代的阶段:IT 服务管理、自动化、智能运维等技术体系迅速发展。但平台化思维的缺乏,导致软硬件重复建设多且难以共享复用,IT 系统孤岛重重,技术债务高筑。常常在功能实现上需要跟周边众多系统做集成和关联,导致大部分时间消耗在沟通协调上。
第三阶段:平台众创
随着云趋势确立,IT 运维对象日新月异,应用环境发生了翻天覆地的变化,这也恰给企业运维进入“平台化”催生了机会。平台整合“烟囱式”IT 工具模式,跳出纯工具建设的范畴,避免运维信息孤岛与运维工具碎片化的情况。从运维的全链路、全场景出发,打造一体化运维支撑能力,向上为业务提供强大且灵活的场景化服务,实现「平台+APP」的共享复用和敏捷众创,以“乐高模式”促进高效开发。
整体而言,从传统工具的集成开发,到 Platform Ops(平台运维)的演进,与其说是一次技术升级,不如说是 IT 战略转型。围绕“解决现状+面向未来”的思路,在 IT 技术迭代中探索一条“多快好省”的路径,充分沉淀与吸收运维实践场景形成生态,最大化挖掘运维价值。
支撑 IT 架构持续演进和管理
随着数字化进程的加速,构建现代分布式和云原生应用已是大势所趋。越来越多的企业开始部署多云架构的数据中心,这种复杂的环境给运维带来了严峻的挑战。
Platform Ops(平台运维)是应对这种挑战的一个绝佳模式,既能支撑 IT 系统稳定运行,也能实现业务的敏捷创新,成为推动企业 IT 架构持续演进和管理的核心力量。就单个企业数字化环境而言,Platform Ops(平台运维)向上为企业提供数据和场景融合能力,向下屏蔽多云、混合云、信创环境差异性,打通多云之间的壁垒,进行集约化的统一管理,并通过平台的开放性,与各生态伙伴实现协同,共同构建弹性、容错、健壮的基础设施平台,促进业务跨越式发展。
促进运维、安全能力开放和生态共创
在数字经济时代,终端用户的需求正在呈现井喷态势。与此同时,企业的 IT 基础架构规模与复杂度急剧增长,服务器数量呈指数攀升,时常出现上百种不同的工具和解决方案来处理计算、数据、消息队列、可观测性、安全性、网络和应用。久而久之,一堆工具互不兼容、配置和结构混杂无序,既难以管理、又缺乏安全。
面对让企业不堪重负的技术工具激增问题,Platform Ops(平台运维)可以提供一种最优的解决方案。它可以通过软件定义、API 驱动的模块化平台架构来推进运维组织 SRE 转型,以运维、安全不分家理念融合 S-CMDB,安全有效性验证,SOC 等能力,促进运维、安全能力开放和生态共创。
其可以对现有存量工具进行整合和服务治理、对共性组件和产品不断开发和构建沉淀至平台,然后结合低代码、拖拽创作方式来提供快速构建运维、安全场景能力,实现快速的产品创新,打破传统运维、安全工具竖井,最终,充分沉淀与吸收运维、安全实践场景作为知识载体进行共享复用,形成开放共创的运维、安全生态,满足不断变化的运维、安全需求。
提升研运一体生产力
在企业的数字化升级中,CIO 是一个至关重要的角色。但就当下而言,伴随着内外部环境的复杂度增加,CIO 的压力也越来越大,他们需要帮助企业构建更多利用技术的新数字化业务,并推动收入增长。因此,IT 的稳定和敏捷已不再是如今企业 CIO 们追求的目标或终点,打破部门之间的壁垒,建立响应市场业务变化的协同组织正在成为这个群体的新 KPI。
Platform Ops(平台运维)提倡协同共创,将运维和开发等部门打造成“业务”为中心的协同 IT 组织,通过平台运营,打造、维护、连接和保护 DevOps 团队完成工作所需一切的支持,提升研运一体能力,促进安全左移,逐步打通贯穿持续集成,持续交付和持续运营等整个 DevOps 链条,提高业务敏捷性和开发人员生产力。
从 IT 运维走向运营
IT 运营是把 IT 组织关注的对象数字化,除了故障排查、诊断、分析等运维数据外,还关注业务侧的应用性能、用户感知、快速交付等数据,用这些数据进行更多的挖掘,如精准营销、用户体验/画像、实时风控、成本分摊等。IT 运营可以帮助企业持续打造数字化转型核心竞争力,加速实现商业价值。
通过 Platform Ops(平台运维),构建支撑业务系统的规划、实施、运营、维护和管理,实现业务即服务 = 下沉流程能力 + 融合自动化能力 + 串联场景 + 标准化输出服务。此外,基于体系建立数据分析和共享模型,为 IT 运营的“监管控析”工具提供消费支撑,提升全栈业务可观测性。
同时,以 AIOps 识别技术性能问题,深度预测和挖掘改善组织成果,促进数据驱动智能运维,优化数字业务体验,让各组织之间因为统一的“业务目标”产生连接,实现流程、资源、工具、数据、服务及业务场景打通。最终,IT 运维走向运营,运营改善体验,体验促进增长。
Platform Ops(平台运维)能力图
总而言之,Platform Ops(平台运维)在数字大潮中展现了巨大的业务价值,给 IT 市场带来的是全方位的新产业机遇,是未来构筑护城河般竞争优势的前提,也更是实现企业数字化转型的首选。
作者介绍:
张凯,优云首席架构师。原招行数据中心运调负责人、招行运维变革主要推动者,GB33136 等国标负责人,负责广通优云业务架构创新。
评论