【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

“节约成本”不是转向云计算的头号理由

Sarah Wang、Martin Casado

  • 2021-06-03
  • 本文字数:6152 字

    阅读完需:约 20 分钟

“节约成本”不是转向云计算的头号理由

云计算的成本:一个价值万亿的悖论

 

毫无疑问,云计算已经成为计算发展史上最重要的平台迁移浪潮之一。云计算不仅左右着数千亿美元的 IT 支出,而且在达成这些里程碑目标之余居然仍处于早期发展阶段,在每年上千亿美元的公有云支出基础之上保持着旺盛的增长态势。而这股转变实际上源自一个强大的价值主张——打造能够按业务需求即时提供资源及服务的基础设施。这意味着云计算既提高了运营效率,也改善了经济效率。在摆脱了内部资源的束缚之后,企业能够将更多精力投入新产品研发、业务增长、云探索以及创新文化培养等方向。


然而,随着云技术行业在经验上的日趋成熟,可以看到虽然云技术确实在发展早期兑现了自己的资源优化承诺,但这种优化效果却在业务规模扩大与增长的同时逐渐减弱,最终负担开始超过收益。这种转变往往发生在企业应用的后期,因此很难轻松逆转,其根源在于企业客户多年以来更多专注于功能创新、而非基础设施优化。在这种情况下,显著提高效率所需要的重写甚至重大重构工作可能需要耗费数年,甚至相当一部分优化工作根本没有现实可行性。

 

如今,人们开始愈发明确地意识到云计算对于长期运营成本的影响。随着云成本在总体收入成本(COR)或产品销售成本(COGS)中占比的持续提升,不少企业已经开始采取极端方法,包括“撤回”大部分工作负载(例如 Dropbox)或者选择混合解决方案(例如 CrowdStrike 与 Zscaler)。这些举措也带来了显著的成本节约效果:2017 年,Dropbox 在其 S-1 文件中详尽介绍了基础设施优化改革帮助该公司在首轮公开募股之前的两年内累计节约 7500 万美元,而所节约成本的主要源头正是公有云。

 

但考虑到此类工作规模浩大,多数企业往往很难证明将工作负载迁出云环境的直接意义。毕竟坦率地讲,“云计算天下无敌”仍是目前行业的主流观点。为此,我们打算对由云计算催生的潜在损失价值做出评估。随着收益随业务规模的增长而放缓,短期效率已经成为公共市场上愈发重要的决定性价值因素。而云计算过高的成本、特别是给利润率造成的压力,正严重影响着云技术的市场口碑。

 

但本文的重点并不是劝大家回归本地设施,而是想强调这是个高度复杂的问题,具体影响和应对思路应视公司情况而定。我们希望迈出第一步,估算云计算的普及到底浪费掉了多少价值,这样我们才能确保企业在业务规模扩大的同时始终拥有正确的基础设施管理决策框架。

 

首先向大家介绍我们的讨论框架:我们会估算全部撤出云端这一极端情况下所能节约的资金,并使用公共数据确定此举对企业股价(市值)造成的影响。通过相对保守的假设,我们猜测在目前使用云基础设施的 50 家顶尖上市软件公司中,因云服务吞噬应有利润而造成的市值损失约为 1000 亿美元。虽然我们在本次分析中仅关注软件厂商,但云计算的影响绝不仅限于软件行业。如果将分析结论扩展到更为广泛的上市企业之内,我们预计总市值影响可能超过 5000 亿美元。

 

我们的分析还强调了通过云优化能够返还多少市值——具体包括系统设计与实施、重构、第三方云增效解决方案、以及将工作负载迁移至专用硬件等方式。考虑到主流观念已经认定云计算优于本地部署,这里的假设显然极度违反直觉。但很明显,将短期节约与长期市值影响综合起来,这种负载划分、混合运营的方式能够为几乎一切处于扩张期的企业合理降低云成本。

云脱钩的单位经济学:Dropbox 案例及其他

为了确定云计算成本,特别是理解优化带来的潜在节约量,我们首先从较为极端的大规模云脱钩案例开始:Dropbox。在这家公司于 2016 年开始启动基础设施优化计划时,他们将大部分工作负载从公有云迁移到了由租用及直接运营的托管服务器上,借此获得“更低成本与更具定制化的基础设施操作空间”。事实证明,他们在接下来的两年之内节约下近 7500 万美元。从 2015 年到 2017 年,Dropbox 公司的毛利率由 33%增长至 67%,“这主要利益于我们的基础设施优化……以及在此期间公司本身获得的收入增长。”


但那可是 Dropbox,未必具有普遍的代表意义。因此,为了帮助更多企业了解云脱钩的潜在节约比例,前谷歌工程师、云计算优化厂商 Optimyze 联合创始人 Thomas Dullien 估计,目前企业中约有价值 1 亿美元的公有云成本,完全可以通过不足一半的每年总体拥有成本(包括服务器机架、楼面占用、网络与工程成本等)替代。

 

实际节约额度当然会因企业而异,但我们在与多位专家沟通之后,基本得出了一种共识性结论:脱钩成本基本相当于在云端运行等效工作负载的三分之一到一半。此外,某大型消费级互联网企业的工程主管发现,公有云的定价往往达到自有数据中心运行成本的 10 到 12 倍。由于批量采购云资源往往能享受到可观的折扣,我们按 30%到 50%的成本优惠来计算,那么云成本相较于本地设施的实际倍率应该是在个位数范围。但无论如何,除去折扣以及相当激进的研发预算,亚马逊云科技仍然保持着约 30%的综合运营利润率。这意味着企业客户在云脱钩之后往往能省下更多资金。自主管理硬件所带来的性能提升,甚至会进一步推动收益增长。

 

通过与各行业从业者的交流,我们发现上述结论确有普遍意义。在规模化运营的情况下,云成本至少达到同级别本地基础设施的 2 倍。

云计算的真实成本

结合云支出在总收入成本(COR)中占据的可观百分比,云脱钩带来的至少 50%成本节约无疑意义重大。根据各基准公共软件厂商(即承诺披露其云基础设施支出的厂商)发布的信息,我们发现云计算合约中约定的支出平均占 COR 的 50%。

 

而实际上,云支出占 COR 的百分比往往比约定占比更高:一家市值 10 亿美元的私营软件企业告诉我们,他们的公有云支出占 COR 的 81%,而且“云支出占总收入成本 75%到 80%的情况在软件行业中屡见不鲜。”结合自己从供职谷歌到效力于 Optimyze 期间的实际体会,Dullien 还观察到企业客户在评估云支出约定占比时往往比较保守,往往出于过度支出的担心而仅纳入了基准负载。根据经验,约定支出往往要比实际支出低 20%左右。通过沟通,不少企业还报告称他们的实际云支出至少达到约定云支出的 2 倍水平。

 

如果结合这种情况对其他以公有云作为基础设施的软件企业做出广泛推断,那么对于全球前 50 家顶级上市软件企业,其总体云支出已经达到 80 亿美元(这一结论已经在各软件厂商的年度报告中有所体现)。尽管一部分企业采用混合模式(即公有云加本地部署,在这种情况下云支出在 COR 中占据的百分比相对较低),但我们的分析已经在假设层面选取了约定支出(而非实际支出),因此应该可以抵消掉这部分差异。结合与专家的交流结论,我们假定云脱钩能够将云成本降低 50%,由此获得 40 亿美元的总节约额。对于云基础设施利用率更高的大型公共软件及消费级互联网公司而言,其实际节约额可能还要高得多。


虽然 40 亿美元的净节约额已经相当惊人,但将此转化为市值增长之后,得到的结论更是令人瞠目结舌。目前,所有企业的市值概念都源自其按未来现金流的现值,因此在达成以上成本节约后产生的相应市值将远远超过 40 亿美元。

 

但到底有多少?一种比较粗略的计算方法,就是参考股票市场如何评估额外利率:目前通过烧掉大把现金保持调整增长的软件公司,通常会按毛利率的倍数确定市场估值,这反映出投资者对于公司长期增长及利润率结构的假设。(参考中的收入倍数同样反映出企业的长期利润率,因此对于业务增长率暂时处于波动的企业,只要其业务的毛利率较高,利润率同样能够保持提升。)我们可以将这两项资本倍数作为启发性指标,用于估算企业未来现金流的当前市场折现率。

 

在我们分析的 50 家上市软件公司中,其平均市值约为 2021 财年毛利润倍数(基于发布时的 CapIQ)的 24 到 25 倍。换句话说:通过云脱钩每节约下 1 美元毛利润,则其市值将平均增长 24 到 25 倍(假定节约金额已经扣除了增加资本支出而产生的折旧费用)。

 

这意味着仅这 50 家企业,就可以通过额外的 40 亿美元毛利润增长产生额外的 1000 亿美元市值。另外,由于使用毛利倍数(相较于自由现金流的倍数)假设增量毛利美元与某些增量运营支出相关联,这种方法甚至还低估了每年 40 亿美元净节约对市值产生的最终影响。

 

对于特定企业,市场估值受到的影响可能更大。这里我们以基础设施监控即服务厂商 Datadog 为例,该公司在上市时的股价接近 2021 年预估毛利润的 40 倍,同时在 S-1 文件披露了签订的未来三年内使用 2.25 亿美元亚马逊云科技服务的约定数额。如果我们将这部分约定支出年化为每年 7500 万美元的云成本,并假定云脱钩能够实现 50%的成本节约(折合 3750 万美元),那么单此一项就能为该公司带来约 15 亿美元的市值提升!

 

当然,这样的简单分析不可能得到完美可靠的结论,但至少能够在方向上给大家一点启示:规模庞大的上市软件厂商的市值,已经因为云成本的压力而蒙受千亿美元的损失。如果我们把目光投向企业软件与消费级互联网企业等更为广阔的领域,那么这一数字有可能超过 5000 亿美元。换言之,如果能够通过云脱钩帮助这些企业节约 50%的总体云支出,那么其获得的额外总市值将超过 5000 亿美元。

 

对于企业领导者、行业分析师以及开发厂商而言,在短期乃至长期基础设施决策时显然不应该、也不可能忽略云支出这一对于企业市值具有重大影响的因素。

云计算的悖论

那我们要如何做出改变?首先需要承认,将工作负载转移出云端是项重大决定。如果不做提前规划,负载重写不仅困难、甚至根本就没有实现的可能。此外,这类工作必然需要一支强大的基础设施团队,但并不是每家企业都拥有如此雄厚的人才储备。这一切也要求我们在核心职能之外建立起额外专业知识,这不仅会分散企业的业务重心,本身也会挤占业务资源。即使单从规模角度来看,云计算也仍有不少可取之处——例如按需容量交付以及能够支持新项目与新市场的丰富现成服务。

 

但在另一方面,前文提到的问题还是不容忽视:云成本已经开始反噬企业自身,甚至悄然消解掉了本应存在的千亿美元市值。不选择云计算的一定是疯子,而选了云计算早晚要被它逼疯!

 

那么,企业要怎么摆脱这样的悖论?结合前文,大家应该看到我们并没有以任何方式给出脱钩的理由;相反,我们只是在计算基础设施支出这项核心指标。换言之,企业必须尽早、甚至是在云环境之外开展基础设施成本优化。业务规模越大,我们对于某些先验理念的依赖性就应该越低。

虽然这里面有着大量关于心态转变以及最佳实践的门道,但本文希望整理出几项核心注意事项,希望帮助大家更好地应对不断增长的云计算成本。

 

  • 将云支出作为 KPI。要真正让基础设施支出成为一项核心指标,前提就是要把它视为企业中的一项关键绩效指标。以 Spotify 的 Cost Insights 为例,这是一款用于跟踪云支出的原研工具。通过跟踪云支出,该公司得以为财务乃至工程技术团队合理分配云支出额度。作为曾经的 Digital Ocean 成员,Ben Schaechter 参与建立起 Vantage 公司并出任 CEO,他观察到整个行业的企业已经在业务生命周期之初就开始关注云成本指标以及核心性能与可靠性指标。“开发商们变得越来越精明,他们希望自己的团队能更严格地对待云支出问题。”

  • 激励正确行为。使用一流基础设施 KPI 数据为工程师们赋权虽然可以帮助他们提高意识,但还不足以激励人们彻底改变行为模式。一位著名行业 CTO 曾告诉我们,他曾在一家公司中采用过类似销售大促的短期激励措施,确保每一位优化或节约下一定数量云支出的工程师都有机会拿到资金。这项举措确实让企业的投资回报率有所提升。他回忆道,这种方法相当于直接将成本问题同工作人员联系起来,顺利将组织的整体成本降低了 10%,在短短六个月内就节约下 300 万美元的总开销。值得注意的是,公司首席财务官也非常认可这种非传统节流模式。

  • 优化、优化、还是优化。在评估企业市值时,最重要的因素就是商品销售成本或者叫销货成本(COGS)。具体来讲,企业要想赚取一美元,需要付出多少成本?客户数据平台厂商 Segment 最近分享了其如何通过逐步优化基础设施决策,成功将相关成本降低达 30%(同时将收入流提升 25%)。目前已经有多种第三方优化工具能够为现有系统快速提供收益。根据我们的实际观察经验,具体优化范围从 10%到 40%不等。

  • 提前考虑脱钩需求。云悖论(即云在企业起步及发展阶段表现良好,但在业务规模提升后则成本高昂)确实存在,但企业并不一定只能被动接受,而完全可以提前做好规划。请确保您的系统架构师尽早意识到后续脱钩需求,以免在云成本达到甚至超过收入增长时无可奈何。因此,不妨在早期进行适度或者模块化程度更高的架构投资,包括尽量使用能够将工作负载迁移至最佳位置而不受锁定影响的架构,同时减少未来脱钩时可能需要的工作量。


Kubernetes 的流行以及软件的容器化风潮已经极大提高了工作负载的可迁移性,这本身就是企业们不希望被牢牢锁定在特定云服务商身上的明证。


  • 逐步脱钩。另外,我们当然也可以选择渐进及混合方式推动脱钩(只要适合企业的实际情况)。请注意,大家可能只需要对一部分资源消耗量最大的工作负载进行云脱钩,而并不一定要全面脱钩!实际上,通过具体交流,我们发现即使是脱钩态度最激进的企业,仍然会把 10%到 30%的工作负载留在云环境当中。

 

虽然上述建议主要针对 SaaS 企业,但应该也能给其他公司带来些启发。例如,作为基础设施供应商,您可以考虑成本分摊选项(例如使用客户的云积分)消解掉一部分成本。总之,云成本应该成为整个生态系统都严肃对待的重要议题。

结语

我们完全可以理解云计算的快速普及:云本身代表着一种专门针对创新、敏捷性及业务增长进行优化的理想平台。在由私人资本推动的行业当中,利润率往往只是次要问题,创新才是真正的诉求。也正因为如此,初创企业才更倾向于在云端启动业务,始终强调功能开发速度的优先性。

 

但现在,我们已经意识到其中的问题。而且颇为讽刺的是,超过 60%的企业都在以“节约成本”作为转向云计算的头号理由!对于初创企业或者全新项目,云几乎成了不容质疑的最佳选择。当然,即使存在一定额外成本,不少公司也愿意将其视为获取云敏捷性所必需的“灵活性税”。

 

问题在于,大型企业(包括规模不断扩大的初创公司)承担的这部分“灵活性税”往往可以变现为上千亿美元的股权价值……一旦在云道路上走得太远,他们就很难选择回头。这里还要再提一点,很多企业其实是为了回避前期资本支出才选择了云计算。但过去几年以来,公有云基础设施的替代方案迎来了很大发展,现在我们完全可以通过纯运营支出(而非资本支出)实现云脱钩之后的设施构建、部署与管理。

 

另外需要注意的是,虽然前文提出的不少数字看似夸张,但这还是保守估算下的结果。实际支出往往会高于约定支出,而且我们还没有考虑到弹性定价产生的梯度费率。总之,云成本给整个行业市值的影响可能远远超过预期。

 

那么,云服务商会不会主动削减目前拿到的 30%利润比例?从目前三大云巨头垄断市场的情况来看,可能性不大。部分原因在于,亚马逊、谷歌与微软这三家总市值高达 5 万亿美元的企业用实际行动证明,他们的成功一方面源自产品的高利润率、另一方面正是来自自主经营的低成本基础设施。正是有了这两大支柱的加持,他们才能在提振自身股价的同时对产品及人才进行持续投资。

 

因此,如果真的存在这部分高达数千亿美元的市值空间,云计算悖论也许可以通过另一种方式得到解决:公有云厂商逐步放弃利润空间,否则客户就会将工作负载脱钩出去。无论如何,基础设施迁移与代码优化,都是每家企业必须关注的云成本优化正道。

 

原文链接:


https://a16z.com/2021/05/27/cost-of-cloud-paradox-market-cap-cloud-lifecycle-scale-growth-repatriation-optimization/

2021-06-03 19:002715

评论 2 条评论

发布
用户头像
告别激进,重新看待云计算的定价,是篇不错的文章,但平台集成的能力是很多小企业刚开始起步时所需要的,就和房贷一样,谁不想直接上车,还得还双倍的钱,关键是你得上得了车呀!
2021-10-27 22:28
回复
用户头像
如果说在云上部署应用是云计算发展的第一波浪潮,那么直接在云上开发,无疑将引领下一波浪潮:https://wuyuan.io
2021-06-07 19:40
回复
没有更多了
发现更多内容

四种 AI 技术方案,教你拥有自己的 Avatar 形象

阿里云视频云

人工智能 阿里云 计算机视觉 视频云 元宇宙

极客时间【架构实战营】第二期 模块七作业

Geek_91606e

架构实战营

linux lsquic 编译

webrtc developer

前后端、多语言、跨云部署,全链路追踪到底有多难?

阿里巴巴中间件

阿里云 云原生 中间件 全链路追踪

百度智能云与雅量商业智能携手,加速零售行业智能化升级

百度开发者中心

百度智能云 零售行业

科技热点周刊|ClickHouse 融资 2.5 亿美元、个人信息保护法正式实施、Facebook 改名 Meta

青云技术社区

云计算 facebook 云原生

【高并发】开篇:线程与多线程

冰河

Java 并发编程 多线程 高并发 异步编程

常用的Nmap脚本及使用实例

喀拉峻

网络安全 信息安全 渗透测试 脚本 nmap

百度Apollo参编首批汽车信息安全国家标准,跻身车联网信息安全第一梯队

百度开发者中心

Apollo

Github上线仅六天,收获Star超55K+,这套笔记能拿下90%以上面试

Java redis spring 程序员 架构

看完这篇SpringBoot让我在阿里成功涨薪40%,感谢

Java 编程 程序员 程序人生 springboot

ReplacingMergeTree:实现Clickhouse数据更新

华为云开发者联盟

数据 事务 Clickhouse 数据更新 OLAP数据库

接口文档工具yapi的安装

小鲍侃java

11月日更

TDengine在浙商银行微服务监控中的实践

TDengine

tdengine 后端 时序数据库

阿里云视频云,用技术普惠打造平民化“虚拟人”

阿里云视频云

人工智能 阿里云 视频云 数字人 虚拟人

GitHub远程免密连接详解,还顺手解决了RPC失败HTTP413

老表

GitHub RPC HTTP 11月日更

牛掰!“基础-中级-高级”Java程序员面试集结,看完献出我的膝盖

Java spring 程序员 JVM hashmap

杂谈—程序人生第一份工作

思想者杰克

程序人生 新手指南 程序

百度鸿鹄芯片落地首款量产车吉利博越X 智能车机体验惊艳成都车展

百度开发者中心

百度 车联网 鸿鹄芯片

万字长文解密数据异构最佳实践(含完整代码实现)!!

冰河

MySQL 数据库 canal 数据同步 数据异构

Hexo个人博客快速部署到Gitee&Coding详细教程

老表

Hexo gitee CODING 博客配置 11月日更

RadonDB ClickHouse on K8s 2.1.0 发布!

RadonDB

数据库 Kubernetes Clickhouse RadonDB

科大讯飞联袂伯俊科技进军3C零售,构建发展新格局

科技热闻

架构实战营-总结

哈希

端开发技术——5个高效的Flutter开发工具

思想者杰克

2021年10月云主机性能评测报告

博睿数据

你需要知道的 19 个 console 实用调试技巧

CRMEB

CSS JavaScript DOM console crmeb

百度智能云人脸采集SDK通过CFCA权威安全测评

百度开发者中心

安全 sdk

行业白皮书发布!百度智慧城市助力城市“双碳”目标达成

百度开发者中心

人工智能 智慧城市

操作系统——计算机硬件简介

思想者杰克

杂谈——程序人生我的大学

思想者杰克

“节约成本”不是转向云计算的头号理由_文化 & 方法_InfoQ精选文章