写点什么

3 年不用云能节省 4 亿美元!想知道我们为什么敢不用 AWS 吗?

作者:Efim Mirochnik

  • 2023-04-20
    北京
  • 本文字数:3389 字

    阅读完需:约 11 分钟

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?

最近,用于 IT 基础设施的云非常流行,上云也已经成为一种趋势。基础设施即服务(IaaS)云提供了多种优势:灵活性、短部署时间、易扩展、可全球诸多地区即时存在……


云服务提供方通过提供方便且普遍易用的服务已经成为资深技术服务外包,凭借其出色的营销、大会、认证和精心挑选的的用例场景,轻易地让人们相信云才是现代企业技术的唯一合理目标。


但有时,这些外包云效益的成本却能高上天。如此之高的成本让我们开始忧虑,如果将基础设施百分比上云,我们的业务是否还能存在。由此引出了我们对此切实的比较,答案就在本文之中。


Ahrefs 自身硬件概览


Ahrefs 在新加坡租用了一个基础设施相当单一的主机托管数据中心。因此,我们选择汇总这个数据中心的所有费用,除以服务器的数量,并与可以被看作是世界领先的 IaaS 示例的亚马逊网络服务(AWS)云中等价安装模式的费用进行比较。



Ahrefs 的服务器


我们的硬件还算是比较新。2020 年中新冠封锁高峰期签订的代管合同,其他所有安装的设备都是在这之后购入的。数据中心的服务器上也有类似的配置,唯一的区别在于两代核心数量相同的 CPU。我们用的是高核心数的 CPU,2TB 内存,以及每台服务器的 2x 100 Gbps。平均下来,我们的服务器有大约 16x 15TB 的驱动。


对至于每月的成本,假设所有的硬件将只使用五年,超过五年的使用都视作是“免费”,那么,每月初始设备的成本是就是原始价格除以 (5 * 12 = 60 个月)。


目前,包括租金和电费在内的所有费用都是统计截止至 2022 年 10 月之前的,虽然我们也受到通货膨胀的影响,但把这点也考虑进去只会让计算更为复杂,因此我们暂时忽略了这一点。


我们的主机托管费用包括两个主要部分:租金和事实消耗的计量电力。自 2022 年初以来,电价已大幅上涨。我们这里计算使用的是最近、也最为高昂的电费,而非使用整体租凭期间的平均电费,因此,计算结果会相较实际略高。这对 AWS 来说算是优势。


此外,我们的费用还包括数据中心和我们的所在点之间的网间结算(IP Transit)以及裸光纤。


下表展示了我们平均每月每台服务器的支出情况。服务器硬件占据整月支出的三分之二,而数据中心租金与电力(DC)、互联网服务提供商(ISP)与网间结算、暗光纤(DF)和内部网络硬件(Network HW)则占剩余的三分之一。



我们自身的公司内硬件成本结构

AWS 的成本结构


我们这次分析的主机托管位于新加坡,因此我们会对比 AWS 在亚太(新加坡)地区的价格。


AWS 的成本结构与主机托管不同。可惜 AWS 没有与我们核心数量相同的 EC2 实例,因此我们选择两个具有一半数量的内核加上 1 TB 内存的 EC2 配置成本,对比一台 Ahrefs 服务器的成本。


此外,考虑到 EC2 的长期使用,我们会将保留三年的 EC2 实例最低价格与使用五年的内部服务器进行比较。


除了 EC2 实例外,我们还加上了弹性块存储(EBS)。相较我们在服务器中所用的大且快的 NVMe 驱动而言,并不算是直连存储的完美替换。为了简化计算,我们选择更为廉价但也更慢的 gp3 EBS,其成本由两部分组成:存储大小和 IOPS 费用。


在服务器上,每个数据块都留有两份副本,但我们在 EBS 上只购买了用于解决复制问题的可用空间。因此,我们要考虑的是 gp3 存储大小应是我们驱动器大小除以 2 的等价:(1*1TB+16*15TB)/2≈120TB 每服务器。


计算中没有算上更高 IOPS 的成本,同时也摒弃了 EBS gp3 的多种限制。举例来说,gp3 最大吞吐量每实例为 10GB/s,而每个 PCIe Gen 4 NVMe 驱动器的性能是 6-7GB/s,我们有 16 个后者这样的驱动器并行运作。这不是完美对称的比较,但会大幅降低 AWS 的存储成本,让其占据进一步的优势。


与主机托管的按带宽收费不同,AWS 是按下载的 GB 数收费。因此,我们会粗略估计每台服务器的平均下载量,并按照这个数字来计算 AWS 的网络。


将所有三个部分结合起来,我们得出 AWS 的成本分布如下:



AWS 成本结构

自有硬件对比 AWS


从上面的表格中我么可以看出,预想之中的 AWS 成本要高上许多。



自有硬件对比 AWS EC2 每月开销


将 EC2 实例用 AWS 中类似可用的 SSD 空间替换,花销基本等同于主机托管数据中心的 11.3 个服务器。这也就意味着,我们的 20 台服务器的机架将变成只有两台左右的服务器。



20 台 Ahref 服务器对比 AWS 的 2 台服务器


假设我们在数据中心实际使用的两年半时间中,运行这 850 台服务器,那么按完计算器后我们就能清楚看到其中巨大的差异:



30 个月内 850 台服务器使用 AWS 对比使用公司内情况


我们需要额外支付 AWS 高达 4 亿多美元的费用,才能确保我们在新加坡的基础设施能自 2020 年起持续运转。


你可能会问,“也许 Ahref 能承担得起这个费用?”


的确,Ahref 是一家盈利且持续发展的公司,那么让我们把 Ahref 的利润纳入计算的考量中看看。但即使如此,Ahref 作为私企没有义务公开我们的财政数据。不过,《海峡时报(Straits Times)》中刊登的 2022 和 2023 年新加坡发展最为迅速的公司文章中,也包含了 Ahref 在 2020 年和 2021 年的收入数据。


我们可以据此,线性计算 Ahref 在 2022 年的收入,虽然只是粗略估计,但也足以让我们得出部分结论。



Ahrefs 于 2020 年至 2022 年收入估算


从上表中我们可以看出,Ahrefs 在过去三年间的总收入约为 2.57 亿美元。但根据上文中的计算,转换至 AWS 数据中心将带来约 4.48 亿美元成本。由此可得,公司的收入甚至无法覆盖两年半的 AWS 使用成本。


真是惊人的结果!


那么 Ahref 的这么多利润都花在了哪里呢?


正如这篇 20 年前由 LJ Hart-Smith 为波音公司撰写的报告中所述:“如果主制造商或系统集成商无法通过输出工作机会而发财,那还有谁会赚钱?当然是分包商。”


别忘了,我们已经给了 AWS 不少计算中的优势。我们的主机托管数据中心的电费花销是高于平均值的,也只计算了 EBS 部分的存储,还忽略了 EBS 存储极其缓慢的速度。再加上这个新加坡的数据中心也不是我们唯一的成本中心,我们在其他数据中心、服务器、服务、人力、办公室、营销活动等等方面也都有开销。


因此,如果云计算是我们的主要基础设施目的地,Ahrefs 将很难生存。


其他考量


本文中没有纳入考量范围的其他方面只会让计算更为复杂,这些因素中包括人员技能、财务控制、现金流、取决于负载类型的能力规划等等。


结论


在过去的两年半间,Ahref 通过确保其基础设施百分百地不在 IaaS 云中,已经节省了约四亿美元,这个数字还将继续增长,因为我们正使用新硬件启动另一套大规模主机托管数据中心。


虽然 Ahref 在全球各地的前端托管会因使用 AWS 而受益,但 Ahref 基础设施的绝大部分都隐藏在自有硬件的主机托管中。如果将产品百分百上云,那么 Ahref 将不再有利润,甚至也不再会存在。


我们可以将百分百上云导致的十倍有余基础设施成本节省下来,用于实际的产品开发和优化。由此带来更快更好的结果会让我们的服务器比云计算在其局限内能提供的快上许多报告。


因此,我建议对可持续增长感兴趣的 CFO、CEO,以及企业主重新思考并定期评估云的优势与其实际的成本。虽说云计算是早期创业公司的首要选择,但随着公司及其基础设施的发展,百分百留在云上的基础设施可能会导致公司沦陷。


这就是困境所在了。


一旦上云,再想离开就会非常复杂。云虽然方便,但也是锁定性质的。此外,因为成本提高便抛弃云基础设施,这大概不会是工程团队所希望的,后者可能会偏见地认为云环境相比老式带有物理服务器的实体数据中心而言,是要更容易且更灵活。


对更为比较成熟的公司而言,从云端迁移到自己的基础设施并不轻松。如何在迁移过程中保持公司的活力也将会是个挑战。但这种痛苦的迁移可能就是拯救公司的关键,如此一来公司无需再向云服务提供商支付越来越多的收入分成。


FAANG(Facebook、Apple、Amazon、Netflix、Google)等大公司多年来在就业市场中吸收了大量工程师,用于管理他们庞大的数据中心和基础设施,只给小公司留下一点点肉汤。但随着近几月科技巨头的大规模裁员,这或许是一个重新评估云计算方法的机会,可以考虑从云计算反方向迁移,并雇佣数据中心领域经验丰富的专业人士。


而如果你要创建一个新公司,或许可以将购入的机架和服务器放在你的地下室里。这大概会从第一天起便改善了公司的可持续性。


原文链接:

https://tech.ahrefs.com/how-ahrefs-saved-us-400m-in-3-years-by-not-going-to-the-cloud-8939dd930af8

相关阅读:

如何将 AWS Lambda 与 Spinnaker 集成

AWS 发布 180 项新服务与功能

AWS 加速西门子智能家居系统的云上构建

AWS Graviton2 | 匠“芯”定制,性能为王

2023-04-20 18:587732

评论 2 条评论

发布
用户头像
规模大了可以不用云
2023-04-21 17:17 · 广东
回复
用户头像
什么换arm cpu、动态伸缩、serverless等降低云成本方法都弱爆了😂最牛逼的降低云成本方法一步到位: 不用云😂😂😂
2023-04-21 09:49 · 上海
回复
没有更多了
发现更多内容

大数据培训Table API 和 Flink SQL的整体介绍

@零度

flink 大数据开发

哈希彩竞猜娱乐游戏俱乐部系统开发详情

开发微hkkf5566

资金穿透分析

清林情报分析师

数据分析 分析软件 分析工具 资金穿透 资金分析

从感知智能跨越到认知智能,NLP领域要做哪些创新?

澜舟孟子开源社区

人工智能 自然语言处理 nlp 大模型 认知智能

吉林长春等保测评公司有几家?详细地址在哪里?

行云管家

网络安全 等级保护 等保测评 等保测评机构 吉林

小程序开发真的可以取代APP软件开发设计吗?

开源直播系统源码

软件开发 小程序开发

理解异步

大熊G

JavaScript 前端 6月月更

庄周梦蝶终非蝶,冷静看待“谷歌AI形成人格”事件

易观分析

谷歌AI

TASKCTL关于 "Fastjson反序列化远程代码执行漏洞” 的风险通告

敏捷调度TASKCTL

DevOps ETL算法 大数据平台 反序列化 TASKCTL

私有云和公有云的主要区别有几点?两者哪个更安全?

行云管家

云计算 公有云 私有云 企业上云 云管平台

web前端培训Vue面试题分享

@零度

Vue 前端开发

LoadBalance

Damon

6月月更

常见线程数量的估算方式

snlfsnef

系统设计 线程 多CPU

云原生中间件 — Kafka Operator 总览篇

Daocloud 道客

云原生 开源项目 消息中间件 上云 Strimzi Kafka Operator

Flink CDC + OceanBase 全增量一体化数据集成方案

Apache Flink

大数据 flink 编程 流计算 实时计算

使用APICloud AVM多端框架开发消防检查助手App项目实践分享

YonBuilder低代码开发平台

APP开发 APICloud 多端开发 应用开发 avm.js

什么是数据流向分析?

清林情报分析师

数据分析 流向分析 数据流向 资金流向 可视化分析

企业如何建设知识管理系统

小炮

高考后,学会这种能力,让你收益终生!

图灵教育

数学 高考 数学建模

如何最简单、通俗地理解Python的pandas库?

Jackpop

什么是面向对象编程?终于懂了

Jackpop

百度评论中台的设计与探索

百度Geek说

如何使用物联网低代码平台进行系统管理?

AIRIOT

物联网 低代码开发 低代码开发平台

漫谈软件架构

韩陆

云原生 领域驱动设计 可观测性 软件架构 事件驱动架构

TiDB 6.1 发版:LTS 版本来了

PingCAP

分布式

可视化技术在 Nebula Graph 中的应用

NebulaGraph

可视化 图数据库 知识图谱

字节跳动Dev Better技术沙龙来啦!参与活动赢好礼,限时免费报名中!

字节跳动终端技术

字节跳动 技术沙龙 华泰证券

为了写好代码,我坚持了这8条习惯!

Jackpop

信息化App在「左」,数字化App在「右」

Speedoooo

App 数字化 信息化

如何从零开始开发一款chrome扩展?

Jackpop

BI的落寞,低代码会重演一遍吗?

ToB行业头条

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?_服务革新_InfoQ精选文章