写点什么

触目惊心:AI 到底消耗了多少能源和成本?

  • 2019-11-22
  • 本文字数:2880 字

    阅读完需:约 9 分钟

触目惊心:AI到底消耗了多少能源和成本?

随着 AI 算力的逐步提升,能耗和成本也在逐渐增加。根据最新的研究结果,训练一个 AI 模型产生的能耗多达五辆汽车一生排放的碳总量,昂贵的 BERT 模型的碳足迹约为 1400 磅二氧化碳,这与一个人来回坐飞机穿越美洲的排放量相当。再加上算法、数据和算力成本,机器学习可能会使公司花费 51,750 美元至 136,750 美元不等,难道这也是普通公司和开发者玩不起系列?


AI 算力提升的背后:能耗剧增

过去,人工智能经常被比作石油行业:一旦对(数据/石油)进行开采、精炼,就可以变为高利润的商品。现在看来,人工智能在能耗层面的表现也可与石油行业一较高下。根据最新的论文结果,训练一个 AI 模型产生的能耗多达五辆汽车一生排放的碳总量。


这篇新论文是马萨诸塞大学阿默斯特校区的研究人员公布的,以常见的几种大型 AI 模型的训练周期为例,发现该过程可排放超过 626,000 磅二氧化碳,几乎是普通汽车寿命周期排放量的五倍(其中包括汽车本身的制造过程)。



这一结果也是很多 AI 研究人员没有想到的。西班牙拉科鲁尼亚大学的一位计算机科学家表示:“虽然我们中的很多人对此(能耗)有一个抽象的、模糊的概念,但这些数字表明事实比我们想象得要严重。我或者是其他 AI 研究人员可能都没想过这对环境的影响如此之大。”


以自然语言处理为例,研究人员研究了该领域中性能取得最大进步的四种模型:Transformer、ELMo、BERT和 GPT-2。研究人员在单个 GPU 上训练了至少一天,以测量其功耗。然后,使用模型原始论文中列出的几项指标来计算整个过程消耗的总能量。


结果显示,训练的计算环境成本与模型大小成正比,然后在使用附加的调整步骤以提高模型的最终精度时呈爆炸式增长,尤其是调整神经网络体系结构以尽可能完成详尽的试验,并优化模型的过程,相关成本非常高,几乎没有性能收益。BERT 模型的碳足迹约为 1400 磅二氧化碳,这与一个人来回坐飞机穿越美洲的排放量相当。



此外,研究人员指出,这些数字仅仅是基础,因为培训单一模型所需要的工作还是比较少的,大部分研究人员实践中会从头开发新模型或者为现有模型更改数据集,这都需要更多时间培训和调整,换言之,这会产生更高的能耗。根据测算,构建和测试最终具有价值的模型至少需要在六个月的时间内训练 4,789 个模型,换算成碳排放量,超过 78,000 磅。


随着 AI 算力的提升,这一问题会更加严重。

人工智能趋向私有化:成本高昂

这些结果也凸显了 AI 另一个日益严重的问题:产生结果所需的大量资源使学术界工作人员很难继续研究。显然,这种通过大量数据训练庞大模型的趋势对学者尤其是研究生来说并不可行,因为没有资源,这让学术界和工业界的研究人员之间出现公平访问的问题。


抛开环保和能耗本身,人工智能的训练过程同样成本高昂。以机器学习为例,数据、算法、算力成本同样“触目惊心”。

数据成本

与数据相关的机器学习成本主要表现在数据集方面,包括数据集的获得、数据的标注等。Dimensional Research代表 Alegion 所做的一项最新研究表明,所有组织中的 96%都遇到了与训练数据质量和数量相关的问题。同一项研究表明,大多数项目需要超过 100,000 个数据样本才能表现良好。



Dimensional Research 研究的图表说明了公司在数据方面面临的最常见问题


如果还没有数据,可以假设能够在大约一个小时内收集 5–10 个样本并对它们进行标注。利用亚马逊的Mechanical Turk之类的服务来实验整个过程,生成 100,000 个样本数据集的话,花费大约为 70,000 美元。


如果已经收集了大量数据,则可以使用Scale之类的服务来对其进行标注。在这种情况下,获得 100,000 个带有标签的数据样本,则可能需要花费 8,000 到 80,000 美元的费用,具体的需要取决于标注的复杂程度。


此外,检查和校正数据样本与生成和注释数据样本一样耗时。Dimensional Research 研究报告中提到,66%的公司在其数据集中遇到偏差和错误问题。有些公司选择采用完整的内部方法(自己做所有标注),也有一些公司会选择外包和内部混合使用。第二种常见的情况是将大部分工作外包,然后由个别人员负责验证和清理。外包 10 万个数据样本的初始成本可能会增加大约 2500 至 5,000 美元。

算法成本

Dimensional Research 报告指出,大多数企业 AI 团队的成员不足 10 名。假设每个技术团队有 5 名成员,其中 3 个是外包。在这种配置下,团队可能足以并行处理两个项目,平均每 1.5 个月研究一个项目。基于此的成本是 2 名员工(2 x 5,000 美元),3 名自由职业者(3 x 3,000 美元),每月的总成本是 19,000 美元。如果团队可以同时处理两个项目,并且研究时间为 1.5 个月,则意味着该阶段的成本约为每个项目 14,250 美元。

算力成本

与算力相关的机器学习成本主要表现在基础架构、集成、维护以及各种处理器的功耗方面。


生产成本包括基础架构成本(云计算,数据存储),集成成本(数据管道开发,API 开发,文档)和维护成本。


其中,云计算的支出取决于部署算法的复杂性。如果模型不是很深,并且是在低维表格数据上进行训练,则将获得 4 个虚拟 CPU 运行在 1 到 3 个节点上的服务,每月费用为 100 到 300 美元,即每年 1200 到 3600 美元。另一方面,对于无延迟的深度学习推理,价格从 10,000 美元到 30,000 美元不等。


集成可能比较棘手。在大多数情况下,只需要将 API 端点放在云中并记录下来,供系统的其余部分使用即可,准备要使用的机器学习模型并编写 API 脚手架最多需要 20 到 30 个开发小时,其中包括测试,成本约为 1,500 美元,加上修改系统的其余部分以使用新 API 所需的成本。稳定的数据管道将花费更多的时间,大概需要 80 个小时左右。

附加项:落地成本

迄今为止,实施 AI 的最大成本是落地。太多人着迷于 ML 和 AI,并将其开发预算投入到追求该技术而不是解决实际问题上。我们正处于机器学习仍然是一项高度实验性技术的阶段,其成功率差异很大。Garter 预测,到 2022 年,将有 85%的 AI 项目交付错误的结果。

玩不起系列:成本总和

除去附加项成本和一系列功耗所带来的成本,机器学习项目可能会使公司花费 51,750 美元至 136,750 美元(不包括难以确定的其他成本)。高差异是由数据的性质决定的。这是一个非常乐观的估计。如果企业位于美国,并且使用的是明智的数据(自由职业者不会这样做),则与人才相关的费用将激增,使 ML 项目的费用超过 108,500 美元。


这样高昂的价格使想要解决新问题或自动化其流程和决策的个人、小型团队和初创企业无法使承担。最艰难的步骤是第一步:获取数据。没有数据,几乎不可能在研究阶段验证机器学习解决方案,从而导致几乎死锁。


综上,这些因素都可能会导致人工智能研究的私有化。对此,一位大数据和人工智能领域的技术专家在接受 InfoQ 采访时表示,BERT 模型其实可以解决一部分数据问题,因为要达到同样的效果,它需要的数据量相对较小,但算力确实是很难攻破的问题,这也就意味着硬件成本很难下降。目前,一种可行的解决方式是通过租用云端 TPU 的方式来降低成本,但人工智能逐渐趋于私有化确是事实,未来学术界将在非强依赖算力的领域有更多创新,工业界由于尚可承担算力提升带来的各种成本,会在强依赖算力的领域有更多突破,这将实现学术界与工业界的合理分工。


2019-11-22 12:278052
用户头像
赵钰莹 InfoQ 主编

发布了 882 篇内容, 共 638.2 次阅读, 收获喜欢 2678 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试|教你用Matplotlib绘制多种饼图

霍格沃兹测试开发学社

2023-11-15:用go语言,如果一个正方形矩阵上下对称并且左右对称,对称的意思是互为镜像, 那么称这个正方形矩阵叫做神奇矩阵, 比如 : 1 5 5 1 6 3 3 6 6 3 3 6 1 5

福大大架构师每日一题

福大大架构师每日一题

外贸企业如何评估谷歌SEO的效果?

九凌网络

助力大模型开发,澳鹏MatrixGo平台工作流再次升级

澳鹏Appen

工作流 数据标注 大模型

云上探索实验室-码上学堂领学员招募,收官在即!

科技热闻

低代码自动化,程序员真的还有前途吗??

代码生成器研究

无代码/低代码编程是否走错了路?

代码生成器研究

软件测试|不会吧,你还不知道用pillow绘制图像?

霍格沃兹测试开发学社

后端开发需要学什么?推荐这份超详细的后端开发学习路线图!

彭宏豪95

Java 编程 后端 IT 后端开发

电视剧剪辑,微课制作神器Camtasia的干货介绍,建议收藏。

淋雨

Camtasia 录屏

软件测试/测试开发丨人工智能在软件测试领域的革新

测试人

人工智能 软件测试

『亚马逊云科技产品测评』活动征文|阿里云服务器&亚马逊服务器综合评测

鸽芷咕

云计算 Linux 服务器 科技

一些程序员不可错过的开发工具

高端章鱼哥

工具

不会写代码了?2分钟看完,这5个技巧你一定要收好。

代码生成器研究

火焰图:链路追踪分析的可视化利器

观测云

链路追踪 应用性能监控 火焰图

优测云测试平台 | 有效的单元测试(下)

优测云服务平台

单元测试 单元测试必要性

GitHub Universe 2023:AI 技术引领软件开发创新浪潮

不在线第一只蜗牛

人工智能 GitHub AI

为什么开发不能兼任测试?普通人不知道的冷知识指南

代码生成器研究

如何挑选护眼灯?光照均匀度、色温、眩光这3点!

电子信息发烧客

走进生成式 AI,看见云上实验室创意作品!

科技热闻

从稳定性、响应速度、可用率全面测试行业标杆罗拉ROLA-HTTP代理

Geek_bf375d

是效率利器还是程序黑盒?为什么程序员都抵制低代码?

代码生成器研究

什么行业适合做谷歌SEO?

九凌网络

2023 年是无代码的一年,还要程序员吗?

伤感汤姆布利柏

前端 低代码 开发

罗拉rola-ip详解长效代理IP和短效代理IP的区别是什么?

Geek_bf375d

彩虹桥架构演进之路-性能篇

得物技术

数据库 nio 中间件 高性能

成本2元开发游戏,最快3分钟完成!全程都是AI智能体“打工”,大模型加持的那种

Openlab_cosmoplat

Vue+SpringBoot前后端分离项目分享

树上有只程序猿

前后端分离 Vue3 spring-boot

IP长效代理,稳定、高效网络罗拉rola-ip代理服务

Geek_bf375d

最佳实践-使用Github Actions来构建跨平台容器镜像

EquatorCoco

GitHub 前端 集成平台

TuGraph Analytics动态插件:快速集成大数据生态系统

TuGraphAnalytics

大数据 插件 数据集成 图计算 Connector

触目惊心:AI到底消耗了多少能源和成本?_AI&大模型_张之栋_InfoQ精选文章