写点什么

斯坦福 15 张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI 争当基础模型“劳模”

  • 2024-04-18
    北京
  • 本文字数:3020 字

    阅读完需:约 10 分钟

大小:1.54M时长:08:57
斯坦福15张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”

整理|华卫

 

“十年前,全世界最好的人工智能系统都无法以人类水平对图像中的物体进行分类。人工智能在语言理解方面困难重重,更无法破解数学领域。如今,人工智能系统在标准基准上的表现已广泛超过人类。”

 

今年,斯坦福 HAI 研究所的人工智能指数报告如期而至。据 AI Index 联合总监 Ray Perrault 介绍,2023 年人工智能领域进展迅猛,科技公司正在竞相构建相关产品,GPT-4、Gemini 和 Claude 3 等先进工具带来令人印象深刻的多模态功能,正越来越多地被公众使用;但当前的人工智能技术仍存在重大问题,如无法可靠处理事实、进行复杂推理以及结论解释。

 

在长达 393 页的《2024 人工智能指数报告》中,斯坦福 HAI 研究所不仅更广泛地涵盖基本趋势,如人工智能的技术进步、公众对技术的看法以及围绕其发展的地缘政治动态,还详细分析了比以往更多的原始数据。

 

其中,下面 15 张图表反映了整个 AI 领域 2023 年的状况和 2024 年的态势。

 

1. 生成式 AI 投资激增

 

虽然去年人工智能的私人投资下降、全球对人工智能的总体投资连续第二年下降,但生成式 AI 领域的私人投资激增,比 2022 年增长了近八倍,达到 252 亿美元。并且,大部分对生成式 AI 的私人投资都发生在美国。



报告的主编 Nestor Maslej 表示,“去年的资本形势代表了人们对生成式 AI 的反应,无论是在政策和公众舆论上,还是行业投资中。”

 

2. 谷歌在基础模型竞赛中占据主导地位

 

2023 年,工业界产生了 51 个著名的机器学习模型,而学术界仅贡献了 15 个。其中,谷歌在 发布的基础模型数量最多。



科技公司发布基础模型既是为了推动先进技术向前发展,也是为了给开发人员提供构建产品和服务的基础。自 2019 年以来,谷歌一直在发布基础模型方面处于领先地位,OpenAI 次之。

 

3. 封闭模型优于开源模型

 

目前,人工智能领域的热门争论之一是基础模型应该是开源的还是封闭的,一些人认为开源模型是危险的,而另一些人表示是开源模型推动了创新。该报告并没有对其进行权衡,而是着眼于各自的发布趋势和基准表现。

 

2023 年全球发布的新大型语言模型数量比上一年翻了一番,在发布的 149 个基础模型中,98 个是开源的,23 个通过 API 提供部分访问,28 个是封闭的。虽然三分之二是开源的,但性能最高的模型来自拥有封闭系统的行业参与者。在许多常用的基准测试中,封闭模型的表现优于开源模型。



4. 基础模型变得超级昂贵

 

培训一个大模型需要多深的财力?据报告显示,AI 模型训练成本随着时间的推移急剧增加,如今先进 AI 模型的训练成本已达到了前所未有的水平。其中,OpenAI 的 GPT-4 和谷歌的 Gemini Ultra 分别需要 7800 万美元和 1.91 亿美元的训练成本。



有趣的是,谷歌 2017 年发布的 Transformer 模型引入了支撑当今几乎所有大型语言模型的架构,其训练成本仅为 930 美元。

 

5. 大量释放碳足迹

 

训练 AI 模型对环境的影响不可忽视,虽然推理的每次查询排放可能相对较低,但当模型每天被查询数千次甚至数百万次时,总影响足以超过训练。

 

并且,由于模型规模、数据中心能源效率和能源电网的碳强度等因素,不同模型的碳排放数据差异很大。例如,Meta 的 Llama 2 70B 模型释放了约 291.2 吨碳,这几乎是一名旅客从纽约到旧金山往返航班上碳排放量的 291 倍,是普通美国人一年总碳排放量的 16 倍。然而,Llama 2 的碳排放量仍低于 OpenAI 的 GPT-3 训练期间释放的 502 吨。

 


6. 美国在基础模型方面处于领先地位

 

2023 年,全球大多数基础模型来自美国(109 个),其次是中国(20 个)和英国。自 2019 年以来,美国在发布的基础模型数量和被认为是重大技术进步的人工智能系统数量都处于领先地位。此外,报告指出,中国在授予的人工智能专利和工业机器人的安装中处于领先地位。



7.工业界的博士浓度更高

 

新晋的人工智能博士毕业后选择在哪里工作?据报告中强调,进入工业界的人工智能博士毕业生越来越多。2011 年,工业界(40.9%)和学术界(41.6%)的就业比例还大致相同。到 2022 年,毕业后选择加入工业界的比例就大得多,达到 70.7%。但在过去五年中,进入政府职位的人工智能博士毕业生比例一直相对较低,稳定在 0.7%左右。



8. 报考人员的多样性增加

 

与高等教育 CS 的趋势类似,AP CS 考生的种族多样性正在增加。虽然白人学生仍然是最大的群体,但随着时间的推移,亚裔、西班牙裔/拉丁裔/拉丁裔和黑人/非裔美国学生参加 AP CS 考试的人数有所增加。

 


9. 财报电话会议中的提及次数增加

 

在过去的一年里,在财富 500 强公司财报电话会议上提到人工智能的人数显著增加。2023 年,有 394 次财报电话会议提到了人工智能(占所有财富 500 强公司的近 80%),高于 2022 年的 266 次。自 2018 年以来,《财富》500 强财报电话会议中提及 AI 的次数几乎翻了一番。



而在所有财报电话会议中,最常被提及的主题是生成式 AI,占所有财报电话会议的 19.7%,其次是人工智能投资、人工智能能力扩展和人工智能增长计划(15.2%),最后是公司/品牌人工智能(7.6%)。

 

10. 成本下降,收入增加

 

报告表明,人工智能切实帮助企业提高了利润,有 42%的受访者表示他们看到了成本的降低,59%的受访者声称收入增加了,而这反映了工作效率的提高和工人生产力的提高。



此外,不同领域的多项研究表明,人工智能使工人能够更快地完成任务并产生更高质量的工作,但人工智能对低技能工人的帮助大于对高技能工人的帮助。还有一些研究警告说,在没有适当监督的情况下使用人工智能会导致性能下降。

 

11. 企业感知到风险

 

该报告对 1000 家收入至少为 5 亿美元的公司进行了一项全球调查,以了解企业如何看待负责任的 AI。结果显示,隐私和数据治理被认为是全球最大的风险,而公平性(通常以算法偏见为讨论)仍未在大多数公司中得到认可。目前,企业正在对其感知到的风险采取行动:各地区的大多数组织已经实施了至少一项负责任的人工智能措施来应对相关风险。



12. 人工智能并没有完全打败人类

 

近年来,人工智能系统在一系列任务上的表现都超过了人类,包括图像分类、视觉推理和英语理解方面的一些基准。然而,它在更复杂的任务上落后了,比如竞赛级的数学、视觉常识推理和规划。

 


13. 缺乏对人工智能的标准化评估

 

其最新研究表明,负责任的人工智能报告严重缺乏标准化。例如,OpenAI、Google 和 Anthropic 在内的领先开发人员主要根据不同的负责任的 AI 基准测试他们的模型,这种做法使系统地比较顶级人工智能模型的风险和局限性变得困难。

 


14. 法律既促进又限制人工智能

 

2016 年至 2023 年期间,有 33 个国家至少通过了一项与人工智能相关的法律,其中大部分行动发生在美国和欧洲。在此期间,总共通过了 148 项与人工智能相关的法案,归类为旨在增强一个国家人工智能能力的扩张性法律和限制人工智能应用和使用的限制性法律。虽然许多法案都在推动人工智能的发展,但限制性立法是全球趋势。

 


15.公众对人工智能更加焦虑

 

在 lpsos 的一项调查中,2023 年有 52%的人表示对人工智能产品和服务感到紧张,比 2022 年上升了 13 个百分点;现在有三分之二的人预计人工智能将在未来几年内深刻改变他们的日常生活。此外,报告指出,不同人群之间的观点存在显著差异,年轻人更倾向于对人工智能将如何改变他们的生活持乐观态度。

 


有趣的是,很多对于人工智能的悲观情绪来自西方发达国家。而印度尼西亚和泰国等地的受访者表示,他们预计人工智能的好处将大于其危害。

 

参考链接:

https://spectrum.ieee.org/ai-index-2024

https://hai.stanford.edu/research/ai-index-report

https://aiindex.stanford.edu/report/

2024-04-18 10:416149

评论 1 条评论

发布
用户头像
你要不要看看你发的东西能不能正常显示

2024-04-25 09:25 · 北京
回复
没有更多了
发现更多内容

ATT&CK V11版本发布,新增结构化检测内容

青藤云安全

不愧是阿里高工耗时182天肝出来1015页分布式全栈手册,从基础到高级,把分布式核心原理讲得明明白白

Java全栈架构师

程序员 架构 面试 分布式 程序员人生

手机网站一键秒变App?详细教程来了

YonBuilder低代码开发平台

APP开发 APICloud 手机网站

不用PyScript,网页端运行的Python编辑器

OpenHacker

Python 编辑器 代码编辑器

银行借助纵向联邦学习 集中化进行长尾客群的精准营销

易观分析

联邦学习 联邦计算

技术创新!青藤威胁检测论文入选国家中文核心期刊

青藤云安全

论文 威胁检测

做不好资产清点的网络安全防护都是耍流氓!

青藤云安全

又是一年开源之夏,八大课题项目奖金等你来拿!

白鲸开源

Apache 大数据 开源 DolphinScheduler workflow

2年,0事故,效能提升10倍的云原生安全最佳实践

青藤云安全

金融行业 金融服务安全 青藤

满足多用途和峰值性能需求,英特尔 Arctic Sound-M成就出色游戏串流体验

科技新消息

如何使用Python实现图像融合及加法运算

华为云开发者联盟

Python OpenCV 图像处理 图像融合 加法运算

DPDK背景和优势,赶紧学起来运用吧

C++后台开发

虚拟化 Linux服务器开发 DPDK C++后台开发 高性能网络

什么是流动性池?(上)|流动性池的出现及名词解析

区块链前沿News

流动性 Hoo

重入锁与读写锁

急需上岸的小谢

5月月更

贝壳上云&云上架构

赵亮-贝壳云原生

云原生 监控 框架 链路 扩缩容

华为手机用户找歌不用愁,HarmonyOS 2版本更新上线“听歌识曲”

科技汇

毕业设计项目

凌波微步

「架构实战营」

青藤正式加入微软MAPP计划

青藤云安全

重复造轮子?TCP天然支持可靠传输为什么还需要基于UDP实现可靠传输?

Java全栈架构师

程序员 字节跳动 面试 TCP 网络

什么是IP地址盗用?又要如何预防?

郑州埃文科技

IP地址 IP地址盗用 安全防御

Hacker 资讯 | 5 月上旬区块链黑客松活动汇总

One Block Community

区块链

【OpenCV】配置OpenCV教程,OpenCV入门

恒山其若陋兮

5月月更

应“云”而生,软件觉醒 揭秘华为云软件开发生产线DevCloud如何呼唤高效“开发”

科技热闻

一文详述DMS资源池队列阻塞告警及原理

华为云开发者联盟

数据库 资源池 DMS 队列阻塞告警 资源池队列阻塞

当你运行npm run命令时,会发生什么

华为云开发者联盟

JavaScript typescript npm Script run命令

引领创新!青藤入选“网信自主创新尖锋企业”

青藤云安全

服务器CPU和普通CPU有什么区别?常用的服务器有六大区别

Finovy Cloud

深度学习 gpu GPU算力

龙蜥云原生机密计算 SIG 成立,7 大开源项目重磅亮相!

OpenAnolis小助手

云原生 开源项目 龙蜥社区 sig

2022年3月视频行业用户洞察:用户增长,长短视频探索共赢新模式

易观分析

短视频 视频

10个产品主导的增长原则|Bessemer

观测云

青藤参与编写的《数据安全法》实施参考(第一版)发布

青藤云安全

斯坦福15张图揭示最新 AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”_AI&大模型_华卫_InfoQ精选文章