作者 | 华卫
9 月 19 日,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型。每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。截至 2024 年 9 月中旬,通义千问开源模型累计下载量已突破 4000 万,成为仅次于 Llama 的世界级模型群。
“人们对新技术革命,往往对短期高估,又对长期低估,但它会在你的怀疑中成长,在你在迟疑中错过大趋势。”
当日,在刚刚开幕的阿里 2024 云栖大会上,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表主题演讲,分享了对 AGI 变革趋势、生成式 AI 的应用巨变和 AI 算力发展的最新观点。
他认为,过去 22 个月,AI 发展的速度超过任何历史时期,但我们依然还处于 AGI 变革的早期。下一阶段,全世界先进模型的投入门槛是几十亿、几百亿美金级别。
吴泳铭表示,生成式 AI 最大的想象力,绝不是在手机屏幕上做一两个新的超级 app,而是接管数字世界,改变物理世界。并且,他预测道,机器人将是下一个迎来巨变的行业,未来所有能移动的物体都会变成智能机器人。
算力方面,吴泳铭指出,过去一年,阿里云投资新建了大量的 AI 算力,但还是远远不能满足客户的旺盛需求。未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成 GPU AI 算力为主、CPU 传统计算为辅的计算模式。
以下为演讲全文(在不改变原意上有删减):
在刚刚过去的夏天,阿里云全面支撑巴黎奥运会实现了历史性突破,云计算首次超越卫星,成为奥运主要转播方式。AI 也首次广泛应用于奥运会。今天,云栖大会的焦点也是 AI。我主要分享三点内容:
大模型发展远超摩尔定律
第一,过去 22 个月,AI 发展的速度超过任何历史时期,但我们现在依然还处于 AGI 变革的早期阶段。
大模型技术快速迭代,技术可用性大幅提升。大模型已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。
同时,模型推理成本指数级下降,已经远远超过摩尔定律。一年来,通义千问 API 在阿里云百炼上的调用价格下降了 97%,百万 Tokens 调用花费最低已经降到了 5 毛钱。推理成本是应用爆发的关键问题,阿里云会努力把成本继续降下去。
开源生态蓬勃发展。今年 6 月,通义千问开源 Qwen2,迅速登顶 Huggingface 的全球开源模型排行榜。在 Huggingface 上,Qwen 的原生和衍生模型接近 5 万个,排名全球第二。阿里云魔搭社区上有超过 1 万个模型、服务了超过 690 万开发者。
这一切才刚刚开始,要实现真正的 AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。AI 具备创造能力、帮助人类解决复杂问题的路径清晰可见,也打开了 AI 在各行业场景中广泛应用的可能性。
生成式 AI 将创造超互联网十倍价值
第二,AI 最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。
今天很多行业内人士一直在想 AI 最大的应用是什么,可能一直在想手机上有什么 AI 时代创新的超级 APP。但我们认为 AI 最大的想象力绝对不是在手机屏幕上,AI 最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界,这才是 AI 最大的想象力。
我们不能只停在移动互联网的视角看未来。生成式 AI 最大的想象力,绝不是在手机屏幕上做一两个新的超级 app,而是接管数字世界,改变物理世界。
过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式 AI 是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。
我们认为生成式 AI 将逐渐渗透数字世界,并接管数字世界,物理世界的大部分事物都会具备 AI 能力,形成下一代的具备 AI 能力的全新产品,并与云端 AI 驱动的数字世界连接产生协同效应。
很长一段时间,AI 的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式 AI 的崛起,带来了质的飞跃,AI 不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。
生成式 AI 让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音,或者是人类千百年来的思考。AI 模型可以通过对物理世界数据的 Token 化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI 就可以模仿人类去执行物理世界的任务。这将带来新的产业革命。
我们看到,汽车行业正在发生这样的变革。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI 模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。
机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。
未来,工厂里会有很多机器人,在 AI 大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。
可以想见,AI 驱动的数字世界连接着具备 AI 能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。
GPU AI 算力将改写所有应用
第三,AI 计算正在加速演进,成为计算体系的主导。
无论是我们看到端侧的计算,还是云端的世界,这都是一个非常明显的趋势。生成式 AI 对数字世界和物理世界的重构,将带来计算架构的根本性变化。过去几十年,CPU 主导的计算体系,正在加速向 GPU 主导的 AI 计算体系转移。未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成 GPU AI 算力为主、CPU 传统计算为辅的计算模式。
我们看到,在新增算力市场上,超过 50%的新需求由 AI 驱动产生,AI 算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的 AI 算力,但还是远远不能满足客户的旺盛需求。
今天我们接触到的所有客户、所有开发者、所有 CTO,几乎都在用 AI 重构自己的产品。大量新增需求正在由 GPU 算力驱动,大量存量应用也在用 GPU 重新改写。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动 APP、游戏等行业,AI 计算正在加速渗透。在各行各业,看不见的新产业革命正在悄然演进。
所有行业,都需要性能更强、规模更大、更适应 AI 需求的基础设施。
阿里云正在以前所未有的强度投入 AI 技术研发和基础设施建设。我们的单网络集群已拓展至十万卡级别,正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面,重新打造面向未来的 AI 先进基础设施。
从历史经验来看,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。
评论