
1 月 16 日,智谱 AI 团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并重磅发布了新一代基座大模型 GLM-4。
根据智谱 AI 的介绍,GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。具体包括:支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页;在 needle test(大海捞针)测试中,128K 文本长度内 GLM-4 模型均几乎 100%的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题等。
在多模态能力方面,我们也进行了尝试:(生成等待时间有点长,我们剪辑了下~)

输入“以智谱 AI 发布大模型为主题,制作一张图片”,最后生成的图片如下:

想看 GML-4 和 GPT-4 对比的“数据党”,可以看如下对比:
GLM-4 在 MMLU(81.5)达到 GPT-4 的 94%;GSM8K(87.6) 达到 GPT-4 的 95%;MATH(47.9)达到 GPT-4 的 91% ;BBH (82.25) 达到 GPT-4 的 99%;HellaSwag (85.4) 达到 GPT-4 的 90% ;HumanEval(72)达到 GPT-4 的 100% 水平。

此外,GLMs 个性化智能体定制能力同步上线。
用简单的提示词指令就能创建属于自己的 GLM 智能体并分享:(等待时间也略长,我们剪辑了下~)

想尝试的朋友可以智谱清言官网:https://www.chatglm.cn/
智谱 AI CEO 张鹏同时表示,GLMs 模型应用商店、开发者分成计划也即将发布。

此外,GLM-4 的 All Tools 能力全新发布。
基于 GLM 模型的 Agent 能力,GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。
GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果,GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。
处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。

2024 年,智谱 AI 也将发起开源开放的大模型开源基金,该计划包括三个“一千”:智谱 AI 将为大模型开源社区提供一千张卡,助力开源开发;提供 1000 万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供 1000 亿免费 API tokens。
张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱 AI 也将“Z 计划”进一步升级,联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。
已经尝试了 GLM-4 的小伙伴,快来说说你的使用体验呀~
公众号推荐:
跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

评论