写点什么

发没发布吵了一周,你在对 GPT-4.5 期待些什么?

  • 2023-12-18
    北京
  • 本文字数:2563 字

    阅读完需:约 8 分钟

大小:1.29M时长:07:29
发没发布吵了一周,你在对GPT-4.5期待些什么?

“我上周一直都在告诉你们 GPT-4.5Turbo 即将发布,有人说我说瞎话,有人说我疯了。他们说是假新闻,但它就在这里,GPT-4.5 Turbo 不仅上线了,而且还处于保密状态。”网友 Wes Roth 在自己的视频里说道。Wes Roth 透露,OpenAI 的 GPT-4.5 Turbo 已经开始灰度测试,并展示了测试结果:

 


 其他网友测试后也给出了相同的结果:



还有网友称,自己在 iPad 版本上测试成功,但在桌面版本上不行。“不过,当要求详细信息时,它就会变得非常通用。”还有网友在移动端测试也成功了。

 

推特著名爆料博主 Jimmy Apples 也表示,当反复询问其版本时,他注意到模型的不同反应。“令我印象深刻的是该模型在移动设备上承认是 GPT-4.5 Turbo,而桌面查询却产生了不同的结果。”

 

目前,很多都是对于 GPT-4 Turbo 灰测的结果大多来源于用户对 ChatGPT 提问后得到的回答。网友“Bahou”对此表示,“我相信这是一种幻觉。”Bahou 给出的具体理由如下:

 

  1. 我们无法证明 GPT-4 总是正确或错误地回答这个问题。如果你不断地重试这个问题,你会得到不同的结果,其中之一可能是正确的。

2. 系统提示仍然显示 GPT-4。

3. GPT 向人学习,在过去的几天里,可能有很多问题使模型倾向于谈论 GPT-4.5。

 

还有网友猜测,“这似乎来自它的训练数据。也有可能他们已经开始训练 GPT-4.5,但尚未完成,因此并未公布。”

 


值得注意的是,Reddit 上一篇发布不久的“GPT-4.5 Turbo已经正式发布”的帖子被删掉。其中就有用户表示,自己并没有看到这个版本:



根据一些说法,GPT-4.5 Turbo 将在推理和“不那么懒惰”方面取得一些进步。但有网友表示,如果当前所谓灰度测试的就是 GPT-4.5 Turbo,“那么改进似乎并不太显著,否则我们会看到一些巨大的飞跃。”

 

“太棒了,你应该让 Altman 知道这件事!”有网友调侃道。实际上,在 12 月 14 日时候就有用户问道关于 GPT-4.5 是否泄漏的问题,但 Altman 给出了模棱两可的回答。



一名疑似 OpenAI 员工的网友否认这个消息:“兄弟们,你们需要对疯狂的人工智能炒作有更多的抵抗力。没有 4.5,如果有,也不会静默发布。 ”

GPT-4.5 到底啥样?

 

最早表示 GPT 4.5 泄露的是 reddit 上的一个帖子(现已经被删除):



GPT 4.5 将被描述为 OpenAI 最先进的“一款”模型,具备全新多模态能力,文本语音图片以及视频和 3D 信息全都能一并处理,并且还可以跨模态理解。从泄漏的截图可以看出,OpenAI 可能推出三种型号:

 

• GPT-4.5,每 1 千输入 token 0.06 美元,每 1 千输出 token 0.18 美元;

• GPT-4.5-64k,每 1 千输入 token 0.12 美元,每 1 千输出 token 0.36 美元;

• GPT-4.5-音频 &语音,每分钟输入 0.012 美元,每分钟输出 0.024 美元;

 

如果泄露的信息为真,那么相比之前的 GPT-4 Turbo 模型,GPT-4.5 的价格提高了整整 6 倍,GPT-4.5-64k 的价格提高了 12 倍。

 

该消息爆出时,Jimmy Apples 表示:“OpenAI 或将在 12 月底前发布 GPT-4.5。”科技圈知名爆料人 futuristflower 也认为屏幕截图泄露的信息基本正确,只是无法验证截图是否是官方的。这两位的说法让大家普遍认为 GPT-4.5 就会在这个月发布。

 

也不怪大家这么期待 GPT-4.5,一方面,OpenAI 的发布会总会给人“惊喜”,另一方面,人们发现最近的 GPT-4 变得有些“懒惰”,老是拒绝执行某些任务或直接返回简化的结果。

 

目前,OpenAl 还没有公开详细介绍 GPT-4.5 的技术细节和改进,但 ChatGPT 有回答“它的设计目的是在会话式 AI 应用程序中提供高效和有效的响应。”

 

根据外媒的预测,GPT-4.5 可能基于令人难以置信的 1.8 万亿个参数,而 GPT 3.5 仅有 1750 亿个参数。GPT-4.5 几乎肯定会考虑更多参数,并接受更多最新数据的训练。

 

GPT-4 仅限于 2021 年秋季之前的数据,未来 GPT-4.5 模型可能至少会基于 2022 年的信息,也可能会持续到 2023 年。它还可能可以立即访问网络搜索和插件,GPT-4 已引入该功能几个月了。

 

GPT-4 的推出还增加了 ChatGPT 识别图像的能力,并对提示做出更自然、更细微的响应。GPT-4.5 可以再添加新功能,也许能够分析视频,或本地执行一些插件功能,例如阅读 PDF 文档,或者甚至帮助教学。

 

GPT-4.5 也有可能能够记住更多信息,利用过去的对话来构建对未来的响应。GPT-4.5 也可能比 GPT-4 更加高效,运行资源需求更少,这有可能使其能够在更小的设备上运行并更快地响应。

GPT-5 都在路上了

 

在大家纷纷期待 GPT-4.5 时,OpenAI 已经开始了 GPT-5 的研发。

 

Sam Altman 在一次最新的采访中对外透露出,下一代人工智能模型 GPT-5 正在开发中。Altman 还表示,计划从微软获得更多资金支持,用以创造相当于人脑的超级 AI——通用人工智能(AGI)。

 

不过, Altman 并没有透露具体的时间和进度,只是说 GPT-5 会比 GPT-4 更加复杂,连他也无法准确预测 GPT-5 会具有哪些新功能和新技能。

 

Altman 表示,GPT-5 的终极目标就是是相当于人脑的超级 AI,目前 OpenAI 在构建 AGI 方面还是取得了一定进展,而大语言模型(LLM)是构建 AGI 的核心部分:“语言是压缩信息很好的一个方法,我们已经用 GPT-3 证明了这一点,而谷歌 DeepMind 却错失了这一机会,虽然这些公司也有很多聪明人,但他们并没有这么做。”

 

但要做好 GPT-5 并不容易。Altman 在公开场合表示需要更多的数据。除了来自公共在线的数据资源,OpenAI 还寻求利用未公开提供的、更高质量的数据资源。

 

OpenAI 还需要大量的 GPU。据报道,GPT-5 的训练需要 5 万张英伟达 H100 的加持。Altaman 此前也表示 OpenAI 很缺 GPU,以至于并不希望太多人用 ChatGPT。此前,OpenAI 就受到 GPU 的限制,推迟了微调、专用容量、32k 上下文窗口、多模态等短期计划。Altman 表示,最近收到了一批英伟达最新的 H100 芯片,他预计 2024 年供应将进一步放松。

 

Altman 没有承诺 GPT-5 的发布时间,但即使很快开始训练,该模型也不会在短期内面世。根据其大小和设计,训练可能需要数周或数月的时间。然后原始算法必须经过很多人的压力测试和微调以确保其安全。该公司花了八个月的时间打磨并在测试后发布了 GPT-4。尽管现在竞争格局更加激烈,但 GPT-4 的到来比 GPT-3 晚了近三年。

 

不过值得注意的是,比尔·盖茨评论称,“GPT-5 不会比 GPT-4 好多少。”他认为,当前生成式人工智能已经达到极限。

 

相关链接:

https://twitter.com/BahouPrompts

https://www.digitaltrends.com/computing/gpt-45-language-model/

https://singularityhub.com/2023/11/15/openai-ceo-sam-altman-says-his-company-is-now-building-gpt-5/

2023-12-18 14:474302

评论

发布
暂无评论

从 Gitee 到极狐GitLab 的迁移指南

极狐GitLab

迁移 gitee 极狐GitLab

3DCAT首届行业生态交流会|瑞云科技技术总监赵志杰:实时渲染助力元宇宙应用触手可及

3DCAT实时渲染

云计算 公有云 云渲染 元宇宙

微信业务架构图

Geek_36cc7c

微信业务架构图 & 学生管理系统设计

tom

凡泰极客荣获2021 InfoQ“最佳技术产品营销奖”

FinClip

InfoQ

Hive SQL语句的正确执行顺序

五分钟学大数据

1月月更

企业微信业务架构分析

Geek_1b4338

#架构实战营

模块一作业

Geek_ec866b

架构实战营

百度AICA再添57位“首席AI架构师”,人工智能与产业场景结合愈发深入

百度大脑

如何知道自己是否适合做产品经理?

石云升

产品经理 1月月更

云厂商第一家,腾讯安全获国家级信息安全服务资质“双认证”!

腾讯安全云鼎实验室

云安全 安全服务

TCP长连接实践与挑战

字节跳动终端技术

字节跳动 TCP 后端 HTTP 连接池

架构实战营-模块一作业

炎彬

「架构实战营」

专访深职院XR专家 | 实时云渲染赋能虚拟仿真实训,打造5G+XR智慧教育平台

3DCAT实时渲染

教育 XR VR/AR 云渲染 元宇宙

2022年1月国产数据库排行榜:TiDB霸榜两年势头不减,openGauss与OceanBase分数大涨

墨天轮

数据库 opengauss TiDB 国产数据库

三峡集团研究院:基于物联网的大规模储能系统能量管理和智能运维平台数据接入方案

EMQ映云科技

物联网 mqtt 碳中和 边云协同 新能源

为什么 Cpython 是 C 写的,而不是 Python

宇宙之一粟

Python 1月月更

架构训练营作业1

Richard

架构实战营

Apache APISIX 2.12.0 版本发布,新功能更适配新一年!

API7.ai 技术团队

开源 后端

模板

Anthony

Hive底层数据存储格式详解

五分钟学大数据

hive 1月月更

企业管理中用户数据同步机制解决思路

全象云低代码

低代码 数据同步 用户数据 后端技术

领域划分的规则是什么

神帅

DDD 领域划分规则

DDD独立类模式你用到了吗

神帅

DDD 独立类模式

投票开始 | 和你一起见证龙蜥社区年度优秀开发者的诞生

OpenAnolis小助手

开源 开发者 活动 社群 比赛

做了这么多年架构师,我终于理解了什么是架构设计

博文视点Broadview

学生管理系统架构设计方案

Geek_36cc7c

天津银行周传凯:从 0 到 1,我的分布式数据库落地经验谈

OceanBase 数据库

分布式 OceanBase 开源 OceanBase 社区版 客户实践

请求管理 | 洞态 IAST 在好大夫 SDL 中的最佳实践

火线安全

信息安全 SDL DevSecOps

架构实战营模块一作业

刘璐

微信的业务架构&学生管理系统架构设计

随欣所遇

架构实战营

发没发布吵了一周,你在对GPT-4.5期待些什么?_AI&大模型_褚杏娟_InfoQ精选文章