写点什么

程序员三个月前就攻破并玩透的 SearchGPT,OpenAI 可算发布了

  • 2024-07-31
    北京
  • 本文字数:2698 字

    阅读完需:约 9 分钟

大小:1.34M时长:07:49
程序员三个月前就攻破并玩透的SearchGPT,OpenAI 可算发布了

OpenAI 正式宣布备受期待的搜索市场新产品——SearchGPT,这是一款由 AI 驱动的搜索引擎,能够实时访问互联网信息。

 

该搜索引擎以一个大型文本框开始,询问用户“您在寻找什么?”但与返回普通链接列表不同,SearchGPT 试图对这些信息进行整理和解释。

 

例如,用户在 SearchGPT 中搜索“2024 年 8 月北卡罗来纳州布恩的音乐节”。该模型提供了从网络抓取的实时信息,包括来源链接。

 


在另一个示例中,SearchGPT 解释了何时种植西红柿,并详细介绍了不同品种的西红柿。结果出现后,用户可以继续提问或点击侧边栏打开其他相关链接。

 


还有一个名为“视觉答案”的功能,但 OpenAI 没有详细解释其工作原理。

 


SearchGPT 的“视觉答案”功能展示了由 OpenAI 的 Sora 生成的 AI 视频。

 

SearchGPT 目前仅是一个“原型”,该服务由 GPT-4 系列模型提供支持,初期仅向 10,000 名测试用户开放。OpenAI CTO Mira Murati 表示最终目标是将搜索功能直接整合到 ChatGPT 中。

 


我们的 SearchGPT 原型现已上线。我们正在寻找反馈意见,以便准备将这一体验集成到 ChatGPT 中。

 

谷歌股价暴跌

 

这个新产品已经被传闻了几个月,一些 X 用户还注意到 OpenAI 一直在开发的新网站。据说原本是计划于 4 月发布的产品,推迟到现在足足晚了三个月。另外,据外媒 The Verge 五月份的报道,OpenAI 一直在积极招募 Google 搜索团队的员工,但引用的消息人士没有透露 OpenAI 已经招募了多少位员工。

 


早在 2 月份,The Information 就曝出消息称,OpenAI 正在开发一款网络搜索产品来挑战谷歌。

 

到了 4 月,AIPRM Corp 首席工程师 Tibor Blaho 在推特上表示,Sonic - SNC(SearchGPT)代理似乎已经处于评估阶段,具有图像搜索、各种小组件(如天气、计算器、体育、金融和时区差异),还可以进行后续提问。模型选用了 GPT-4 Lite(Scallion;POR)、GPT-4 或 GPT3.5(Sahara-V),并结合了不同的搜索引擎,包括 Bing(POR)、Sydney、Fortis 和内部搜索(Labrador)。

 



同时他还于 4 月 29 日给出了 SearchGPT 的短视频预览,基本与其当前展示的 SearchGPT 预览视频相差无几。

 

虽然今天只发布了几个示例,但已经有眼尖的网友挑出其中的错误:

 


有网友表示,在这种情况下,搜索结果应该给出“找不到答案,但这是最接近的匹配项”,而不是给出“幻觉”。

 

某种程度来说,除了引用来源之外,它与现今的 ChatGPT 并没有太大区别。

 

另一个问题是速度。Google 之所以成为互联网的入口,是因为它非常快。Google 对其速度非常自豪,甚至会显示生成响应所需的时间,而且总是以秒的几分之一计。相比之下,生成式 AI 的速度更适合用“每分钟多少字”来衡量,就像评判打字员一样。当你只是想做些简单的事情或去某个地方时,坐在那里等待几秒钟,看着文字一个字一个字地慢慢出现,可能会令人烦躁。比如现在一次 Google 搜索用了 0.41 秒生成了一整页文本,OpenAI 的搜索引擎需要多长时间呢?

 

虽然目前还看不出 SearchGPT 比 Google 搜索强在哪里,但 Sam Altman 倒是雄心勃勃,他认为现在的搜索还有更多改进空间,并且 alpha 版本将于下周开始向 Plus 订阅用户推出!

 


这可能还是标志着对 Google 构成重大威胁的开始。Google 急于在其搜索引擎中加入 AI 功能,担心用户会转向这些新的竞争产品,以至于 Google 在推出 AI Overviews 时建议我们在披萨上放胶水。这也使 OpenAI 与初创公司 Perplexity 形成更直接的竞争,后者自称为 AI “答案”引擎。Perplexity 最近因其 AI 摘要功能被批评,有出版商声称该功能剽窃了他们的作品。

 

OpenAI 似乎已经注意到此前的反响,并表示将采取截然不同的方法。在一篇博客文章中,该公司强调,SearchGPT 是与多家新闻合作伙伴合作开发的,这些合作伙伴包括《华尔街日报》、美联社等组织。Wood 表示:“新闻合作伙伴提供了宝贵的反馈意见,我们将继续寻求他们的意见。”他们写道,出版商将有办法“管理他们在 OpenAI 搜索功能中的展示方式”。他们可以选择不将其内容用于训练 OpenAI 的模型,但仍然可以出现在搜索结果中。

 

根据 OpenAI 的博客文章,“SearchGPT 旨在通过在搜索结果中显著引用并链接到出版商,帮助用户与出版商建立联系。”回答中有明确的内嵌命名引用和链接,因此用户可以知道信息的来源,并可以快速通过侧边栏的来源链接与更多结果互动。

 

谷歌股价在 OpenAI 演示 SearchGPT 立即暴跌。

 


服务器和人才成本高昂

 

OpenAI 的快速进展为 ChatGPT 赢得了数百万用户,但该公司的成本也在不断增加。The Information 基于此前未披露的内部财务数据和该公司知情人士的说法,认为这家 ChatGPT 开发商今年可能亏损高达 50 亿美元。

 

具体来看,在成本方面,据一位直接了解支出的人士透露,截至今年 3 月,OpenAI 已花费近 40 亿美元租用微软的服务器,为 ChatGPT 及其底层 LLM 提供支持(即推理成本)。除了运行 ChatGPT 外,OpenAI 的训练成本(包括数据费用)今年可能会飙升至 30 亿美元。

 

一位直接了解决策的人士表示,去年,OpenAI 加快了训练新 AI 的步伐,超出了最初的计划。该公司早些时候计划在这类成本上花费约 8 亿美元,但最终支出远高于预期。《The Information》估计,今年这类成本将翻番,因为 OpenAI 不仅在训练其旗舰 LLM 的新版本,还开始训练一种新的旗舰模型。

 

此外,OpenAI 目前雇佣了约 1500 名员工,员工数量还在迅速增加,预计员工成本约为 15 亿美元。这主要是由于与谷歌等巨头激烈争夺技术人才。

 

根据知情人士透露,OpenAI 预计 2023 年的人力成本为 5 亿美元,到 2023 年年底,员工人数增加一倍,达到约 800 人。从那以后,员工人数几乎又增加了一倍。该公司在官网上列出的近 200 个空缺职位,也许意味着 2024 年下半年可能会增加更多员工。

 

综合来看,OpenAI 今年的运营成本可能高达 85 亿美元。而就收入而言,ChatGPT 最近的年收入有望达到约 20 亿美元。

 

OpenAI 向访问其大模型 API 的开发人员收费,截至今年 3 月,该业务每月创造的收入超过 8000 万美元。

 

最近,OpenAI 每月的总收入为 2.83 亿美元,这意味着其全年收入可能在 35 亿美元至 45 亿美元之间,具体取决于下半年的销售额。

 

如果从最高 45 亿美元的收入中扣除 85 亿美元的潜在成本,则可能导致 40 亿美元至 50 亿美元的亏损。另外,SearchGPT 用户只会进一步推高计算成本。SearchGPT 在初期发布时对订阅用户将是免费的,鉴于该功能目前没有广告,显然公司需要尽快解决货币化问题。

 

参考链接:

https://chatgpt.com/search

https://www.theverge.com/2024/5/7/24151616/openai-is-entering-the-search-game

https://x.com/btibor91/status/1783603187993252338

https://x.com/kifleswing/status/1816542216678179083

2024-07-31 20:203414

评论

发布
暂无评论

安全RCE之未授权访问分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

【11月】InfoQ写作平台荣耀月报:名单出炉!

InfoQ写作社区官方

话题讨论 热门活动

elk简介与背景

小鲍侃java

签约计划第二季

Istio 实践手册 |服务网格框架对比

xcbeyond

istio 28天写作 12月日更 Istio 实践手册

使用docker安装elk环境

小鲍侃java

签约计划第二季

在 ABAP 里模拟实现 Java Spring 的依赖注入

汪子熙

Java 28天写作 SAP abap 12月日更

Linux一学就会之Centos-文件权限管理

学神来啦

云计算 Linux centos linux运维

前端避坑指南丨辛辛苦苦开发的APP竟然被判定为简单网页打包?

YonBuilder低代码开发平台

大前端 APP开发 APICloud 跨端开发

面试腾讯:渗透测试工程师题型汇总

喀拉峻

面试 网络安全 安全 渗透测试

数仓和数据中台长期霸权,数据湖最稳

用友BIP

数据胡

荣耀周榜公布!你上榜了么?2022.1.17-1.23

InfoQ写作社区官方

话题讨论 热门活动

数据库自增 ID 用完了会咋样?

CRMEB

小企业如何落地elk日志收集系统

小鲍侃java

内容合集 签约计划第二季

使用logstash监控微服务项目,并制定索引格式

小鲍侃java

签约计划第二季

使用linux搭建单机elk环境

小鲍侃java

签约计划第二季

使用logstash获取springboot控制台日志并传输到elasticsearch

小鲍侃java

签约计划第二季

数据中台的OneID是个什么鬼

用友BIP

数据中台 主数据

在 Windows 笔记本上调试运行在 iOS 设备上的前端应用

汪子熙

大前端 web api iOS Developer 28天写作 12月日更

大型前端项目 DevOps 沉思录 —— CI 篇d

CODING DevOps

ci DevOps 持续集成 工作流

恒源云(GPUSHARE)_opencv(论文笔记)

恒源云

深度学习

elk客户端与springboot整合

小鲍侃java

签约计划第二季

高可用 | repmgr 构建 PostgreSQL 高可用集群部署文档【建议收藏】

RadonDB

数据库 postgresql RadonDB

恒拓高科WorkPlus - 政企IM私有化解决方案

WorkPlus

logback获取bootstrap.yml配置

小鲍侃java

签约计划第二季

编曲时如何在FL Studio卷帘窗口修改单个音符音量

懒得勤快

VirtualBox 网络配置 NAT + Host-Only

李鑫磊

Kubernetes 虚拟机 网络配置 virtualbox

云编辑 | 使用 Cloud Studio 在线撰写预览并发布 Hugo 博客

宋天伦

CloudIDE Hugo Cloud Studio

低代码发展正当时,中国将取代美国成为低代码开发的全球领导者

金小K

RPA 低代码 低代码开发 低代码平台

在有道 | 同宇:一个正在老去的程序员

有道技术团队

程序员 技术人 工程师思维 人物访谈

一个基于HTML的可定制轮盘——帮你告别选择困难症

海拥(haiyong.site)

html 大前端 28天写作 签约计划第二季 12月日更

使用自定义注解打印logstash日志

小鲍侃java

签约计划第二季

程序员三个月前就攻破并玩透的SearchGPT,OpenAI 可算发布了_生成式 AI_Tina_InfoQ精选文章