写点什么

谷歌搜索反击,发布最有“谷歌风格”的 AI 应用!网友:为 Perplexity 付费已没有意义

  • 2024-12-30
    北京
  • 本文字数:2979 字

    阅读完需:约 10 分钟

大小:1.31M时长:07:39
谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义

“随着 Gemini 家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。”近期,谷歌又朝着打造世界上最实用个人 AI 助手这一目标迈出了重要一步:低调发布了 Deep Research 功能。


Deep Research 能够接收研究提示词、制定研究计划并为用户提供微调选项,之后执行全自动研究。它会扫描数十到数百个信息来源以获取关于查询的信息内容,而后生成关于结果的详尽报告。整个过程需要几分钟,大家可以在 Gemini 运行的过程中先去忙别的。在执行完成之后,生成的报告则可导出为 Google Docs 文档。


这也是 Gemini 强大推理能力的重要首秀,反映出谷歌打造 AI 智能体解决方案的决心与探索。

随时待命的个人 AI 研究助手


传统的在线研究工作往往困难重重。设想一下,身为一名研究生,您可能正在为即将到来的机器人演示做准备。您希望了解自动驾驶汽车传感器的发展趋势、检索不同技术的对接方式以及未来的发展方向。像这样的项目往往要耗费数小时进行研究,打开大量页面选项卡并交叉引用其中内容……很多人在过程当中往往会彻底迷失,绝望地翻找刚刚才看到过的链接或者段落。


Deep Research 的作用就是在用户监督之下替人完成这些令人头痛的工作。


在输入问题之后,它会创建一个多步骤的研究计划以供修改或者批准。在批准之后,Deep Research 就会代表用户深入分析来自网络的相关信息。


只需要几分钟的时间,Gemini 就能不断完善其分析结果,以用户熟悉的方式浏览网页:搜索、查找有趣信息,而后根据看到的内容再进行后续搜索。Deep Research 会多轮重复整个过程,并在最终完成后生成一份综合性的发现报告,可供用户导出为 Google Docs 文档格式。


成果文件的内容包含原始来源链接,以供用户后续随时返回相关网站 / 企业 / 组织进行查验。更重要的是,如果还有其他扩展性问题想要了解或者希望进一步完善报告,用户可以直接向 Gemini 提问。“总之,短短几分钟内我们就能完成以往至少耗费数个小时的研究过程。”谷歌表示。


今年早些时候,谷歌分享了将更多智能体功能融入产品的发展愿景,而 Deep Research 正是 Gemini 中首个将这一愿景变为现实的功能。


谷歌打造出一套新的智能体系统,该系统运用谷歌在网络搜索方面的专业知识指导 Gemini 大模型进行浏览与研究。新功能与 Gemini 模型的高级推理能力以及高达 1M 的 token 上下文窗口相结合,最终形成了快速创作实用性强、可读性好的综述性报告的强大能力。


Deep Research 目前已经在桌面及移动 Web 端的 Gemini Advanced(初始只支持英语版本)中推出,且计划在 2025 年初登录移动端应用。目前,谷歌正在更多区域推出这一功能。


根据谷歌在越南和泰国发布的官方博文,Gemini 2.0 Flash Experimental、Gemini 2.0 Experimental Advanced 以及带有 Deep Research 的 Gemini 1.5 现已在区域内推出,允许更多用户访问到 Gemini 家族的这几款最新产品。


Gemini 2.0 Flash Experimental 与 2.0 Experimental Advanced 属于当前生产级版本 1.5 Pro 与 1.5 Flash 的更新版本。根据谷歌的描述,这两款产品分别面向“复杂任务”与“日常协助”场景——从本质上讲,Flash 属于运行速度更快的轻量级模型,而 Pro 在提示词执行方面则表现得更为彻底。


带有 Deep Research 的 Gemini 1.5 则是目前唯一能够执行 AI 深度研究功能的 Gemini 版本。Gemini 1.5 与 Deep Research 现已在包括美国在内的多个区域面向 Gemini Advanced 用户推出,但用户只能在 Gemini Web 应用中访问 Deep Research——iOS 与 Android 版应用程序尚不支持此项功能。如果大家需要在手机端使用 Deep Research,则可以通过 Gemini 的移动 Web 应用进行访问。


选择谷歌、Perplexity 还是 OpenAI?


Deep Research 发布后,一时间好评如潮。


沃顿商学院生成人工智能实验室联席主任 Ethan Mollick 称赞道,“谷歌新推出的 Deep Research 功能感觉是迄今为止最符合‘谷歌风格’的人工智能应用之一,而且令人印象深刻。我已经使用了一段时间,它几乎可以针对任何主题都提供非常好的初步报告。不过,学术资源的付费墙带来了一些限制。”



其他用户也表示新功能让其印象深刻。“在发布 Gemini 2.0 和 Deep Research 后,为 Perplexity 付费已经没有意义了。”


不过,Deep Research 功能并没有彻底打败谷歌竞争对手的产品。


网友 Thomas Burgess 直观地对比了 Perplexity 与 Gemini Deep Research 后表示,“它真的真的真的很慢。如果不是为了录制这个视频,我可能已经放弃了。而且,Gemini 也不知道我是在问最近新闻中出现的无人机事件。”不过,Thomas Burgess 还表示,虽然 Perplexity 声称引用了 24 个来源,但他猜测其实只引用了几个,Gemini 声称引用了 19 个。


对比输出结果,Gemini 更像是研究论文、报告,Perplexity 则是信息收集整理。


更详细的结果对比可以查看:


Gemini (https://docs.google.com/document/d/175RRX4kc3HRQp8SjnTVYWHxlJrSuX1LVBNJ1ViSrwsc/edit?pli=1&tab=t.0)


Perplexity (https://www.perplexity.ai/search/new-jersey-d__rones-4ruvBHNlSxCKgH_vOnyDBw?login-source=oneT__apThread_)_


对于速度问题,也有用户在 Thomas Burgess 帖子下表示,“你用错了。刚刚尝试在 AI Studio 中打开 grounding 进行同样的搜索,结果和 Perplexity 一样快速和彻底。”


“我用过几次。它实际上只对公众人物和大型活动有用,对任何小事都没什么用。而且它是深度研究,而不是深度搜索。”有用户说道。


“shrimpyn1”在尝试了几次后,也指出了 Deep Research 的几个问题:


  1. 它不允许研究政治话题;

  2. 它对使用最新文章的搜索使用非常糟糕,本希望它能够智能地识别研究主题是最近发生的事件还是一般的学术主题,并像 GPT 搜索那样自动仅使用当前事件的最新链接;

  3. 尽管它提供了最深入、最全面的见解,但它不如 Perplexity 和 GPT Search 那样聪明,能够通过推理提供最“有用”和最准确的答案。


“如果你仔细思考,会发现现阶段人工智能搜索工具的“准确性”和“深度”之间实际上存在着一种权衡。目前,只有人类研究人员才能生成非常全面、深入同时又准确且最新的报告。我认为谷歌 Deep Research 可能非常适合不依赖实时信息检索的学术研究,但这并不意味着你不能向该工具询问最新的体育比赛结果、天气或最近事件的详细信息。如果你这样做,它仍然会尝试给你一个答案,但我发现它不太准确,也不太令人满意。”shrimpyn1 说道。


“GPT Search 显然是目前可以取代谷歌搜索的最佳且唯一可靠的工具,因为它有意仅检索最新链接并做出明智的查找决定。在我看来,Perplexity 试图站到 GPT Search 和 Deep Research 之间的位置,因此它在‘谷歌搜索’简单查询方面不如 GPT Search 那么好,在一般学术主题上当然也不如 Deep Research 那么好。”shrimpyn1 分析称。


“也就是说,如果你只想订阅一项 AI 服务而不订阅其他服务,那么 Perplexity 显然是最好的选择。它可以是一个纯粹的 LLM(或多个模型)、一个搜索引擎、一个相对深入的研究合作伙伴、一个图像生成器、一个可定制的 AI 代理(Spaces),甚至是一个新闻网站。但我想说,它可能不是在任何一个领域都是‘最好的’——几乎在每一个领域都有比它更好的东西。”


参考链接:


https://blog.google/products/gemini/google-gemini-deep-research/#footnote-1


https://www.androidpolice.com/gemini-deep-research-more-regions/


https://x.com/JThomasBurgess/status/1866935993380602323


2024-12-30 15:147564

评论

发布
暂无评论

【Flutter 专题】127 图解基础 Image 小组件

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

[译] Android 的 Java 9,10,11,12 的支持

Antway

6月日更

ARTS 打卡第11周

steve_lee

Python——元组的使用

在即

6月日更

重启心智解锁,重新获得一份能力精进指南,面对不确定性的未来,我们可以和世界的变化做好友。

叶小鍵

云图说|华为云自研云数据库GaussDB NoSQL,兼容多款NoSQL接口的数据库服务

华为云开发者联盟

nosql Influxdb Cassandra mongo GaussDB NoSQL

ONES CTO 冯斌 | 大型软件研发团队如何实践高效项目管理?

万事ONES

团队管理 ONES Project 研发团队

详解Vue八大生命周期钩子函数

华为云开发者联盟

Vue 对象 函数 Vue实例 八大生命周期

你有一份Rx编程秘籍请签收

vivo互联网技术

响应式编程 大前端 函数编程 RXJS

react源码解析12.状态更新流程

全栈潇晨

React

Apache Drill 1.19.0 发布集锦

MPP Apache Drill 联邦查询和分析

EMQ映云科技边缘计算里程碑—Kuiper加入LF Edge基金会

EMQ映云科技

开源 云端 边缘流式数据 emq LF Edge

EasyRecovery用法进阶--高阶设置使用技巧

淋雨

数据恢复 EasyRecovery 文件恢复 硬盘恢复

并发王者课-黄金3:雨露均沾-不要让你的线程在竞争中被“饿死”

MetaThoughts

Java 多线程 并发 并发王者课

Pandas高级教程之:Dataframe的重排和旋转

程序那些事

Python 数据分析 pandas 程序那些事

你应该知道的数仓安全

华为云开发者联盟

数据加密 数仓安全 透明加密 SQL函数加密

Go 语言学习路线来啦

roseduan

学习 Go 语言

【LeetCode】山脉数组的峰顶索引Java题解

Albert

算法 LeetCode 6月日更

网络安全逐渐成为程序员的必备技能

学神来啦

Linux 程序员 安全 渗透

什么是Python中的套接字编程?

华为云开发者联盟

Python 编程 socket 网络 套接字

敏捷绩效管理三剑客:OKR 、KPI、CFR

CODING DevOps

DevOps OKR 敏捷绩效 绩效管理

推荐学Java——应该了解的前端内容

逆锋起笔

Java 大前端 后端 JAVA开发

缓存的世界Redis(一)

卢卡多多

redis 缓存 6月日更

实时音视频开发理论必备:如何省流量?视频高度压缩背后的预测技术

JackJiang

音视频 即时通讯 IM 视频编解码

Flink Metric

Alex🐒

flink 翻译 flink1.13

浪潮云说丨云应用容灾:四大关键能力,护航业务连续性

云计算

文档代码同源

不脱发的程序猿

开发规范 文档代码同源

docker搭建Nginx和Tomcat负载均衡

叫我阿柒啊

nginx Docker 负载均衡

ONES CTO 冯斌 | 升级项目管理体系,加速金融行业数字化转型

万事ONES

项目管理 研发管理 数字经济 ONES

【译】JavaScript 代码整洁之道-概述篇

KooFE

JavaScript 大前端 6月日更 整洁代码

互联网就业系列文(一)

HZFEStudio

互联网 就业

谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义_AI&大模型_褚杏娟_InfoQ精选文章