写点什么

谷歌搜索反击,发布最有“谷歌风格”的 AI 应用!网友:为 Perplexity 付费已没有意义

  • 2024-12-30
    北京
  • 本文字数:2979 字

    阅读完需:约 10 分钟

大小:1.31M时长:07:39
谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义

“随着 Gemini 家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。”近期,谷歌又朝着打造世界上最实用个人 AI 助手这一目标迈出了重要一步:低调发布了 Deep Research 功能。


Deep Research 能够接收研究提示词、制定研究计划并为用户提供微调选项,之后执行全自动研究。它会扫描数十到数百个信息来源以获取关于查询的信息内容,而后生成关于结果的详尽报告。整个过程需要几分钟,大家可以在 Gemini 运行的过程中先去忙别的。在执行完成之后,生成的报告则可导出为 Google Docs 文档。


这也是 Gemini 强大推理能力的重要首秀,反映出谷歌打造 AI 智能体解决方案的决心与探索。

随时待命的个人 AI 研究助手


传统的在线研究工作往往困难重重。设想一下,身为一名研究生,您可能正在为即将到来的机器人演示做准备。您希望了解自动驾驶汽车传感器的发展趋势、检索不同技术的对接方式以及未来的发展方向。像这样的项目往往要耗费数小时进行研究,打开大量页面选项卡并交叉引用其中内容……很多人在过程当中往往会彻底迷失,绝望地翻找刚刚才看到过的链接或者段落。


Deep Research 的作用就是在用户监督之下替人完成这些令人头痛的工作。


在输入问题之后,它会创建一个多步骤的研究计划以供修改或者批准。在批准之后,Deep Research 就会代表用户深入分析来自网络的相关信息。


只需要几分钟的时间,Gemini 就能不断完善其分析结果,以用户熟悉的方式浏览网页:搜索、查找有趣信息,而后根据看到的内容再进行后续搜索。Deep Research 会多轮重复整个过程,并在最终完成后生成一份综合性的发现报告,可供用户导出为 Google Docs 文档格式。


成果文件的内容包含原始来源链接,以供用户后续随时返回相关网站 / 企业 / 组织进行查验。更重要的是,如果还有其他扩展性问题想要了解或者希望进一步完善报告,用户可以直接向 Gemini 提问。“总之,短短几分钟内我们就能完成以往至少耗费数个小时的研究过程。”谷歌表示。


今年早些时候,谷歌分享了将更多智能体功能融入产品的发展愿景,而 Deep Research 正是 Gemini 中首个将这一愿景变为现实的功能。


谷歌打造出一套新的智能体系统,该系统运用谷歌在网络搜索方面的专业知识指导 Gemini 大模型进行浏览与研究。新功能与 Gemini 模型的高级推理能力以及高达 1M 的 token 上下文窗口相结合,最终形成了快速创作实用性强、可读性好的综述性报告的强大能力。


Deep Research 目前已经在桌面及移动 Web 端的 Gemini Advanced(初始只支持英语版本)中推出,且计划在 2025 年初登录移动端应用。目前,谷歌正在更多区域推出这一功能。


根据谷歌在越南和泰国发布的官方博文,Gemini 2.0 Flash Experimental、Gemini 2.0 Experimental Advanced 以及带有 Deep Research 的 Gemini 1.5 现已在区域内推出,允许更多用户访问到 Gemini 家族的这几款最新产品。


Gemini 2.0 Flash Experimental 与 2.0 Experimental Advanced 属于当前生产级版本 1.5 Pro 与 1.5 Flash 的更新版本。根据谷歌的描述,这两款产品分别面向“复杂任务”与“日常协助”场景——从本质上讲,Flash 属于运行速度更快的轻量级模型,而 Pro 在提示词执行方面则表现得更为彻底。


带有 Deep Research 的 Gemini 1.5 则是目前唯一能够执行 AI 深度研究功能的 Gemini 版本。Gemini 1.5 与 Deep Research 现已在包括美国在内的多个区域面向 Gemini Advanced 用户推出,但用户只能在 Gemini Web 应用中访问 Deep Research——iOS 与 Android 版应用程序尚不支持此项功能。如果大家需要在手机端使用 Deep Research,则可以通过 Gemini 的移动 Web 应用进行访问。


选择谷歌、Perplexity 还是 OpenAI?


Deep Research 发布后,一时间好评如潮。


沃顿商学院生成人工智能实验室联席主任 Ethan Mollick 称赞道,“谷歌新推出的 Deep Research 功能感觉是迄今为止最符合‘谷歌风格’的人工智能应用之一,而且令人印象深刻。我已经使用了一段时间,它几乎可以针对任何主题都提供非常好的初步报告。不过,学术资源的付费墙带来了一些限制。”



其他用户也表示新功能让其印象深刻。“在发布 Gemini 2.0 和 Deep Research 后,为 Perplexity 付费已经没有意义了。”


不过,Deep Research 功能并没有彻底打败谷歌竞争对手的产品。


网友 Thomas Burgess 直观地对比了 Perplexity 与 Gemini Deep Research 后表示,“它真的真的真的很慢。如果不是为了录制这个视频,我可能已经放弃了。而且,Gemini 也不知道我是在问最近新闻中出现的无人机事件。”不过,Thomas Burgess 还表示,虽然 Perplexity 声称引用了 24 个来源,但他猜测其实只引用了几个,Gemini 声称引用了 19 个。


对比输出结果,Gemini 更像是研究论文、报告,Perplexity 则是信息收集整理。


更详细的结果对比可以查看:


Gemini (https://docs.google.com/document/d/175RRX4kc3HRQp8SjnTVYWHxlJrSuX1LVBNJ1ViSrwsc/edit?pli=1&tab=t.0)


Perplexity (https://www.perplexity.ai/search/new-jersey-d__rones-4ruvBHNlSxCKgH_vOnyDBw?login-source=oneT__apThread_)_


对于速度问题,也有用户在 Thomas Burgess 帖子下表示,“你用错了。刚刚尝试在 AI Studio 中打开 grounding 进行同样的搜索,结果和 Perplexity 一样快速和彻底。”


“我用过几次。它实际上只对公众人物和大型活动有用,对任何小事都没什么用。而且它是深度研究,而不是深度搜索。”有用户说道。


“shrimpyn1”在尝试了几次后,也指出了 Deep Research 的几个问题:


  1. 它不允许研究政治话题;

  2. 它对使用最新文章的搜索使用非常糟糕,本希望它能够智能地识别研究主题是最近发生的事件还是一般的学术主题,并像 GPT 搜索那样自动仅使用当前事件的最新链接;

  3. 尽管它提供了最深入、最全面的见解,但它不如 Perplexity 和 GPT Search 那样聪明,能够通过推理提供最“有用”和最准确的答案。


“如果你仔细思考,会发现现阶段人工智能搜索工具的“准确性”和“深度”之间实际上存在着一种权衡。目前,只有人类研究人员才能生成非常全面、深入同时又准确且最新的报告。我认为谷歌 Deep Research 可能非常适合不依赖实时信息检索的学术研究,但这并不意味着你不能向该工具询问最新的体育比赛结果、天气或最近事件的详细信息。如果你这样做,它仍然会尝试给你一个答案,但我发现它不太准确,也不太令人满意。”shrimpyn1 说道。


“GPT Search 显然是目前可以取代谷歌搜索的最佳且唯一可靠的工具,因为它有意仅检索最新链接并做出明智的查找决定。在我看来,Perplexity 试图站到 GPT Search 和 Deep Research 之间的位置,因此它在‘谷歌搜索’简单查询方面不如 GPT Search 那么好,在一般学术主题上当然也不如 Deep Research 那么好。”shrimpyn1 分析称。


“也就是说,如果你只想订阅一项 AI 服务而不订阅其他服务,那么 Perplexity 显然是最好的选择。它可以是一个纯粹的 LLM(或多个模型)、一个搜索引擎、一个相对深入的研究合作伙伴、一个图像生成器、一个可定制的 AI 代理(Spaces),甚至是一个新闻网站。但我想说,它可能不是在任何一个领域都是‘最好的’——几乎在每一个领域都有比它更好的东西。”


参考链接:


https://blog.google/products/gemini/google-gemini-deep-research/#footnote-1


https://www.androidpolice.com/gemini-deep-research-more-regions/


https://x.com/JThomasBurgess/status/1866935993380602323


2024-12-30 15:147396

评论

发布
暂无评论

vivo AI 计算平台的 ACK 混合云实践

阿里巴巴云原生

阿里云 云原生 ACK Vivo

华为在HDC2021发布全新HMS Core 6 宣布跨OS能力开放

叶落便知秋

新征程、新时势、新聚变——2021一亩地儿合作伙伴大会在京成功举办

阿里JAVA架构师面试136题含答案:JVM+spring+分布式+并发编程!

Java 编程 程序员 面试

华为首次采用数字人全程实时手语直播,并宣布全面开放手语服务能力

叶落便知秋

零信任能力成熟度模型白皮书发布!内附下载资源

华为云开发者联盟

安全 隐私保护 华为云 网络架构 零信任

实现服务器和客户端数据交互,Java Socket有妙招

华为云开发者联盟

socket 进程 服务器 客户端 java

基于 RocketMQ 的基金数字化陪伴体系的架构实践

阿里巴巴云原生

阿里云 RocketMQ 云原生 消息队列 金融场景

架构设计六 如何设计业务的微服务架构

nydia

微服务 架构设计

电商系统微服务系统设计

Imaginary

1024程序员:算法&仓鼠&创业

博文视点Broadview

Python代码阅读(第44篇):寻找符合条件的元素的位置

Felix

Python 编程 Code Programing 阅读代码

2021年秋季明道云伙伴大会,邀您参与!

明道云

微信业务架构图 & 学生管理系统架构设计

Steven

架构实战营

模块一作业

doublechun

「架构实战营」

收藏这36个正则表达式,开发效率提高80%

Tom弹架构

Java 正则表达式

谐云边缘计算大规模落地实践,带你见证边缘的力量!

谐云

云计算 边缘计算

云图说 | 分布式缓存服务DCS—站在开源Redis前辈的肩膀上,扬帆起航

华为云开发者联盟

redis 缓存 分布式 华为云 DCS

netty系列之:netty对http2消息的封装

程序那些事

Java Netty 程序那些事 http2

推荐7款超实用的推特推特下载器,包括电脑和手机上使用(小伙伴们快快收藏起来)

So...

twitter 推特视频下载 推特

第 23 章 -《Linux 一学就会》- expect - 正则表达式-sed-cut的使用

学神来啦

Linux Shell linux运维 linux云计算 linux一学就会

顶会VLDB'22论文解读:多元时序预测算法METRO

华为云开发者联盟

数据库 华为云 多元时序预测算法 VLDB'22 华为云数据库创新Lab

1024程序员节的正确打开方式

云智慧AIOps社区

程序员 开源技术 1024我在现场 飞鱼 云智慧

【KubeMeet 上海站回顾】 探索云原生应用管理与交付新解法

阿里巴巴云原生

阿里云 开源 云原生 KubeMeet

架构实战营模块六作业 - 拆分电商系统为微服务

李焕之

go-zero 实战之 blog 系统

万俊峰Kevin

golang 微服务 go-zero

爱奇艺联合WSDM发起用户留存预测挑战赛

爱奇艺技术产品团队

美团的动态线程池,不依赖中间件可以实现么?

马丁玩编程

Spring Boot ThreadPoolExecutor

0 基础架构入门 - 6(电商系统微服务架构)

felix

架构实战营 0 基础架构入门

模块一:为何架构设计能力难以提升? --学习总结

小鹿

Vue进阶(幺伍零):巧用 key 提升页面渲染性能及触发生命周期函数

No Silver Bullet

Vue 渲染性能 10月月更

谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义_AI&大模型_褚杏娟_InfoQ精选文章