写点什么

谷歌搜索反击,发布最有“谷歌风格”的 AI 应用!网友:为 Perplexity 付费已没有意义

  • 2024-12-30
    北京
  • 本文字数:2979 字

    阅读完需:约 10 分钟

大小:1.31M时长:07:39
谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义

“随着 Gemini 家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。”近期,谷歌又朝着打造世界上最实用个人 AI 助手这一目标迈出了重要一步:低调发布了 Deep Research 功能。


Deep Research 能够接收研究提示词、制定研究计划并为用户提供微调选项,之后执行全自动研究。它会扫描数十到数百个信息来源以获取关于查询的信息内容,而后生成关于结果的详尽报告。整个过程需要几分钟,大家可以在 Gemini 运行的过程中先去忙别的。在执行完成之后,生成的报告则可导出为 Google Docs 文档。


这也是 Gemini 强大推理能力的重要首秀,反映出谷歌打造 AI 智能体解决方案的决心与探索。

随时待命的个人 AI 研究助手


传统的在线研究工作往往困难重重。设想一下,身为一名研究生,您可能正在为即将到来的机器人演示做准备。您希望了解自动驾驶汽车传感器的发展趋势、检索不同技术的对接方式以及未来的发展方向。像这样的项目往往要耗费数小时进行研究,打开大量页面选项卡并交叉引用其中内容……很多人在过程当中往往会彻底迷失,绝望地翻找刚刚才看到过的链接或者段落。


Deep Research 的作用就是在用户监督之下替人完成这些令人头痛的工作。


在输入问题之后,它会创建一个多步骤的研究计划以供修改或者批准。在批准之后,Deep Research 就会代表用户深入分析来自网络的相关信息。


只需要几分钟的时间,Gemini 就能不断完善其分析结果,以用户熟悉的方式浏览网页:搜索、查找有趣信息,而后根据看到的内容再进行后续搜索。Deep Research 会多轮重复整个过程,并在最终完成后生成一份综合性的发现报告,可供用户导出为 Google Docs 文档格式。


成果文件的内容包含原始来源链接,以供用户后续随时返回相关网站 / 企业 / 组织进行查验。更重要的是,如果还有其他扩展性问题想要了解或者希望进一步完善报告,用户可以直接向 Gemini 提问。“总之,短短几分钟内我们就能完成以往至少耗费数个小时的研究过程。”谷歌表示。


今年早些时候,谷歌分享了将更多智能体功能融入产品的发展愿景,而 Deep Research 正是 Gemini 中首个将这一愿景变为现实的功能。


谷歌打造出一套新的智能体系统,该系统运用谷歌在网络搜索方面的专业知识指导 Gemini 大模型进行浏览与研究。新功能与 Gemini 模型的高级推理能力以及高达 1M 的 token 上下文窗口相结合,最终形成了快速创作实用性强、可读性好的综述性报告的强大能力。


Deep Research 目前已经在桌面及移动 Web 端的 Gemini Advanced(初始只支持英语版本)中推出,且计划在 2025 年初登录移动端应用。目前,谷歌正在更多区域推出这一功能。


根据谷歌在越南和泰国发布的官方博文,Gemini 2.0 Flash Experimental、Gemini 2.0 Experimental Advanced 以及带有 Deep Research 的 Gemini 1.5 现已在区域内推出,允许更多用户访问到 Gemini 家族的这几款最新产品。


Gemini 2.0 Flash Experimental 与 2.0 Experimental Advanced 属于当前生产级版本 1.5 Pro 与 1.5 Flash 的更新版本。根据谷歌的描述,这两款产品分别面向“复杂任务”与“日常协助”场景——从本质上讲,Flash 属于运行速度更快的轻量级模型,而 Pro 在提示词执行方面则表现得更为彻底。


带有 Deep Research 的 Gemini 1.5 则是目前唯一能够执行 AI 深度研究功能的 Gemini 版本。Gemini 1.5 与 Deep Research 现已在包括美国在内的多个区域面向 Gemini Advanced 用户推出,但用户只能在 Gemini Web 应用中访问 Deep Research——iOS 与 Android 版应用程序尚不支持此项功能。如果大家需要在手机端使用 Deep Research,则可以通过 Gemini 的移动 Web 应用进行访问。


选择谷歌、Perplexity 还是 OpenAI?


Deep Research 发布后,一时间好评如潮。


沃顿商学院生成人工智能实验室联席主任 Ethan Mollick 称赞道,“谷歌新推出的 Deep Research 功能感觉是迄今为止最符合‘谷歌风格’的人工智能应用之一,而且令人印象深刻。我已经使用了一段时间,它几乎可以针对任何主题都提供非常好的初步报告。不过,学术资源的付费墙带来了一些限制。”



其他用户也表示新功能让其印象深刻。“在发布 Gemini 2.0 和 Deep Research 后,为 Perplexity 付费已经没有意义了。”


不过,Deep Research 功能并没有彻底打败谷歌竞争对手的产品。


网友 Thomas Burgess 直观地对比了 Perplexity 与 Gemini Deep Research 后表示,“它真的真的真的很慢。如果不是为了录制这个视频,我可能已经放弃了。而且,Gemini 也不知道我是在问最近新闻中出现的无人机事件。”不过,Thomas Burgess 还表示,虽然 Perplexity 声称引用了 24 个来源,但他猜测其实只引用了几个,Gemini 声称引用了 19 个。


对比输出结果,Gemini 更像是研究论文、报告,Perplexity 则是信息收集整理。


更详细的结果对比可以查看:


Gemini (https://docs.google.com/document/d/175RRX4kc3HRQp8SjnTVYWHxlJrSuX1LVBNJ1ViSrwsc/edit?pli=1&tab=t.0)


Perplexity (https://www.perplexity.ai/search/new-jersey-d__rones-4ruvBHNlSxCKgH_vOnyDBw?login-source=oneT__apThread_)_


对于速度问题,也有用户在 Thomas Burgess 帖子下表示,“你用错了。刚刚尝试在 AI Studio 中打开 grounding 进行同样的搜索,结果和 Perplexity 一样快速和彻底。”


“我用过几次。它实际上只对公众人物和大型活动有用,对任何小事都没什么用。而且它是深度研究,而不是深度搜索。”有用户说道。


“shrimpyn1”在尝试了几次后,也指出了 Deep Research 的几个问题:


  1. 它不允许研究政治话题;

  2. 它对使用最新文章的搜索使用非常糟糕,本希望它能够智能地识别研究主题是最近发生的事件还是一般的学术主题,并像 GPT 搜索那样自动仅使用当前事件的最新链接;

  3. 尽管它提供了最深入、最全面的见解,但它不如 Perplexity 和 GPT Search 那样聪明,能够通过推理提供最“有用”和最准确的答案。


“如果你仔细思考,会发现现阶段人工智能搜索工具的“准确性”和“深度”之间实际上存在着一种权衡。目前,只有人类研究人员才能生成非常全面、深入同时又准确且最新的报告。我认为谷歌 Deep Research 可能非常适合不依赖实时信息检索的学术研究,但这并不意味着你不能向该工具询问最新的体育比赛结果、天气或最近事件的详细信息。如果你这样做,它仍然会尝试给你一个答案,但我发现它不太准确,也不太令人满意。”shrimpyn1 说道。


“GPT Search 显然是目前可以取代谷歌搜索的最佳且唯一可靠的工具,因为它有意仅检索最新链接并做出明智的查找决定。在我看来,Perplexity 试图站到 GPT Search 和 Deep Research 之间的位置,因此它在‘谷歌搜索’简单查询方面不如 GPT Search 那么好,在一般学术主题上当然也不如 Deep Research 那么好。”shrimpyn1 分析称。


“也就是说,如果你只想订阅一项 AI 服务而不订阅其他服务,那么 Perplexity 显然是最好的选择。它可以是一个纯粹的 LLM(或多个模型)、一个搜索引擎、一个相对深入的研究合作伙伴、一个图像生成器、一个可定制的 AI 代理(Spaces),甚至是一个新闻网站。但我想说,它可能不是在任何一个领域都是‘最好的’——几乎在每一个领域都有比它更好的东西。”


参考链接:


https://blog.google/products/gemini/google-gemini-deep-research/#footnote-1


https://www.androidpolice.com/gemini-deep-research-more-regions/


https://x.com/JThomasBurgess/status/1866935993380602323


2024-12-30 15:147620

评论

发布
暂无评论

YashanDB CAST函数

YashanDB

yashandb

Databend Operator: 打造开源的数据仓库部署利器

Databend

AI如果不能完全取代手工测试,那它产生意义是什么?

测试人

人工智能

MQTTX + MCP:MQTT 客户端秒变物联网 Agent

EMQ映云科技

让 LLM 来评判 | 基础概念

量贩潮汐·WholesaleTide

LLM

YashanDB CEIL函数

YashanDB

yashandb

YashanDB CHAR_LENGTH CHARACTER_LENGTH函数

YashanDB

yashandb

YashanDB CHAR_TO_LABEL函数

YashanDB

yashandb

DAPP(去中心化应用程序)开发全解析:构建去中心化应用的流程

区块链软件开发推广运营

交易所开发 dapp开发 公链开发 代币开发 dapp开发链游开发

程序员「达尔文时刻」:飞算JavaAI如何帮你从「码农」转型「AI架构师」?

飞算JavaAI开发助手

从代码小白到 Java 高手:AI 工具如何压缩你的学习曲线?

飞算JavaAI开发助手

分库分表带来的这7大问题,一定要小心!

不在线第一只蜗牛

数据库

Python语言中进程、线程、协程执行效率分析

电子尖叫食人鱼

Python

智源数据新基建系列Workshop | 从大模型到具身智能

智源研究院

YashanDB BIT_LENGTH函数

YashanDB

yashandb

YashanDB CHR函数

YashanDB

yashandb

从零开始开发 MCP Server

阿里巴巴云原生

阿里云 云原生 通义灵码

别再堆文档了,大模型时代知识库应该这样建

量贩潮汐·WholesaleTide

AI 大模型

YashanDB CONCAT函数

YashanDB

yashandb

YashanDB COT函数

YashanDB

yashandb

YashanDB CHECK_USER_PRIVILEGE函数

YashanDB

yashandb

YashanDB COALESCE函数

YashanDB

yashandb

Neo4j 可观测性最佳实践

观测云

neo4j

交易所开发:构建高效数字交易枢纽

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

飞算 JavaAI 与 Spring Boot:如何实现微服务开发效率翻倍?

飞算JavaAI开发助手

站在“场景化保险”拐点的致保科技,按下了增长“加速键”

Alter

YashanDB CHECK_SYS_PRIVILEGE函数

YashanDB

yashandb

YashanDB CONCAT_WS函数

YashanDB

yashandb

YashanDB COS函数

YashanDB

yashandb

飞算 JavaAI 实战:从零搭建电商系统,代码一键生成!

飞算JavaAI开发助手

别让工具拖后腿!2025年Top5 AI代码工具,让Java开发效率翻倍

飞算JavaAI开发助手

谷歌搜索反击,发布最有“谷歌风格”的AI应用!网友:为 Perplexity 付费已没有意义_AI&大模型_褚杏娟_InfoQ精选文章