今年的谷歌 I/O 大会,又名“我们超级嫉妒 ChatGPT”大会。
下一代大语言模型 PaLM 2
在本届 I/O 开发者大会上,谷歌发布了其最新大语言模型(LLM)PaLM 2。
PaLM 2 将成为谷歌 Bard 聊天机器人的全新底层模型,代表搜索巨头直面 OpenAI ChatGPT 的挑战。
此外,谷歌此次公布的大部分新型 AI 功能也都将基于 PaLM 2 实现。PaLM 2 现可通过谷歌 PaLM API、Firebase 和 Colab 向开发人员开放。
与 OpenAI 类似,谷歌并没有介绍这套下一代模型的过多训练技术细节,甚至未提到参数规模(PaLM 2 拥有 5400 亿参数)。
会上,谷歌唯一公布的技术细节就是 PaLM 2 构建在最新的 JAX 和 TPU v4 基础设施之上。
DeepMind 副总裁 Zoubin Ghahramani 在正式揭幕前的新闻发布会上表示,“我们在工作中发现,模型的大小并不是决定性因素——不是说模型越大,效果就越好。因此,我们才提供一系列不同规模的模型。我们认为参数规模并不能作为把握模型性能的正确方法,其能力还是要由模型的使用者自行判断,包括确定这些模型在具体使用场景中是否有用。”
于是乎,谷歌公司决定全力提升模型的性能表现,尤其很多功能直指 GPT-4 的痛点。
谷歌发现,新模型更擅长常识推理、数学和逻辑。根据 Ghahramani 的介绍,谷歌公司利用大量数学/科学文本和数学表达式对模型进行了训练。大家知道,主要通过自然语言训练而成的大语言模型在不借助第三方插件的情况下,几乎很难搞定数学问题。但谷歌表示 PaLM 2 能够轻松解决数学难题,完成推理任务甚至生成相应图表。
PaLM 2 还改进了代码编写和调试能力。 该模型使用 20 种编程语言进行训练,包括 JavaScript 和 Python 等流行语言,也包括 Prolog、Verilog 和 Fortran 等早期语言。PaLM 2 作为基础模型托起了 Codey——谷歌专为编程和调试打造的专用模型。在本次发布会上,谷歌表示 Codey 将作为代码补全和生成服务的一部分与用户见面。
谷歌今天还强调,PaLM 2 使用一套涉及 100 多种语言的语料库训练而成。用谷歌的话说,这使得它“擅长多语言任务”,包括处理以往模型难以把握的微妙措辞。
谷歌将 PaLM 视为一个模型家族,其下涵盖 Codey 和 Med-PaLM 2(专注于医学知识的模型)等模型。另外还有专注于安全用例的 Sec-PaLM,还有能在智能手机上运行的小型 PaLM 2 模型。后续谷歌可能还会向更多强调隐私的用例开放 PaLM,但此次没有给出任何确切时间表。谷歌表示这套小模型每秒能够处理 20 个 token,虽然不是很快,但对某些用例来说已经可以接受(谷歌没有提到是在哪款机型上进行的测试)。
谷歌公司亲口承认,他们在发布 AI 功能时一直采取相当慎重的方式。 谷歌各位代表也一直在强调,谷歌公司希以负责任的态度构建这些工具,并始终将安全性放在首位。PaLM 家族自然也不例外。
AI “霸屏”,谷歌一口气发布 25 款全新 AI 产品
这妥妥是一场 AI 技术和产品“霸屏”的发布会。
谷歌在 I/O 开发者大会上公布了 25 款全新 AI 产品,其中也对核心搜索业务在 AI 推动下的变化简单做了展示。
众所周知,现在全球围绕着“生成式 AI”和大模型的 AI 竞赛正在日趋白热化。这场发布会的核心亮点包括:
“搜索生成体验”将传统搜索与 AI 聊天体验相结合,后续将很快作为“搜索实验室”(Search Labs)中的部分功能推出,让客户尝试其“实验性”产品。
**谷歌推出了其最新的 AI 模型 PaLM 2。**这套模型接受学术研究论文、医学文本和 100 多种语言素材的训练,负责为谷歌的新型 AI 产品提供支持。
谷歌对标 ChatGPT 的竞争产品 Bard 最终将登陆 Gemini。Gemini 是谷歌 DeepMind 正在开发的一套新的大语言模型。
谷歌正在将新的 AI 模型整合至 Google Workspace 产品当中,包括 Docs 和 Sheets。届时,客户将能够根据 Google Slides 中的文本创建图像,并通过描述任务内容(例如规划一次假期出行)制作出电子表格。在 Google Doc 中,用户可以写下想要创建的内容的简短描述,PaLM 2 将为您补全其余部分文本。
在整个产品线中,谷歌还公布了面向计算机程序员的新 AI 协作工具,能够帮助他们加快编程速度并将结果导出至 Replit 等其他软件开发工具。谷歌 CEO 桑达尔·皮查伊在 I/O 开发者大会的舞台上表示,“我们正在以一种大胆且负责的方式,重新构想我们的所有核心产品,包括搜索业务。”
生成式 AI 加入谷歌搜索
发布会上,谷歌推出了一款 AI 驱动的搜索引擎,其总体目标是“让搜索更智能,让搜索更简单”。
这款搜索引擎现可接收用户输入的提示词,整个使用过程更趋近人们在现实生活中的问询过程。而在我们熟悉的搜索结果列表之上,将出现由 AI 针对用户问题生成的概括性回答。
谷歌高管 Cathy Edwards 在大会上指出,不同于以往直接搜索“哪个国家公园最好玩”的用法,现在用户可以像跟朋友聊天那样询问 Google 引擎哪处公园更适合带小孩和遛狗。例如,用户向搜索引擎提问,“对于带 3 岁以下小孩和宠物狗出行的家庭来说,布莱斯峡谷公园和拱门国家公园哪个更适合?”
Edwards 强调,“虽然问题本身没有变化,但以往的搜索引擎可能没法直接消化完整的查询。用户会把它拆分成多个更小的部分、筛选信息,然后再自行拼凑起来——现在,搜索功能本身将为您搞定这些麻烦。”
Edwards 将谷歌生成的摘要称为“AI 驱动的快照,能帮助您快速了解关于某个主题的概况。”摘要中将包含来源链接,用户可以选择不同的查看格式来进一步剖析摘要背后的来源。AI 生成的摘要还提供可点击的建议问题以鼓励交互,整个体验跟 AI 聊天机器人颇为相似。
AI 驱动的定制化结果,也有望重塑消费者的线上购物体验。例如,谷歌在演示中询问了关于适合日常出行的自行车款式,结果不仅包含指向自行车商品的链接、价格和评论,还提供关于适合特定用途的自行车建议,以及理想车型应当具备的几大特点。Edwards 提醒观众,在 AI 生成的摘要下方仍然保留了传统的搜索结果列表,继续将用户引导至已发布的原始内容处。她认为正是这种可溯源性,帮助维持着“网络的蓬勃发展”。
搜索生成体验未来将登陆美国用户的 Chrome 桌面,还有 Android 和 iOS 系统上的 Google App,且仅提供英文版本。谷歌表示将在未来几周开放测试邀请,感兴趣的朋友可以点击此处申请(http://labs.google.com/search)。
这里推荐 Geekflare 上发表的一篇文章(https://geekflare.com/generative-ai-search/),其中解释了部分 AI 基本术语,对传统搜索与生成式搜索的工作原理进行细分。
生成式 AI 加持下的搜索和 Bard 是两款互补产品
很多朋友可能奇怪,谷歌不是已经搞了生成式 AI 机器人 Bard 了吗?
确实,但 Bard 是 Bard,跟 Google 搜索不是一码事。
Bard 是独立的聊天机器人系统,一直在 bard.google.com 这块小空间里圈地自萌。如果说 Bard 是谷歌对 ChatGPT 的回应,那 Google.com 上面向数十亿日常用户的生成式搜索就是谷歌对 Bing 的回应。
谷歌之所以没有立即将 Bard 集成进 Google 搜索,原因在于:
1)谷歌对生成式 AI 一直持谨慎态度;
2)生成式 AI 的大规模运行成本极高。
因此,谷歌方面采取了缓动、观望的态度,这跟微软正好相反。总之在 Google.com 上,“搜索生成体验”将仅仅是“搜索实验室”(Search Labs)功能中的一个设置选项。
搜索生成体验的基本思路,就是在搜索结果之前通过大量文本尝试解答用户的问题。在谷歌的演示中,搜索页面中那熟悉的蓝色链接消失不见——用户必须向下滚动才能看到它们。有时候,AI 生成结果上方甚至还有广告,这就把原始链接挤到了更靠下的位置。
虽然尚处于实验阶段,但谷歌最新布的“搜索生成体验”显然就是其核心搜索业务的未来发展方向。
**但谷歌仍在谨慎行事,想要保护其搜索广告业务。**于是新产品还是延续了之前的广告运作方式:搜索一款产品,结果中会夹杂着 AI 输出和广告内容。
谷歌搜索业务副总裁 Cathy Edwards 在接受采访时表示,“我认为只要用户想要做出购买决定,只要用户在做出购买决定时还需要推荐选项,那广告就仍有存在的空间。”
之所以这套广告系统仍然存在,是因为谷歌在勉力维持。它的 AI 模型会将答案限制成高度结构化的格式,这样才能给结果中插入的广告预留空间。
当用户想要更好的聊天体验时,谷歌希望他们能选择 ChatGPT 的竞争对手 Bard,这边有更完整的对话体验,也有大语言模型仍解决不了的“一本正经胡说八道”。
Edwards 强调,“我们认为搜索和 Bard 是两款互补的产品,分别对应不同的用途。我们真正关注的不是怎样把聊天机器人硬塞进去,而是着眼于全世界每天有大量用户使用的产品,思考如何利用生成式 AI 把它变得更好。”
“急切”的创新:ChatGPT 横空出世,搜索摇钱树要倒?
谷歌本该在几年前就发布其中某些产品。搜索巨头掌握着业内最优秀的部分 AI 人才(虽然一部分已经离开谷歌自立门户),并在该领域中取得了开创性的发现,包括让 ChatGPT 成为可能的 transformer 模型。
但谷歌却坚持把 AI 藏在幕后,甚至因此在消费级聊天这场竞赛中被对手甩开。
这个原因并不难理解:谷歌的核心搜索业务太棒了,根本不容颠覆。其母公司 Alphabet 上个季度的“搜索和其他收入”约为 400 亿美元,占公司总收入的近 60%。我们甚至可以说,谷歌对于搜索广告的依赖比苹果对 iPhone 的依赖还要强。
所以除非市场发生根本性变化,否则 Alphabet 绝对不会主动去破坏这块甜美可口的蛋糕。
但随着消费者倾心于 ChatGPT,用自然语言跟软件直接交流、获取回应迅速成为业界主流。相比之下,在搜索栏里输入关键字就像老掉牙的落后产物。所以谷歌要么提供类似的新一代体验,要么就眼睁睁看着消费者转向别处。但无论如何,谷歌似乎都有可能永远失去过往的辉煌——Perplexity 等初创公司就在尝试订阅搜索模式,而且跟谷歌以往的搜索广告业务大不相同。
Alphabet 多年来坐拥一棵几乎无需竞争的摇钱树,在顺风顺水之下拿点闲钱出来搞创新,包括 Waymo 机器人出租车和生物技术垂直项目 Calico。但如今,他们必须把最优秀的资源集中起来重塑谷歌的核心业务。
AI 迎来指数级进步,但谷歌等巨头已创新乏力?
风险投资人士 Chamath Palihapitiya 在最近的“All-In”播客中表示,在 AI 迅速进步的背景下,他怀疑包括谷歌在内的多家科技巨头已经不具备相应的创新能力。“他们的成长方式并不依靠创新。
看看谷歌、Facebook、微软还有苹果,谁还记得他们最后一次完成巨大的颠覆性创新是什么时候?似乎 2010 年之后就很少了。虽然他们偶尔也想做点有机创新,但往往不知道该如何正确分配资本。”
另外,值得注意的是,本届 I/O 大会可谓“正值风雨飘摇之时”。据《华盛顿邮报》报道,谷歌公司今年 1 月刚刚解雇了 1.2 万名员工,如今谷歌内部可谓气氛紧张,人人自危。
参考链接:
https://www.semafor.com/article/05/10/2023/googles-ai-search-is-over
https://techcrunch.com/2023/05/10/google-launches-palm-2-its-next-gen-large-language-model/
评论