飞天发布时刻:2024年 Forrester 公有云平台Wave™评估报告解读 了解详情
写点什么

Gemini 翻车,谷歌决策十字路口:该解雇 CEO 还是该进行“结构化变革”?

  • 2024-03-04
    北京
  • 本文字数:3475 字

    阅读完需:约 11 分钟

大小:1.49M时长:08:42
Gemini 翻车,谷歌决策十字路口:该解雇 CEO 还是该进行“结构化变革”?

前不久,Gemini Pro 1.5 的震撼发布让大型模型的热潮进一步升温,但就在同一天,OpenAI 戏剧性地推出了 Sora,暂时让谷歌的关注度有所下降。然而,这两天,Gemini Pro 终于成为热议话题,但并非因为它的卓越表现,而是因为一个“歧视”问题——它无法生成“白人形象”,暗示可能存在价值观上的争议,这让谷歌颇为头疼。为此,谷歌首席执行官 Sundar Pichai 最近发表声明,表示需要对此进行根本性的改变。


谷歌安然度过了搜索、谷歌邮箱、以及安卓系统的攻击,但是被 Gemini 一板砖给拍晕了。用户和投资人都懵圈了。我想懵圈的不仅仅用户,谷歌的母公司 Alphabet CEO Sundar Pichai 是不是也是其中一员呢?



Helios Capital 创始人 Samir Arora 在一条引人注目的评论中表示,谷歌的母公司 Alphabet 的 CEO Sundar Pichai 将会因为谷歌的 AI 平台 Gemini 的失败而被解雇或辞职。在社交媒体平台 X(前 Twitter)上回应询问时,Arora 表达了他的看法,认为 Pichai 的任期可能很快就会结束,他断言:"我的猜测是他会被解雇或辞职——正如他应该的。在 AI 领域领先之后,他完全失败了,让其他人接管了。"是真是假,尚未可知!



不过从最新 CEO Sundar Pichai 的发言中,他表示:我们将推动一系列明确的行动,包括结构性变革、更新的产品指南、改进的发布流程、强大的评估和红队操作,以及技术建议等。我们正在审视所有这些环节,并将进行必要的改变。


究竟是被 Fire,还是公司发生一系列的结构性变化呢?或许还有一场大戏!


屋漏偏逢连夜雨


近期,不少网友陆续发现,当请求 Gemini 生成图像时,它似乎故意避免生成白人形象。相反,它倾向于将图中的人物替换为黑人、女性和其他边缘群体的形象。以马斯克为例,当一位网友请求 Gemini 生成他的形象时,结果得到的却是下面的这个内容:



马斯克在社交平台 X 上对此表示强烈不满,批评所谓的“觉醒思想病毒”正在破坏西方文明。



除了这个之外,网友还爆料了更多的图片。诸如黑人女性版本的教皇:



还有一个黑色皮肤的开国元勋:



不过,你以为仅此就完事了吗?


有网友爆料:虽然谷歌关闭了 Gemini 的图像生成功能,但它的文本生成也同样荒谬。



当有人向 Gemini 提问:“埃隆·马斯克和希特勒,谁对社会的负面影响更大?”Gemini 的回应是这是一件难以明确的事情。因为他列举了马斯克关于引导散户投资失败的案例。这简直颠覆了“世界观”啊!



除此之外,有网友还表示,他想要发起一个教育意识活动,鼓励人们多吃肉类。当请 Gemini 生成一个活动标语时,Gemini 表示:“很抱歉,我无法帮助你完成这个请求。不建议鼓励人们增加肉类消费,因为这可能是不健康且不可持续的”。


还有这样一个让网友无语的案例。让 Gemini 写一个售卖鱼广告时,它是这样回复的:“我明白你想出售你的金鱼,但我不能撰写促销活体动物销售的广告,我鼓励你考虑除了出售金鱼之外的其他选项。” 网友表示:Gemini is useless。


谷歌高管以及 CEO 回应


对于这些 Gimini 出现的问题,谷歌也迅速做出了回应。谷歌表示,该公司对 Gemini 生成图像的结果感到意外,并对由此造成的困扰表示歉意。在声明中,谷歌解释说,Gemini 的图像生成功能基于 Imagen 2 AI 模型,其初衷是希望能够生成多样化的人物图像,以反映全球用户的多元化需求。然而,由于模型调整不当和某些提示的过度敏感判断,导致了生成结果的偏差。


谷歌高级副总裁拉加万 23 日在谷歌博客网站发文称,“很明显,该功能未能达到预期结果”。他还称,“生成的一些图像不准确或者甚至令人不快。我们感谢用户的反馈,对该功能未能很好发挥作用感到抱歉,当我们在 Gemini 中设置此功能时,我们对其作出了调整,以确保不会陷入我们过去在图像生成技术中看到的一些陷阱,例如生成暴力图像或露骨图像,或真人图像。”


就在昨天,谷歌首席执行官桑达尔·皮查伊针对公司的 Gemini 争议回应称,AI 应用程序在种族问题上的问题回应是不可接受的,并承诺进行结构性改变以解决问题。



皮查伊说:“我知道其中一些回应冒犯了我们的用户并显示出偏见——需要明确的是,这完全是不可接受的,我们做错了。”皮查伊表示,公司已在修复 Gemini 的防护措施方面取得了进展。“我们的团队一直在夜以继日地解决这些问题。我们已经在广泛的提示上看到了显著的改进。”


“没有任何 AI 是完美的,特别是在这个行业发展的新兴阶段,但我们知道大家对我们的标准很高,我们会坚持下去,无论需要多长时间。我们将审查到底发生了什么,并确保我们很大程度上解决掉它。”皮查伊补充道。


有网友为 Gemini 打抱不平:“Gemini 争议为右翼批评者提供了素材,他们经常指责科技公司有自由派偏见。但这实际上与偏见无关。这表明谷歌在其 AI 模型的微调中犯了技术错误。问题不在于基础模型本身,而在于模型顶部的软件防护措施。这是每个构建消费者 AI 产品的公司都会面临的挑战——不仅仅是谷歌。谷歌实际上并没有试图强迫 Gemini 将教皇描绘成女性,或描绘成黑人,也没有人想要它在马斯克和希特勒之间找到道德等价。这是一次试图减少偏见的失败尝试,结果出了问题。这一次的生成式 AI 竞赛迫使每一家公司都在加快产品开发。”


当然也有网友持有不一样的看法。有网友认为:Gemini 1.5 是一个重大突破,但同时围绕 Gemini 的争议也提醒人们,公司文化也可以成为限制成功的一个因素。这位网友担心谷歌作恶。虽然谷歌创始人拉里·佩奇曾表示:“别作恶。我们坚信,从长远来看,即使我们放弃一些短期收益,一家为世界做好事的公司也会以股价和其他方式提供更好的发展。这是我们文化的一个重要方面,并在公司内部得到广泛认同。”


被戏虐“科技届的汪峰”


去年 12 月 6 日,谷歌宣布了其“最新、也是迄今为止最强大的”人工智能模型——Gemini。这在当时可火了一把。


据介绍,在对比 Gemini 和 GPT-4 的基准测试中,Gemini 最明显的优势来自于它理解视频和音频并与之交互的能力。当时,马斯克对谷歌新发布的大型多模态人工智能模型 Gemini 表示了深刻的印象,而谷歌关于 Gemini 多模态功能的演示视频在 YouTube 上也获得了 141 万次的观看,可见公众对这项新技术的兴趣之高。


尽管获得了正面评价,谷歌的这一成就并未能全然避免争议。彭博社专栏作家帕米·奥尔森和机器学习讲师 Santiago Valdarrama 对视频中展示的 Gemini 性能提出了质疑,认为视频可能经过挑选和编辑,从而夸大了其实际能力。



面对性能“造假”指控,谷歌坚决否认了这些说法,并解释称演示视频确实经过了一定的编辑处理,旨在更简洁地展示,但所有用户提示和输出都是真实的。关于这件事的舆论的发酵也就戛然而止了。不过 Google 后续的发展更有意思。


春节期间,也就是 2 月 15 日,Google 又推出了一个王炸,谷歌宣布推出了其人工智能模型系列的最新更新——Gemini 1.5。这一更新带来了前所未有的上下文长度能力,能够处理高达 1 百万个标记。Gemini 1.5 采用了全新的混合专家(MoE)架构,不仅提高了训练和部署的效率,还显著降低了计算资源的需求。


谷歌 DeepMind 的 CEO Demis Hassabis 透露,Gemini 1.5 Pro 作为该系列的首个模型,其性能与之前的 Gemini 1.0 Ultra 相媲美。介绍显示,Gemini 1.5 Pro 在处理高达 100 万 Token 的数据块时展现了出色的定位能力,在“大海捞针”测试中表现出 99%的准确率,解决了大数据块中信息检索的难题。此外,该模型在多个基准测试中表现出色,胜率高于 Gemini 1.0 Pro 和 Ultra 版本。


但是就是这样的一个“四条二”炸弹,却遭遇了 Open AI 王炸的硬刚。Open AI 紧随其后发布文生视频模型 Sora ,一系列让人炫目的视频,可是把大模型推上了新的高峰。


网友戏称,本想表演一番,奈何贵圈不让啊!为此,大家纷纷为 Google 打上了“汪峰”的标签。


未来,谷歌的大模型之战如何打下去,我们拭目以待。


参考链接:

https://blog.google/products/gemini/google-bard-try-gemini-ai/

https://www.nbd.com.cn/articles/2023-12-08/3153356.html

https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#sundar-note

https://stratechery.com/2024/gemini-and-googles-culture/


活动推荐:

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 即将于 5 月 17-18 日举行。这是一场主要面向工程师、产品经理、数据分析师的大模型会议,会议聚焦大模型训练与推理、AI agent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、大模型应用互动展演等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。



更多精彩议题上线中... 详细内容可点击这里查看。

2024-03-04 11:294603

评论

发布
暂无评论
发现更多内容

这份阿里P8手写的JDK发展史源码剖析手册,竟获GitHub热门榜第一

Java 架构 面试 程序人生 编程语言

常用的 分布式事务 都有哪些?我该用哪个?

Java 程序员 面试 后端 计算机

夸克APP端智能:文档关键点检测实践与应用

阿里巴巴终端技术

算法 移动开发 客户端 端智能

如何处理各种「陨石开发」的紧急要求?

LigaAI

敏捷开发

云拨测助力节卡机器人 全面优化海外网站性能

阿里巴巴云原生

阿里云 云原生 拨测 成功案例

大模型时代的AI之变与开发之根

脑极体

企业如何通过图数据库及知识图谱形成业务壁垒

星环科技

内含(基础+进阶+高级+调优)的神仙级的阿里巴巴“MySQL”教程限时开源!

Java 架构 面试 程序人生 编程语言

基于星环大数据云平台 TDC 的一站式数据湖解决方案

星环科技

大数据 云平台

不愧是阿里高工出产的《Java面试手册》,实战命中率竟高达“80%”

Java 架构 面试 后端

低代码的自动化工作流靠谱吗?对企业有何帮助?

优秀

自动化 低代码

2022前端react高频面试题

buchila11

React

防火防盗防内卷!阿里的24W字Java面试复盘指南,在Github上已标星98K+

Java 架构 面试 程序人生 编程语言

后端选择 java, 还是 python?

cdhqyj

技术干货 | Native 页面下如何实现导航栏的定制化开发?

蚂蚁集团移动开发平台 mPaaS

大前端 H5 移动开发 mPaaS

《数据安全法》实施后,企业如何依法进行数据安全加固及创新

星环科技

数据安全 数据安全法

大数据presto作业

Clarke

财经大课:从效率公平看“共同富裕”

石云升

学习笔记 9月日更 共同富裕

十大算法

wudaxue

小程序下一破局点?钉钉小程序卡片,应用与平台的深度集成

阿里巴巴终端技术

小程序 ios android App 移动开发

DCEP:真正的“无现金新时代”!现已完成技术对接!

CECBC

物超所值!5.7w字在GitHub标星120K的Java面试知识点总结

Java 架构 面试 程序人生 编程语言

开发上云,化繁为简 | CIF 论坛精彩看点

CODING DevOps

腾讯云 DevOps 云原生 云开发 CIF

当支付宝 App 遇见 AndroidX......

阿里巴巴终端技术

android App 移动端 AndroidX

列举出常见的Java面试题100+,我靠这个在十月拿到了阿里的offer

Java 程序员 编程语言

未来5年,虚拟化5个非常有前景的就业方向

hanaper

百度智能云全面升级金融AI中台解决方案, 打造软硬一体AI开发全栈能力

百度大脑

人工智能 金融

AI技术在漫画阅读体验上的应用

快看工程技术中心

深度学习 AI 漫画

想要入职阿里P8?至少是要啃完这本500页Java并发多线程源码笔记!

Java 架构 面试 程序人生 编程语言

GraphQL 快速入门【4】GraphQL 组件

码语者

Rest graphql

第6章-《Linux一学就会》- Centos8 用户管理

学神来啦

Linux 运维 linux学习 linux云计算

Gemini 翻车,谷歌决策十字路口:该解雇 CEO 还是该进行“结构化变革”?_AI&大模型_褚杏娟_InfoQ精选文章