QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

还没发布,xAI 工程师公开承认 Grok 3 不如 OpenAI,遭马斯克怒火解雇!马斯克:Grok 3 打遍天下无敌手

  • 2025-02-14
    北京
  • 本文字数:4059 字

    阅读完需:约 13 分钟

大小:2.07M时长:12:02
还没发布,xAI工程师公开承认Grok 3不如OpenAI,遭马斯克怒火解雇!马斯克:Grok 3打遍天下无敌手

马斯克确认将发布 Grok 3,已进入最后阶段

 

最近几个月,全球的聚光灯都在追着 DeepSeek 走,该模型被认为有可能使先进人工智能技术的使用更加民主化。

 

但与此同时,其他 AI 玩家也没有闲着。OpenAI 紧急推出了 o3-mini、Google 向全球开放了当家模型 Gemini 全家桶、Anthropic 也在酝酿着发布新一代模型,并将即将发布的模型描述为一种可以在“深度推理”和快速响应之间切换的“混合模型”。

 

面对这些强劲对手,马斯克坐不住了。他急需通过一款新的、强大的模型重新夺回在人工智能领域的话语权。

 

在 2025 年 2 月 13 日迪拜世界政府峰会上,埃隆·马斯克与阿联酋国务部长 Omar Sultan Al Olama 进行了一场关于 AI 未来的对话。在这次对话中,埃隆·马斯克通过视频会议透露,其旗下人工智能公司 xAI 即将在几周内推出聊天机器人 Grok 3,并称该模型“聪明得可怕”,其推理能力将超越包括 ChatGPT 和 DeepSeek 在内的其他领先 AI 模型。

 

但是什么让 Grok 的最新模型如此智能呢?

 

马斯克表示,Grok 3 的成功关键在于其合成训练数据方法。与主要依赖真实世界数据进行训练的 Gemini 和 ChatGPT 不同,Grok 3 通过合成数据进行训练,能够通过梳理数据反思错误,从而实现逻辑一致性。马斯克认为,这种训练方法将使 Grok 3 在推理能力上具有显著优势。

 

相比之下,美国领先的聊天机器人(如 Gemini 和 ChatGPT)主要使用真实世界数据进行训练。这种训练方法被认为可以帮助聊天机器人更好地掌握人类的细微差别和复杂性,但可能会让聊天机器人开发人员面临数据盗窃的指控,并且还可能通过限制公司可以访问的数据量来损害聊天机器人的性能。

 

尽管 Grok 3 的技术前景令人期待,但其使用目前仍仅限于 X 用户,因此尚不确定其增强的功能是否会对市场份额产生实际影响。

 

近几个月来,DeepSeek 一直占据着新闻头条,该模型被认为有可能使先进人工智能技术的使用更加民主化。美国总统唐纳德·特朗普对此表示,DeepSeek 的崛起为美国科技业敲响了“警钟”,引发了行业内外的广泛讨论。

 

尽管面临来自 DeepSeek 等竞争对手的挑战,马斯克对 Grok 3 的前景充满信心。

 

马斯克在峰会上不仅透露了 Grok 3 的技术细节,还批评了他的前同事、OpenAI 创始人 Sam Altman。他认为,OpenAI 在人工智能开发中过于依赖真实世界数据,可能导致数据隐私和伦理问题。相比之下,Grok 3 的合成数据训练方法更加透明和安全。

自家工程师将 Grok3 评为低于 OpenAI 模型,被解雇

 

事实上,关于 Grok 3 的发布已经传了很长一段时间。早在 2024 夏天,马斯克就表示 xAI 的下一代 AI 模型 Grok 3 将于 2024 年底推出。但左等右等 Grok 3 迟迟未见,这引发了网友对该模型能力的种种猜测。

 

然而,让人意外的是,在大家都对 Grok 3 进行各种猜测之时,xAI 一位工程师跳出来,自己将尚未发布的 Grok 3 和其他模型排了个名。

 

在一则发布于 2 月 8 日的 X 帖子中,Grok 开发人类数据团队的 Benjamin De Kraker 讨论了他从代码角度看谁是顶级 AI 模型的看法。

 

在 De Kraker 看来,OpenAI 的 o1-pro、o1 和 o3-mini 均并列第一。他将尚未发布的 Grok 3 排在第四位,其次是 DeepSeek R1 和 GPT4o。


“删除帖子否则将被解雇”


随后,2 月 12 日星期四,De Kraker 发布了后续帖子他声称,“xAI 告诉我,要么删除该帖子,要么被解雇。”

 

面对这样的最后通牒,De Kraker 表示,他决定保留自己的“言论自由和尊严”并辞职。

 

他补充道:“一家据称拥护言论自由和开放的公司及其领导者,却试图解雇一名低级别员工,只因他表达的观点明确,且毫无争议,这让我非常失望。”

 

De Kraker 在 X 上发帖称:

 

今晚我刚刚从 xAI 离职了。

 

这件事让我非常难过,但我知道我做出了正确的决定——原因如下。

 

xAI 告诉我,要么删除我之前发的帖子,要么将解雇我。

 

经过仔细思考和权衡,我决定不删除这个帖子——因为它显然是一个无害的个人观点。

 

他们为什么要我删除这个观点?嗯,根据他们的说法,原因是我提到了 Grok 3……的存在。

 

这些话说起来真像是开玩笑,但这不是玩笑。因为这就是他们要解雇我的理由——仅仅因为我写了“Grok 3(待定)”。

 

仅仅因为透露了 Grok 3 确实存在这件事就让他被扫地出门?这个理由也让 De Kraker 感到十分离谱,因为 xAI 早已在自家官网上承认了 Grok 3 存在的事实。

 

但等等,Grok 3 不是已经被 xAI 官方承认了吗?是的,确实如此。

 

我会在下面附上 xAI 官方博客中关于 Grok 3 的讨论,以及埃隆·马斯克多次公开提及 Grok 3 的帖子和视频。

 

于是,De Kraker 的确在接下来的帖子中放出了 Grok 3 出现在 xAI 官网以及马斯克在其他公开场合提到 Grok 3 即将发布的截图。

 



看看,xAI 官网和创始人都在多个场合中反复提及 Grok 3 的存在和即将发布,这一则公开了一年多的消息怎么自家员工提一嘴就要被解雇?解雇他的真实原因真的是因为透露了 Grok 3 的存在???

 

De Kraker 又进一步解释,他发的那篇帖子 100%是个人观点,不涉及公司机密。

 

需要明确的是,他们要求我删除的帖子 100%只是我的个人观点。我并不知道 Grok 3 与其他最先进的模型相比会处于什么水平。希望它表现不错,但我不知道。这就是为什么我写了“观点”和“待定”。

 

它可能在某些方面表现很好,而在其他方面可能并不完美。我并不认为这是一个特别离谱的观点。

 

再次强调,根据 xAI 公司的要求,甚至仅仅写下“Grok 3 - 待定”就属于“机密信息”。这绝对是荒谬的,因为公司和其著名的 CEO 已经多次公开承认了 Grok 3 的存在

 

即使 De Kraker 贴出了很多截图认为公司解雇他的行为不合理,但他离开 xAI 已成定局。因为这期间发生的种种已经让 De Kraker 对 xAI 失望至极。

 

他们是不是因为我没有在明确标注为个人观点的帖子中猜测尚未发布的 Grok 3 会表现得更出色而生气?也许吧。很可能。再说一次,也许它确实会是最强的,我真的不知道。这就是为什么我写了“待定”。

 

我在 xAI 大部分时间与一个非常努力的团队一起开发的 Grok 的某个特定功能非常酷,我希望它能对所有人都有很好的效果。我不会具体说明是什么功能,因为那才是真正的机密信息。(也许等它发布后我会说。)

 

我仍然希望埃隆和 xAI 能成功。然而……

 

让我感到非常失望的是,一个标榜支持言论自由和开放的公司及其领导层,竟然会因为一个明确标注为个人观点、且毫无争议的帖子而试图解雇一名底层员工。但事实就是如此。

 

整个情况非常奇怪。我曾想过干脆删掉那个该死的帖子……但你知道,一旦你开始屈服并放弃表达中庸一些的个人观点,事情只会越来越变本加厉。

 

我会保留我的言论和尊严,然后找另一份工作,或者自己创业。江湖再见。

 

De Kraker 的困境并没有被 xAI 的高层忽视。首席执行官马斯克在评论最近的帖子时表示,“这很奇怪。”不过,他并未表明是否计划进行干预。


Grok 系列模型的起源与背景


Grok 系列模型是埃隆·马斯克旗下人工智能公司 xAI 的核心产品之一。xAI 成立于 2022 年,旨在开发具有更高推理能力和逻辑一致性的人工智能系统。马斯克一直对人工智能的发展持谨慎态度,多次公开表达对人工智能潜在风险的担忧。然而,他也认为,人工智能技术的进步是不可避免的,因此他希望通过 xAI 开发出更安全、更透明且对人类友好的 AI 系统。

 

Grok 的名字来源于科幻作家罗伯特·海因莱因的小说《异乡异客》,意为“深刻理解”或“完全掌握”。这一命名体现了马斯克对人工智能的期望:不仅要能够处理复杂的任务,还要具备对人类思维和逻辑的深刻理解。

 

Grok 1 于 2023 年初发布,是 xAI 推出的首款人工智能聊天机器人。作为初代模型,Grok 1 的主要目标是验证合成数据训练方法的可行性。与当时主流的 ChatGPT 等模型不同,Grok 1 并未完全依赖真实世界数据进行训练,而是采用了大量合成数据。合成数据是通过算法生成的模拟数据,能够覆盖更广泛的情景和逻辑结构。

 

Grok 1 的推出引起了广泛关注,它能够处理复杂的逻辑问题,并在某些特定任务上超越了当时的 ChatGPT 3.5。然而,Grok 1 也存在一些明显的局限性。例如,由于合成数据的局限性,它在处理真实世界中的细微差别和复杂性时表现不佳。此外,Grok 1 的训练成本极高,且模型规模较小,限制了其在实际应用中的推广

 

2023 年年中,在 Grok 1 的基础上,xAI 推出了 Grok 2。这一代模型在多个方面进行了重大改进。依然采用了更大规模的合成数据集,同时结合了少量高质量的真实世界数据,以弥补初代模型在处理真实场景中的不足。Grok 2 还引入了更先进的训练算法,尤其是在数学推理、代码生成和复杂问题解决方面超越了当时的 ChatGPT 4。它还首次尝试了多模态能力,能够处理文本、图像和简单视频数据。

 

然而,在众多优秀大模型层出不穷的 2023 年,Grok 2 的问世并没有掀起太大水花。Grok 2 依然有着很多弊端,尽管其技术能力备受认可,但由于其使用权限仅限于 X 平台(原 Twitter)的高级用户,普通用户无法直接体验。这一限制导致 Grok 2 的市场覆盖率较低,未能对 ChatGPT 等竞争对手形成实质性威胁。

Grok 3 能挤进全球模型 Top 10 吗?


那么,Grok 3 能挤进全球顶级模型之列吗?在马斯克看来,是能的。

 

从他最近的发言中可见,他对 Grok 3 充满信心,并认为该模型能击败一众先进模型登顶最强模型宝座。

 

但事实真的如此吗?

 

目前,Grok AI 在人工智能领域仍是一个小角色。它的受欢迎程度远不及 ChatGPT 等竞争对手,截至 2024 年 11 月,ChatGPT 占据了人工智能工具市场份额的 62.5% 。

 

不过,Grok 确实拥有一些与竞争对手不同的特点。它最大的优势是能原生集成社交媒体 X,使该聊天机器人能够访问社交媒体平台的实时信息,其独特的编程方式使其能够以叛逆和俏皮的语气回答挑衅性的提示。由于这些独特卖点,马斯克的 AI 聊天机器人在 X 用户中很受欢迎。

 

然而,该聊天机器人经常卷入争议,从回应政治虚假信息到因其可访问 X 数据而宣传有偏见的内容。ChatGPT 和 Gemini 等竞争对手也拥有更多参数,因此它们的响应通常更准确。

 

基于以上种种,有外界声音认为,即使使用合成训练数据,即将发布的 Grok 3 也不太可能与更大的竞争对手相提并论。

 

参考链接:

https://www.ccn.com/news/technology/elon-musk-grok-3-outperforms-chatbots/

https://www.thestandard.com.hk/breaking-news/section/6/227525/Elon-Musk-says-Grok-3-is-in-its-final-stages

2025-02-14 16:4811245
用户头像
李冬梅 加V:busulishang4668

发布了 1046 篇内容, 共 659.2 次阅读, 收获喜欢 1209 次。

关注

评论

发布
暂无评论

k6新崛起的性能测试工具

风中之心

DevOps 性能 性能测试

原创 面试官:你说对MySQL事务很熟?那我问你10个问题

程序员柠檬

MySQL 数据库

Java 底层基础笔记(一)硬件

奈何花开

Java Linux 计算机基础

2020年亚洲南京大数据产业展览会

南京专业智博会

展览会 论坛会 博览会 智博会

使用 PCA 进行降维可视化,了解特征分布

黄大路

数据挖掘 数据分析 可视化

Linux下程序出问题不要慌,资深程序员教你6招搞定!

程序员柠檬

Linux 程序员 后台开发

ARTS-week-1

saddamwilson

ARTS 打卡计划

Markdown 几行字符就可以生成思维导图了!

JackTian

markdown 思维导图 markdown语法 markdown编辑器 Markmap

你真的清楚 Nginx 指令的规则吗?

子杨

nginx 运维

2020年南京第十三届物联网应用展览会

南京专业智博会

展览会 论坛会 博览会 智博会

github看代码效率提高10倍!因为用了sourcegraph这个工具

程序员柠檬

GitHub 程序员 效率工具

2020亚洲南京第十三届人工智能机器人服务展览会

南京专业智博会

展览会 论坛会 博览会 智博会

10分钟白嫖我的常用的在线工具网站清单

JavaGuide

设计 在线工具 工具类网站 PDF

面试造飞机系列:说下微服务接口设计原则?

程序员柠檬

分布式 微服务 后端 架构设计

不忘初心,继续努力

一周思进

ARTS 打卡计划

如何优雅地实现泛型类的类型参数化

KAMI

Java 编程 反射 泛型

这可能是 Markdown 写微信公众号的一款神器了!

JackTian

效率工具 markdown markdown编辑器 markdownnice 神器

ARTS打卡-01

Geek_yansheng25

ARTS 打卡计划

游戏夜读 | 记忆里的老游戏

game1night

推荐几款有意思的小众App(05.30)

静陌

产品 App

Jupyter最佳实践

pydata

PageHelper

BitSea

Wireshark的使用与数据分析(一)

姬翔

思维模型 - 概念篇

石云升

学习 高效 思维模型 决策

如何衡量产品需求效果

黄大路

产品经理 产品设计 运营

用大数据分析了一线城市1000多份岗位招聘需求,告诉你如何科学找工作

程序员柠檬

Python 数据分析

2020南京第十三届智慧工地装备展览会

南京专业智博会

展览会 论坛会 博览会 智博会

2020年南京第十三届智慧停车展会

南京专业智博会

展览会 博览会 智博会 展览会论坛会

2020亚洲智能家居全屋智能展会-南京站

南京专业智博会

展览会 论坛会 博览会 智博会

分布式锁🔒是个啥❓ 其实就这么点事

山中兰花草

Java redis 后端 分布式锁 开发

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十二)编写测试-简单测试

编程道与术

Java 编程 TDD 单元测试 JUnit

还没发布,xAI工程师公开承认Grok 3不如OpenAI,遭马斯克怒火解雇!马斯克:Grok 3打遍天下无敌手_生成式 AI_李冬梅_InfoQ精选文章