开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

还没发布,xAI 工程师公开承认 Grok 3 不如 OpenAI,遭马斯克怒火解雇!马斯克:Grok 3 打遍天下无敌手

  • 2025-02-14
    北京
  • 本文字数:4059 字

    阅读完需:约 13 分钟

大小:2.07M时长:12:02
还没发布,xAI工程师公开承认Grok 3不如OpenAI,遭马斯克怒火解雇!马斯克:Grok 3打遍天下无敌手

马斯克确认将发布 Grok 3,已进入最后阶段

 

最近几个月,全球的聚光灯都在追着 DeepSeek 走,该模型被认为有可能使先进人工智能技术的使用更加民主化。

 

但与此同时,其他 AI 玩家也没有闲着。OpenAI 紧急推出了 o3-mini、Google 向全球开放了当家模型 Gemini 全家桶、Anthropic 也在酝酿着发布新一代模型,并将即将发布的模型描述为一种可以在“深度推理”和快速响应之间切换的“混合模型”。

 

面对这些强劲对手,马斯克坐不住了。他急需通过一款新的、强大的模型重新夺回在人工智能领域的话语权。

 

在 2025 年 2 月 13 日迪拜世界政府峰会上,埃隆·马斯克与阿联酋国务部长 Omar Sultan Al Olama 进行了一场关于 AI 未来的对话。在这次对话中,埃隆·马斯克通过视频会议透露,其旗下人工智能公司 xAI 即将在几周内推出聊天机器人 Grok 3,并称该模型“聪明得可怕”,其推理能力将超越包括 ChatGPT 和 DeepSeek 在内的其他领先 AI 模型。

 

但是什么让 Grok 的最新模型如此智能呢?

 

马斯克表示,Grok 3 的成功关键在于其合成训练数据方法。与主要依赖真实世界数据进行训练的 Gemini 和 ChatGPT 不同,Grok 3 通过合成数据进行训练,能够通过梳理数据反思错误,从而实现逻辑一致性。马斯克认为,这种训练方法将使 Grok 3 在推理能力上具有显著优势。

 

相比之下,美国领先的聊天机器人(如 Gemini 和 ChatGPT)主要使用真实世界数据进行训练。这种训练方法被认为可以帮助聊天机器人更好地掌握人类的细微差别和复杂性,但可能会让聊天机器人开发人员面临数据盗窃的指控,并且还可能通过限制公司可以访问的数据量来损害聊天机器人的性能。

 

尽管 Grok 3 的技术前景令人期待,但其使用目前仍仅限于 X 用户,因此尚不确定其增强的功能是否会对市场份额产生实际影响。

 

近几个月来,DeepSeek 一直占据着新闻头条,该模型被认为有可能使先进人工智能技术的使用更加民主化。美国总统唐纳德·特朗普对此表示,DeepSeek 的崛起为美国科技业敲响了“警钟”,引发了行业内外的广泛讨论。

 

尽管面临来自 DeepSeek 等竞争对手的挑战,马斯克对 Grok 3 的前景充满信心。

 

马斯克在峰会上不仅透露了 Grok 3 的技术细节,还批评了他的前同事、OpenAI 创始人 Sam Altman。他认为,OpenAI 在人工智能开发中过于依赖真实世界数据,可能导致数据隐私和伦理问题。相比之下,Grok 3 的合成数据训练方法更加透明和安全。

自家工程师将 Grok3 评为低于 OpenAI 模型,被解雇

 

事实上,关于 Grok 3 的发布已经传了很长一段时间。早在 2024 夏天,马斯克就表示 xAI 的下一代 AI 模型 Grok 3 将于 2024 年底推出。但左等右等 Grok 3 迟迟未见,这引发了网友对该模型能力的种种猜测。

 

然而,让人意外的是,在大家都对 Grok 3 进行各种猜测之时,xAI 一位工程师跳出来,自己将尚未发布的 Grok 3 和其他模型排了个名。

 

在一则发布于 2 月 8 日的 X 帖子中,Grok 开发人类数据团队的 Benjamin De Kraker 讨论了他从代码角度看谁是顶级 AI 模型的看法。

 

在 De Kraker 看来,OpenAI 的 o1-pro、o1 和 o3-mini 均并列第一。他将尚未发布的 Grok 3 排在第四位,其次是 DeepSeek R1 和 GPT4o。


“删除帖子否则将被解雇”


随后,2 月 12 日星期四,De Kraker 发布了后续帖子他声称,“xAI 告诉我,要么删除该帖子,要么被解雇。”

 

面对这样的最后通牒,De Kraker 表示,他决定保留自己的“言论自由和尊严”并辞职。

 

他补充道:“一家据称拥护言论自由和开放的公司及其领导者,却试图解雇一名低级别员工,只因他表达的观点明确,且毫无争议,这让我非常失望。”

 

De Kraker 在 X 上发帖称:

 

今晚我刚刚从 xAI 离职了。

 

这件事让我非常难过,但我知道我做出了正确的决定——原因如下。

 

xAI 告诉我,要么删除我之前发的帖子,要么将解雇我。

 

经过仔细思考和权衡,我决定不删除这个帖子——因为它显然是一个无害的个人观点。

 

他们为什么要我删除这个观点?嗯,根据他们的说法,原因是我提到了 Grok 3……的存在。

 

这些话说起来真像是开玩笑,但这不是玩笑。因为这就是他们要解雇我的理由——仅仅因为我写了“Grok 3(待定)”。

 

仅仅因为透露了 Grok 3 确实存在这件事就让他被扫地出门?这个理由也让 De Kraker 感到十分离谱,因为 xAI 早已在自家官网上承认了 Grok 3 存在的事实。

 

但等等,Grok 3 不是已经被 xAI 官方承认了吗?是的,确实如此。

 

我会在下面附上 xAI 官方博客中关于 Grok 3 的讨论,以及埃隆·马斯克多次公开提及 Grok 3 的帖子和视频。

 

于是,De Kraker 的确在接下来的帖子中放出了 Grok 3 出现在 xAI 官网以及马斯克在其他公开场合提到 Grok 3 即将发布的截图。

 



看看,xAI 官网和创始人都在多个场合中反复提及 Grok 3 的存在和即将发布,这一则公开了一年多的消息怎么自家员工提一嘴就要被解雇?解雇他的真实原因真的是因为透露了 Grok 3 的存在???

 

De Kraker 又进一步解释,他发的那篇帖子 100%是个人观点,不涉及公司机密。

 

需要明确的是,他们要求我删除的帖子 100%只是我的个人观点。我并不知道 Grok 3 与其他最先进的模型相比会处于什么水平。希望它表现不错,但我不知道。这就是为什么我写了“观点”和“待定”。

 

它可能在某些方面表现很好,而在其他方面可能并不完美。我并不认为这是一个特别离谱的观点。

 

再次强调,根据 xAI 公司的要求,甚至仅仅写下“Grok 3 - 待定”就属于“机密信息”。这绝对是荒谬的,因为公司和其著名的 CEO 已经多次公开承认了 Grok 3 的存在

 

即使 De Kraker 贴出了很多截图认为公司解雇他的行为不合理,但他离开 xAI 已成定局。因为这期间发生的种种已经让 De Kraker 对 xAI 失望至极。

 

他们是不是因为我没有在明确标注为个人观点的帖子中猜测尚未发布的 Grok 3 会表现得更出色而生气?也许吧。很可能。再说一次,也许它确实会是最强的,我真的不知道。这就是为什么我写了“待定”。

 

我在 xAI 大部分时间与一个非常努力的团队一起开发的 Grok 的某个特定功能非常酷,我希望它能对所有人都有很好的效果。我不会具体说明是什么功能,因为那才是真正的机密信息。(也许等它发布后我会说。)

 

我仍然希望埃隆和 xAI 能成功。然而……

 

让我感到非常失望的是,一个标榜支持言论自由和开放的公司及其领导层,竟然会因为一个明确标注为个人观点、且毫无争议的帖子而试图解雇一名底层员工。但事实就是如此。

 

整个情况非常奇怪。我曾想过干脆删掉那个该死的帖子……但你知道,一旦你开始屈服并放弃表达中庸一些的个人观点,事情只会越来越变本加厉。

 

我会保留我的言论和尊严,然后找另一份工作,或者自己创业。江湖再见。

 

De Kraker 的困境并没有被 xAI 的高层忽视。首席执行官马斯克在评论最近的帖子时表示,“这很奇怪。”不过,他并未表明是否计划进行干预。


Grok 系列模型的起源与背景


Grok 系列模型是埃隆·马斯克旗下人工智能公司 xAI 的核心产品之一。xAI 成立于 2022 年,旨在开发具有更高推理能力和逻辑一致性的人工智能系统。马斯克一直对人工智能的发展持谨慎态度,多次公开表达对人工智能潜在风险的担忧。然而,他也认为,人工智能技术的进步是不可避免的,因此他希望通过 xAI 开发出更安全、更透明且对人类友好的 AI 系统。

 

Grok 的名字来源于科幻作家罗伯特·海因莱因的小说《异乡异客》,意为“深刻理解”或“完全掌握”。这一命名体现了马斯克对人工智能的期望:不仅要能够处理复杂的任务,还要具备对人类思维和逻辑的深刻理解。

 

Grok 1 于 2023 年初发布,是 xAI 推出的首款人工智能聊天机器人。作为初代模型,Grok 1 的主要目标是验证合成数据训练方法的可行性。与当时主流的 ChatGPT 等模型不同,Grok 1 并未完全依赖真实世界数据进行训练,而是采用了大量合成数据。合成数据是通过算法生成的模拟数据,能够覆盖更广泛的情景和逻辑结构。

 

Grok 1 的推出引起了广泛关注,它能够处理复杂的逻辑问题,并在某些特定任务上超越了当时的 ChatGPT 3.5。然而,Grok 1 也存在一些明显的局限性。例如,由于合成数据的局限性,它在处理真实世界中的细微差别和复杂性时表现不佳。此外,Grok 1 的训练成本极高,且模型规模较小,限制了其在实际应用中的推广

 

2023 年年中,在 Grok 1 的基础上,xAI 推出了 Grok 2。这一代模型在多个方面进行了重大改进。依然采用了更大规模的合成数据集,同时结合了少量高质量的真实世界数据,以弥补初代模型在处理真实场景中的不足。Grok 2 还引入了更先进的训练算法,尤其是在数学推理、代码生成和复杂问题解决方面超越了当时的 ChatGPT 4。它还首次尝试了多模态能力,能够处理文本、图像和简单视频数据。

 

然而,在众多优秀大模型层出不穷的 2023 年,Grok 2 的问世并没有掀起太大水花。Grok 2 依然有着很多弊端,尽管其技术能力备受认可,但由于其使用权限仅限于 X 平台(原 Twitter)的高级用户,普通用户无法直接体验。这一限制导致 Grok 2 的市场覆盖率较低,未能对 ChatGPT 等竞争对手形成实质性威胁。

Grok 3 能挤进全球模型 Top 10 吗?


那么,Grok 3 能挤进全球顶级模型之列吗?在马斯克看来,是能的。

 

从他最近的发言中可见,他对 Grok 3 充满信心,并认为该模型能击败一众先进模型登顶最强模型宝座。

 

但事实真的如此吗?

 

目前,Grok AI 在人工智能领域仍是一个小角色。它的受欢迎程度远不及 ChatGPT 等竞争对手,截至 2024 年 11 月,ChatGPT 占据了人工智能工具市场份额的 62.5% 。

 

不过,Grok 确实拥有一些与竞争对手不同的特点。它最大的优势是能原生集成社交媒体 X,使该聊天机器人能够访问社交媒体平台的实时信息,其独特的编程方式使其能够以叛逆和俏皮的语气回答挑衅性的提示。由于这些独特卖点,马斯克的 AI 聊天机器人在 X 用户中很受欢迎。

 

然而,该聊天机器人经常卷入争议,从回应政治虚假信息到因其可访问 X 数据而宣传有偏见的内容。ChatGPT 和 Gemini 等竞争对手也拥有更多参数,因此它们的响应通常更准确。

 

基于以上种种,有外界声音认为,即使使用合成训练数据,即将发布的 Grok 3 也不太可能与更大的竞争对手相提并论。

 

参考链接:

https://www.ccn.com/news/technology/elon-musk-grok-3-outperforms-chatbots/

https://www.thestandard.com.hk/breaking-news/section/6/227525/Elon-Musk-says-Grok-3-is-in-its-final-stages

2025-02-14 16:483
用户头像
李冬梅 加V:busulishang4668

发布了 1000 篇内容, 共 612.0 次阅读, 收获喜欢 1177 次。

关注

评论

发布
暂无评论

测试用例管理工具对比:Redmine vs. TestLink vs. 禅道

测吧(北京)科技有限公司

测试

华秋携手省油灯:共创高效储能未来

华秋电子

用 Easysearch 帮助大型车企降本增效

极限实验室

索引 快照 降本增效 数据压缩 easysearch

选300平米别墅还是90平米小平层?一文带你读懂PolarDB分布式版集分一体化

阿里云数据库开源

数据库 阿里云 分布式数据库 polarDB PolarDB-X

Pudgy Penguins NFT 概览与数据分析

Footprint Analytics

区块链游戏 NFT

K8s 集群可观测性-数据分流最佳实践

观测云

K8s 多集群管理

Axios request 封装指南:简化你的 JavaScript HTTP 请求

Liam

JavaScript 程序员 前端 HTTP axios

网络发展历程及SD-WAN的优势

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商

聚道云软件连接器助力金融科技公司,提升企业管理效率

聚道云软件连接器

案例分享

和鲸科技与智谱AI达成合作,共建大模型生态基座

ModelWhale

大模型 AIGC ChatGLM 科研 智谱AI

再获殊荣!和鲸科技入选2023年中国云生态创新明星企业

ModelWhale

人工智能 云计算 基础设施 创新 荣誉

春节活动“龙”重登场,三大领域创意应用等你来挑战!

飞桨PaddlePaddle

百度 paddle 飞桨 应用开发 春节活动

大模型技术驱动直播变革,开启全新互动体验!

中关村科金

音视频 直播 大模型

USDT TRC20钱包开发:详细解析

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

吸引企业选择的SD-WAN四大亮点

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商

云MySQL主备切换

腾讯云混沌演练平台

故障注入 混沌演练 主备切换

华秋助力扬兴打破垄断,推动晶振国产化进程

华秋电子

晶振

每日一题:LeetCode-123. 买卖股票的最佳时机 III

Geek_4z9ami

面试 算法 LeetCode 动态规划 滚动数组

喜报|博睿数据算力调度可观测平台荣获信通院“算力服务领航者计划”优秀案例

博睿数据

可观测性 运维监控

什么是HTTP劫持,有什么方案能处理

德迅云安全杨德俊

还没发布,xAI工程师公开承认Grok 3不如OpenAI,遭马斯克怒火解雇!马斯克:Grok 3打遍天下无敌手_生成式 AI_李冬梅_InfoQ精选文章