速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

没上过大学的“天才少年”大战 OpenAI!偷架构?偷论文?到底谁在剽窃 AI 开源项目

  • 2024-10-15
    北京
  • 本文字数:4507 字

    阅读完需:约 15 分钟

大小:1.87M时长:10:54
没上过大学的“天才少年”大战OpenAI!偷架构?偷论文?到底谁在剽窃AI 开源项目

OpenAI 近日“破天荒”地发布了一款开源产品: Swarm 框架,用于构建、编排和部署多代理系统。该框架由 OpenAI Solutions 团队管理,目前仍处于实验阶段,不打算用于生产。

 

开源地址:https://github.com/openai/swarm

 

根据介绍,OpenAI Swarm 可以协调、执行和测试多智能体,让其变得轻量且高度可控,其目标是让开发者能够以简便高效的方式管理多个 AI 智能体之间的互动。Swarm 框架的核心在于智能体(agents)和交接(handoffs)两个基础抽象( primitive abstractions):每个智能体是特定指令与工具的组合,能够独立完成任务;智能体可以在执行过程中随时将任务或对话交接给其他智能体,确保流程的流畅性和模块化。

 

Swarm 代理与 Assistants API 中的 Assistants 不同:Assistants API 提供了内置内存管理的完全托管解决方案,而 Swarm 使用 Chat Completions API 进行操作,并且在调用之间保持无状态,几乎完全在客户端上运行,非常适合寻求完全透明和精细控制上下文、步骤和工具使用的开发者。

 

社区原本还沉浸在对 OpenAI 开源框架的欢呼之中,但后来发生了一场被网友们评价为“很抓马”的闹剧。

OpenAI 偷名字、偷架构?

 

OpenAI 应用 AI 研究员 Shyamal Anadkat 在 X 上发帖介绍了该框架,随后,20 岁的开源 AI 工程师、Swarms 首席执行官和 Agora 领导者 Kye Gomez 评论道,“我们才是第一”,随后表示,“我建议你和团队改一下名字,我们有 Swarms 和多智能体协作的商标。”

 


Gomez 表示,“Swarms 框架是有史以来第一个生产级多智能体编排框架。OpenAI 窃取了我们的名字、代码和方法。从智能体结构的语法到 Swarm 类对象,所有内容都来自我们的代码库:

https: //github.com/kyegomez/swarms

 

Gomez 指责道,“OpenAI 低质量克隆 Swarms 的项目在两天内就获得了 4000 颗星,他们说它不适用于生产和与实验无关的其他用途。代码也没有经过精心制作,看起来他们让大模型编写了代码。他们有一些类型验证,但没有文档字符串,也没有任何日志记录。”

 

Gomez 在回复网友疑问中,详细解释了他认为的 OpenAI 盗窃行为:首先,OpenAI 偷了他们的名字;其次,OpenAI 复制了他们的 `.run()` 语法,还复制了函数自动转换功能,OpenAI 在官方列表中将其列为 `Functions`,Gomez 团队将其列为“BaseTool”;然后,OpenAI 函数模式也是从他们的基本工具复制而来;最后,OpenAI 窃取了他们的 Swarm 架构模式,“从代理类到功能模式再到群体架构的一切”。

 


感兴趣的读者可自行对比:

https://github.com/openai/swarm/blob/main/swarm/core.py

https://github.com/kyegomez/swarms/blob/master/swarms/structs/base_swarm.py

 

Gomez 表示,“这是对他们最大客户之一的完全背信弃义,给人带来了巨大的失望。三年来,我们日夜工作致力于 Swarm 研究。凭借超过 3,000 次 Github 提交,我们成为有史以来优化和迭代最多的代理框架之一。这种侵权行为让我深感不安,因为我一直热心地向朋友、家人和我服务主要金融机构的同事推荐他们的模型。OpenAI 犯下的这一罪行是一个明确的信号,表明他们开始采取恶意和自私的行动来发展。最有可能是对他们最新一轮融资的回应,他们需要巨大的增长需求。我不想把这件事搞得一团糟,但我不是为了自己的利益,而是为了我的团队和 8,500 多人的社区,他们多年来不知疲倦地工作,打造了这项每个人都认为不可能实现的革命性技术。OpenAI 解决此事的唯一方法是投资我们,然后我们为他们提供名称、方法论以及他们想要的一切。我唯一的目标就是推动人类进步,我不想和你争吵 @OpenAI。”

 

对于问题的解决方案,Gomez 表示,“我们计划寻求法律赔偿,以弥补对我们名称造成的损害,除非 OpenAI 投资我们。我们的网站是http://swarms.ai,我们正在引领多智能体革命。在所有社交媒体上分享此内容,展示 OpenAI 如何窃取和侵犯他们自己的客户和用户。点赞、转发并分享这个帖子,向人们展示 OpenAI 是多么恶意。”

 


“犯罪永远比掩盖罪行更严重。”

 

@OpenAI 立即重命名此存储库,否则将产生法律后果。

 

@swarms_corp 拥有 swarm、swarms 和其他信息的商标。我们拥有商标、母公司和其他资产,以确保我们拥有自己的产品。

 

我喜欢使用您的模型,但如果您不停止这种行为,我们将不得不从 swarms 中删除所有 OpenAI 模型。

 

我们有超过 4500 万个代理在生产中运行,与世界上一些最大的金融服务、保险和医疗保健组织合作。而且,如果你们不停止这种活动,他们将不会信任你们,你们将为此损失数百万的收入。



如果 @OpenAI 向 http://swarms.ai 进行 1000 万美元的种子投资,我愿意解决这个问题,不再进一步追究。

 

我已经将 SAFE 发送给 Sam。

 

让我们看看会发生什么……

 

当地时间 10 月 14 日,Gomez 又发布了一篇“小作文”:

 

我是人工智能精英最大的威胁。

 

精英是指普林斯顿大学、哈佛大学、斯坦福大学的博士学者,以及 OpenAI、Inflection、Adept 和所有其他贪婪的人工智能实验室和公司的闭源研究人员。

 

我在佛罗里达州最糟糕的城市之一海厄利亚长大,这是一个第四世界地狱,各种犯罪猖獗。我从未读完高中。事实上,我被三所高中开除过。

 

高中毕业后,我从未上过大学。我只是在迈阿密的一个小镇多拉尔有一间办公室。并且,我掌握了 PyTorch 技能,可以在没有代码的情况下实现研究论文,因为大型学术界和大型工业界的研究人员不想开源他们的代码。

 

然后,当其中一些实现因为确实有用而流行起来时,例如思想树,我遭到了人工智能精英的残酷攻击,他们想获得不属于他们工作的所有关注和功绩,例如现在 Tree of Thoughts 的人和 OpenAI 的人。

 

自去年以来,我已经免费实现了数百个研究论文的模型,除了精英及其统治者无休止的口头骚扰外,没有任何回报。

 

我要告诉你们的是,不要理会他们,开源任何你想要的东西。实现你最喜欢的论文,不用代码。让它开源,不管代码是否好,有人会像他们帮助我一样帮助你,我甚至也可以帮助你。

 

人工智能精英们想要控制注意力和资源的流动,并将它们重新引导到他们自己和他们贪婪的伙伴身上。

 

我将继续开源每一篇有足够影响力的人工智能研究论文,不需要代码,我鼓励你也这样做!

 

人工智能精英们将继续试图抹黑我,但他们所要做的就是更详细地检查我的 Github 和我的代码,他们就会知道你正在构建的东西才是唯一重要的东西。

 

“臭名昭著的抢注者”?

 

虽然 Gomez 言辞激烈,但是舆论似乎并没有站在他那一边。

 

“我很喜欢围绕开源代码的戏剧性事件。但是说真的,KyeGomezB,你真的认为你可以为‘swarm’这样的常用词注册商标吗?”有网友提出疑问。尽管他自称拥有该商标,但有网友指出该商标归其他公司所有:

 


“如果投诉者成功将他们自认为拥有的‘swarms’商标强行注册,我会感到非常惊讶。自从我对模拟感兴趣以来,人们就一直在将 swarm 一词与各种模拟联系起来(我的意思是,如果我没记错的话,我第一次听到 swarms 这个词是在 80 年代与圣达菲研究所所做的某项模拟有关的——这已经是很久以前的事了)”有网友指出。

 

该网友指的 Swarm 是一个面向对象类库,它实现了基于代理模型的 Swarm 概念框架,并提供了许多用于在 ABM 上实施、观察和进行实验的工具。该项目创建者在 Hacker News 的帖子上表示,“嘿,这是我写的!但那已经是 30 年前的事了,别人用同样的名字也没关系。”

 


有人观察到,Gomez 在 GitHub 上获得了超过 16,000 个星星。对此,有网友解释他的实现路径是:新研究论文发布或传播 > 创建包含 AI 代码的 repo > 将其发布到社交媒体上,用户为 repo 加注星标以将其加入书签。少数测试代码的人在问题部分写下内容,但他们的问题被关闭,没有回复。

 

“这个家伙有问题,/r/MachineLearning 中的 reddit 帖子顶部评论:是的,基本上,一看到 kyegomez 链接就删除。他抢注了最近的论文以获得影响力,尽管代码从未真正运行过,更不用说复制论文结果了。我们在 /r/mlscaling 中遇到了问题,有人在不知情的情况下链接了他的垃圾。”有网友直接指出。



Gomez 小作文里也提到的 Tree of Thoughts 事件,也是因为他抢注了别人的名字。

 

去年,Gomez 在 Tree of Thoughts 作者不知情的情况下创建了一个 tree-of-thoughts 仓(https://github.com/kyegomez/tree-of-thoughts),有人指出这个是假的,Gomez 泽则表示,“这不是假的,这是一个实现。我没有说过这是 tree-of-thoughts 的原始实现。而且,它不能被删除,这是开源的。而且我没有抢夺任何人的任何东西。当没有代码或任何东西时,我提供了一个存储库。”

 

作者 Shunyu Yao 随后创建了官方实现,并向 Gomez 说道,“您介意在您的 README.md 中链接到我们的官方 repo 以避免任何混淆吗?提前谢谢”,然后 Gomez 没有回复就关闭了这个问题。在引起争议后,Gomez 称“如果他们没有命令我,我们就不会在这里争论和浪费时间,而是改进算法。”

 


当时,就有开发者为其行为感到惋惜,“作为一名构建者,我更欣赏你的代码,而不是原始存储库。我甚至很高兴能与你合作,但现在根据你的行为,我不那么确定了。我认为,从长远来看,更好的做法是更新 README,写一些类似‘受到 Shunyu 等人关于 Tree of Thoughts (原始实现在此处) 的工作启发’的内容。” “兄弟,这是一件光荣的事情,但你现在的这种行为正在玷污自己的名声。”



此外,还有网友还爆料出,Gomez 之前还曾抢注名为“sora”的存储库(https://github.com/kyegomez/Sora),去年他运行机器人来抓取微软 Bing 图像创建器,以重新提供针对他自己的“非官方”dalle3 API 请求(https://github.com/Agora-Lab-AI/Dalle3/blob/main/dalle3/dalle.py#L113),并且他还收到过许多其他有关名称抢注的投诉(https://github.com/microsoft/unilm/issues/1182)。

 

“他还经营着一项加密货币计划,声称用加密货币向贡献软件服务的人付款,假装抽奖赠送 A100,声称他的公司到 2030 年价值将达到 100 万亿美元,伪造环境碳信用房地产控股公司(在他进入人工智能领域之前)。”

 

“如果 OpenAI 法律部门的某个人能联系 Maimi-Dade 地方检察官办公室,将他提起公诉,我将不胜感激,因为我厌倦了他不断给开源带来的破坏。”该网友表示。

 

据外媒报道,Gomez 从 10 岁起开始学习编程,并将新学到的编程知识运用到游戏中,游戏也让 Gomez 最终了解了人工智能。Gomez 说,13 岁时,他创建了自己的第一个人工智能模型,用来破解他妈妈的 Gmail 账户,获取 PlayStation 代码,以便在该平台的商店购物。从那时起,Gomez 开始痴迷于人工智能和数据科学。此前他通过 APAC AI 还开发了一款基于 Slack 的人工智能助手。

 

截至发文,OpenAI 并未对此事件做出回应。

 

参考链接:

https://x.com/KyeGomezB/status/1844948853604196763

https://refreshmiami.com/18-year-old-miamian-kye-gomez-is-developing-ai-to-make-life-less-boring/?__im-phVjtwhl=11738391423021877583

https://x.com/KyeGomezB/status/1845597964145750264

https://news.ycombinator.com/item?id=41819866

https://github.com/openai/swarm/issues/50

https://github.com/kyegomez/tree-of-thoughts/issues/54

https://www.reddit.com/r/MachineLearning/comments/15sq2v1/d_potential_scammer_on_github_stealing_work_of/

2024-10-15 07:005310

评论

发布
暂无评论
发现更多内容

「工作小记」关于业务组件的思考

叶一一

前端 React 组件开发 9月月更

验证一个小小的问题

艾小仙

Java MySQL 编程 程序员 compact

Github最新霸榜!Alibaba架构师手写的分布式系统核心原理手册

了不起的程序猿

Java 分布式 开发 分布式系统 java程序员

五分钟了解 Databend 全新 SQL 类型系统

Databend

开源项目 sql 开源社区 SQL分析

利器 | AppCrawler 自动遍历测试实践(三):动手实操与常见问题汇总

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

leetcode 114. Flatten Binary Tree to Linked List 二叉树展开为链表(简单)

okokabcd

LeetCode 算法与数据结构

一文搞懂测试左移和测试右移的 Why-How-What

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

利器 | Java 接口自动化测试首选方案:REST Assured 实践 (一)

霍格沃兹测试开发学社

代码分析体系及Sonarqube平台

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

【xShell 7】强悍的Linux远程链接工具、终端模拟器

淋雨

Linux 运维 xshell

无代码开发平台怎么选?选择合适无代码平台的13个关键步骤

优秀

无代码平台

「工作小记」小程序开发的喜怒哀乐

叶一一

小程序 前端 9月月更

从 Linux 内核角度探秘 JDK NIO 文件读写本质

bin的技术小屋

Linux jdk nio Linux Kenel 文件I/O

利器 | TestNG 与 Junit 对比,测试框架如何选择?

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

java基础学习:java中的反射

Java快了!

java;

不懂PO 设计模式?这篇实战文带你搞定 PO

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

一文彻底理解 Cookie、Session、Token

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

数字藏品系统软件开发

开源直播系统源码

NFT 数字藏品 数字藏品系统软件开发 数字藏品app

由循环开始的前端学习杂谈话事录-sam9029

Sam9029

前端 个人博客 成长笔记 9月月更

Java 并发编程解析 | 如何正确理解Java领域中的锁机制,我们一般需要掌握哪些理论知识?

Java快了!

Java并发 java;

mysql查询 limit 1000,10 和limit 10 速度一样快吗?如果我要分页,我该怎么办?

Java快了!

MySQL

数据可视化系列教程之React组件使用技巧

云智慧AIOps社区

前端 React 数据可视化

云架构系统如何做性能分析?| 实战干货

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

代码质量管理平台实战| SonarQube 安装、配置及 JaCoCo、Maven 集成

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

利器 | REST Assured 实践(二):断言实现

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

你以为Shell只是命令行?读懂这篇文,给你的工作赋能

霍格沃兹测试开发学社

隐私计算中的算子是个啥?可视化组合配置的算子解决方案了解下

Jessica@数牍

隐私计算 算子 隐私计算性能

隐私计算,让企业大数据走进数据网络时代

Jessica@数牍

Xshell 7 安装激活与换机转移许可证教程详解

淋雨

Linux xshell #运维

阿里云丁宇:以领先的云原生技术,激活应用构建新范式

阿里巴巴中间件

阿里云 云原生 应用构建

一文带你了解接口测试价值与体系

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

没上过大学的“天才少年”大战OpenAI!偷架构?偷论文?到底谁在剽窃AI 开源项目_AI&大模型_褚杏娟_InfoQ精选文章