写点什么

没上过大学的“天才少年”大战 OpenAI!偷架构?偷论文?到底谁在剽窃 AI 开源项目

  • 2024-10-15
    北京
  • 本文字数:4507 字

    阅读完需:约 15 分钟

大小:1.87M时长:10:54
没上过大学的“天才少年”大战OpenAI!偷架构?偷论文?到底谁在剽窃AI 开源项目

OpenAI 近日“破天荒”地发布了一款开源产品: Swarm 框架,用于构建、编排和部署多代理系统。该框架由 OpenAI Solutions 团队管理,目前仍处于实验阶段,不打算用于生产。

 

开源地址:https://github.com/openai/swarm

 

根据介绍,OpenAI Swarm 可以协调、执行和测试多智能体,让其变得轻量且高度可控,其目标是让开发者能够以简便高效的方式管理多个 AI 智能体之间的互动。Swarm 框架的核心在于智能体(agents)和交接(handoffs)两个基础抽象( primitive abstractions):每个智能体是特定指令与工具的组合,能够独立完成任务;智能体可以在执行过程中随时将任务或对话交接给其他智能体,确保流程的流畅性和模块化。

 

Swarm 代理与 Assistants API 中的 Assistants 不同:Assistants API 提供了内置内存管理的完全托管解决方案,而 Swarm 使用 Chat Completions API 进行操作,并且在调用之间保持无状态,几乎完全在客户端上运行,非常适合寻求完全透明和精细控制上下文、步骤和工具使用的开发者。

 

社区原本还沉浸在对 OpenAI 开源框架的欢呼之中,但后来发生了一场被网友们评价为“很抓马”的闹剧。

OpenAI 偷名字、偷架构?

 

OpenAI 应用 AI 研究员 Shyamal Anadkat 在 X 上发帖介绍了该框架,随后,20 岁的开源 AI 工程师、Swarms 首席执行官和 Agora 领导者 Kye Gomez 评论道,“我们才是第一”,随后表示,“我建议你和团队改一下名字,我们有 Swarms 和多智能体协作的商标。”

 


Gomez 表示,“Swarms 框架是有史以来第一个生产级多智能体编排框架。OpenAI 窃取了我们的名字、代码和方法。从智能体结构的语法到 Swarm 类对象,所有内容都来自我们的代码库:

https: //github.com/kyegomez/swarms

 

Gomez 指责道,“OpenAI 低质量克隆 Swarms 的项目在两天内就获得了 4000 颗星,他们说它不适用于生产和与实验无关的其他用途。代码也没有经过精心制作,看起来他们让大模型编写了代码。他们有一些类型验证,但没有文档字符串,也没有任何日志记录。”

 

Gomez 在回复网友疑问中,详细解释了他认为的 OpenAI 盗窃行为:首先,OpenAI 偷了他们的名字;其次,OpenAI 复制了他们的 `.run()` 语法,还复制了函数自动转换功能,OpenAI 在官方列表中将其列为 `Functions`,Gomez 团队将其列为“BaseTool”;然后,OpenAI 函数模式也是从他们的基本工具复制而来;最后,OpenAI 窃取了他们的 Swarm 架构模式,“从代理类到功能模式再到群体架构的一切”。

 


感兴趣的读者可自行对比:

https://github.com/openai/swarm/blob/main/swarm/core.py

https://github.com/kyegomez/swarms/blob/master/swarms/structs/base_swarm.py

 

Gomez 表示,“这是对他们最大客户之一的完全背信弃义,给人带来了巨大的失望。三年来,我们日夜工作致力于 Swarm 研究。凭借超过 3,000 次 Github 提交,我们成为有史以来优化和迭代最多的代理框架之一。这种侵权行为让我深感不安,因为我一直热心地向朋友、家人和我服务主要金融机构的同事推荐他们的模型。OpenAI 犯下的这一罪行是一个明确的信号,表明他们开始采取恶意和自私的行动来发展。最有可能是对他们最新一轮融资的回应,他们需要巨大的增长需求。我不想把这件事搞得一团糟,但我不是为了自己的利益,而是为了我的团队和 8,500 多人的社区,他们多年来不知疲倦地工作,打造了这项每个人都认为不可能实现的革命性技术。OpenAI 解决此事的唯一方法是投资我们,然后我们为他们提供名称、方法论以及他们想要的一切。我唯一的目标就是推动人类进步,我不想和你争吵 @OpenAI。”

 

对于问题的解决方案,Gomez 表示,“我们计划寻求法律赔偿,以弥补对我们名称造成的损害,除非 OpenAI 投资我们。我们的网站是http://swarms.ai,我们正在引领多智能体革命。在所有社交媒体上分享此内容,展示 OpenAI 如何窃取和侵犯他们自己的客户和用户。点赞、转发并分享这个帖子,向人们展示 OpenAI 是多么恶意。”

 


“犯罪永远比掩盖罪行更严重。”

 

@OpenAI 立即重命名此存储库,否则将产生法律后果。

 

@swarms_corp 拥有 swarm、swarms 和其他信息的商标。我们拥有商标、母公司和其他资产,以确保我们拥有自己的产品。

 

我喜欢使用您的模型,但如果您不停止这种行为,我们将不得不从 swarms 中删除所有 OpenAI 模型。

 

我们有超过 4500 万个代理在生产中运行,与世界上一些最大的金融服务、保险和医疗保健组织合作。而且,如果你们不停止这种活动,他们将不会信任你们,你们将为此损失数百万的收入。



如果 @OpenAI 向 http://swarms.ai 进行 1000 万美元的种子投资,我愿意解决这个问题,不再进一步追究。

 

我已经将 SAFE 发送给 Sam。

 

让我们看看会发生什么……

 

当地时间 10 月 14 日,Gomez 又发布了一篇“小作文”:

 

我是人工智能精英最大的威胁。

 

精英是指普林斯顿大学、哈佛大学、斯坦福大学的博士学者,以及 OpenAI、Inflection、Adept 和所有其他贪婪的人工智能实验室和公司的闭源研究人员。

 

我在佛罗里达州最糟糕的城市之一海厄利亚长大,这是一个第四世界地狱,各种犯罪猖獗。我从未读完高中。事实上,我被三所高中开除过。

 

高中毕业后,我从未上过大学。我只是在迈阿密的一个小镇多拉尔有一间办公室。并且,我掌握了 PyTorch 技能,可以在没有代码的情况下实现研究论文,因为大型学术界和大型工业界的研究人员不想开源他们的代码。

 

然后,当其中一些实现因为确实有用而流行起来时,例如思想树,我遭到了人工智能精英的残酷攻击,他们想获得不属于他们工作的所有关注和功绩,例如现在 Tree of Thoughts 的人和 OpenAI 的人。

 

自去年以来,我已经免费实现了数百个研究论文的模型,除了精英及其统治者无休止的口头骚扰外,没有任何回报。

 

我要告诉你们的是,不要理会他们,开源任何你想要的东西。实现你最喜欢的论文,不用代码。让它开源,不管代码是否好,有人会像他们帮助我一样帮助你,我甚至也可以帮助你。

 

人工智能精英们想要控制注意力和资源的流动,并将它们重新引导到他们自己和他们贪婪的伙伴身上。

 

我将继续开源每一篇有足够影响力的人工智能研究论文,不需要代码,我鼓励你也这样做!

 

人工智能精英们将继续试图抹黑我,但他们所要做的就是更详细地检查我的 Github 和我的代码,他们就会知道你正在构建的东西才是唯一重要的东西。

 

“臭名昭著的抢注者”?

 

虽然 Gomez 言辞激烈,但是舆论似乎并没有站在他那一边。

 

“我很喜欢围绕开源代码的戏剧性事件。但是说真的,KyeGomezB,你真的认为你可以为‘swarm’这样的常用词注册商标吗?”有网友提出疑问。尽管他自称拥有该商标,但有网友指出该商标归其他公司所有:

 


“如果投诉者成功将他们自认为拥有的‘swarms’商标强行注册,我会感到非常惊讶。自从我对模拟感兴趣以来,人们就一直在将 swarm 一词与各种模拟联系起来(我的意思是,如果我没记错的话,我第一次听到 swarms 这个词是在 80 年代与圣达菲研究所所做的某项模拟有关的——这已经是很久以前的事了)”有网友指出。

 

该网友指的 Swarm 是一个面向对象类库,它实现了基于代理模型的 Swarm 概念框架,并提供了许多用于在 ABM 上实施、观察和进行实验的工具。该项目创建者在 Hacker News 的帖子上表示,“嘿,这是我写的!但那已经是 30 年前的事了,别人用同样的名字也没关系。”

 


有人观察到,Gomez 在 GitHub 上获得了超过 16,000 个星星。对此,有网友解释他的实现路径是:新研究论文发布或传播 > 创建包含 AI 代码的 repo > 将其发布到社交媒体上,用户为 repo 加注星标以将其加入书签。少数测试代码的人在问题部分写下内容,但他们的问题被关闭,没有回复。

 

“这个家伙有问题,/r/MachineLearning 中的 reddit 帖子顶部评论:是的,基本上,一看到 kyegomez 链接就删除。他抢注了最近的论文以获得影响力,尽管代码从未真正运行过,更不用说复制论文结果了。我们在 /r/mlscaling 中遇到了问题,有人在不知情的情况下链接了他的垃圾。”有网友直接指出。



Gomez 小作文里也提到的 Tree of Thoughts 事件,也是因为他抢注了别人的名字。

 

去年,Gomez 在 Tree of Thoughts 作者不知情的情况下创建了一个 tree-of-thoughts 仓(https://github.com/kyegomez/tree-of-thoughts),有人指出这个是假的,Gomez 泽则表示,“这不是假的,这是一个实现。我没有说过这是 tree-of-thoughts 的原始实现。而且,它不能被删除,这是开源的。而且我没有抢夺任何人的任何东西。当没有代码或任何东西时,我提供了一个存储库。”

 

作者 Shunyu Yao 随后创建了官方实现,并向 Gomez 说道,“您介意在您的 README.md 中链接到我们的官方 repo 以避免任何混淆吗?提前谢谢”,然后 Gomez 没有回复就关闭了这个问题。在引起争议后,Gomez 称“如果他们没有命令我,我们就不会在这里争论和浪费时间,而是改进算法。”

 


当时,就有开发者为其行为感到惋惜,“作为一名构建者,我更欣赏你的代码,而不是原始存储库。我甚至很高兴能与你合作,但现在根据你的行为,我不那么确定了。我认为,从长远来看,更好的做法是更新 README,写一些类似‘受到 Shunyu 等人关于 Tree of Thoughts (原始实现在此处) 的工作启发’的内容。” “兄弟,这是一件光荣的事情,但你现在的这种行为正在玷污自己的名声。”



此外,还有网友还爆料出,Gomez 之前还曾抢注名为“sora”的存储库(https://github.com/kyegomez/Sora),去年他运行机器人来抓取微软 Bing 图像创建器,以重新提供针对他自己的“非官方”dalle3 API 请求(https://github.com/Agora-Lab-AI/Dalle3/blob/main/dalle3/dalle.py#L113),并且他还收到过许多其他有关名称抢注的投诉(https://github.com/microsoft/unilm/issues/1182)。

 

“他还经营着一项加密货币计划,声称用加密货币向贡献软件服务的人付款,假装抽奖赠送 A100,声称他的公司到 2030 年价值将达到 100 万亿美元,伪造环境碳信用房地产控股公司(在他进入人工智能领域之前)。”

 

“如果 OpenAI 法律部门的某个人能联系 Maimi-Dade 地方检察官办公室,将他提起公诉,我将不胜感激,因为我厌倦了他不断给开源带来的破坏。”该网友表示。

 

据外媒报道,Gomez 从 10 岁起开始学习编程,并将新学到的编程知识运用到游戏中,游戏也让 Gomez 最终了解了人工智能。Gomez 说,13 岁时,他创建了自己的第一个人工智能模型,用来破解他妈妈的 Gmail 账户,获取 PlayStation 代码,以便在该平台的商店购物。从那时起,Gomez 开始痴迷于人工智能和数据科学。此前他通过 APAC AI 还开发了一款基于 Slack 的人工智能助手。

 

截至发文,OpenAI 并未对此事件做出回应。

 

参考链接:

https://x.com/KyeGomezB/status/1844948853604196763

https://refreshmiami.com/18-year-old-miamian-kye-gomez-is-developing-ai-to-make-life-less-boring/?__im-phVjtwhl=11738391423021877583

https://x.com/KyeGomezB/status/1845597964145750264

https://news.ycombinator.com/item?id=41819866

https://github.com/openai/swarm/issues/50

https://github.com/kyegomez/tree-of-thoughts/issues/54

https://www.reddit.com/r/MachineLearning/comments/15sq2v1/d_potential_scammer_on_github_stealing_work_of/

2024-10-15 07:005382

评论

发布
暂无评论
发现更多内容

数据集成时表模型同步方法解析

KaiwuDB

数据库 数据同步 数据集成

IPQ9574: High-performance WiFi7 wireless network chip leading the future

wallysSK

Video-LLaMA:为AI大模型注入视听觉

百度开发者中心

人工智能 大模型

如何实现数据库读一致性

京东科技开发者

喜讯!无垠智能模糊测试系统入选“2023软件供应链优秀成果”

云起无垠

深入理解WebSocket ACK:关键技术提升数据传输的可靠性

Apifox

前端 后端 websocket 协议 WebSocket ACK

一文带你揭秘淘宝终端技术

阿里技术

基础设施 招聘 淘宝 终端技术

【深入挖掘Java技术】「源码原理体系」盲点问题解析之HashMap工作原理全揭秘(上)

洛神灬殇

Java 源码分析 hashmap 实现原理 2024年第十三篇文章

CNCF大使预测:2024年云原生面临倦怠、离职及云成本精简

SEAL安全

云原生 FinOps 开发人员

全面了解网络性能监测:从哪些方面进行监测?

雪奈椰子

活了三十多年终于知道单模光纤与多模光纤

小齐写代码

如何在苹果手机上进行文件管理

Meta Llama大模型:引领人工智能创新

百度开发者中心

人工智能 深度学习 大模型

Code Llama:基于 Llama 2 的 AI 代码生成大模型

百度开发者中心

人工智能 大模型 代码生成

为什么需要在 OpenShift 上部署企业级 Ingress Controller

NGINX开源社区

负载均衡 Kubernetes openshift Ingress Controller nginx 开源版

请用心对待面试机会

老张

面试经验 求职面试 求职技巧

企业为什么要选择软件定制开发?

天津汇柏科技有限公司

软件定制 软件定制开发 软件开发定制

得物云原生容器技术探索与落地实践

得物技术

云原生 技术分享

深入了解LLaMA大模型

百度开发者中心

深度学习 nlp 大模型

软件研发过程中,项目管理工具应该如何选择?

极狐GitLab

没上过大学的“天才少年”大战OpenAI!偷架构?偷论文?到底谁在剽窃AI 开源项目_AI&大模型_褚杏娟_InfoQ精选文章