写点什么

用 ChatGPT 自研大模型被封号,字节最新回应:最初有用 GPT API,但没发布、已停止

  • 2023-12-18
    北京
  • 本文字数:1071 字

    阅读完需:约 4 分钟

大小:499.86K时长:02:50
用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止

根据 The Verge 报道,字节跳动内部文件证实“其基础 LLM 的开发依赖 OpenAI API 进行”。名为为“Project Seed”的项目报告称,几乎涵盖了模型训练、评估等开发的每个阶段。为此,OpenAI 暂停了字节跳动的帐户。

 

OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

 

“虽然字节跳动对我们 API 的使用很少,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不遵守这些政策,我们将要求他们进行必要的更改或终止他们的帐户。”据称,字节跳动使用 GPT 违反了微软和 OpenAI 的开发者许可。

 

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

 

The Verge 报道称,字节跳动意识到了这一点,但仍继续使用 API 来训练和比较其模型。 The Verge 还表示,它看到了该公司指示员工使用“数据脱敏”来掩盖证据的内部通讯内容。

 

大约在字节跳动的聊天机器人豆包(Doubao)被国内监管机构批准使用时,公司指示员工停止使用该 API 来开发 Project Seed 项目。但 Verge 杂志报道称,该 API 仍被用于评估他们自己的聊天机器人的表现。据悉,豆包是字节在 8 月发布的首款 AI 对话产品,多家媒体评测结果显示,豆包的智能化水平在大模型 C 端助理类产品中不算突出。

 

对此,字节跳动相关负责人回应称,公司在使用 OpenAI 相关服务时,强调要遵守其使用条款。公司也正与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。以下是字节跳动使用 OpenAI 服务相关情况的介绍:

 

  1. 今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在 4 月公司引入 GPT API 调用规范检查后,这种做法已经停止。

  2. 早在今年 4 月,字节大模型团队已经提出了明确的内部要求,不得将 GPT 模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用 GPT 时遵守服务条款。

  3. 9 月,公司内部又进行了一轮检查,采取措施进一步保证对 GPT 的 API 调用符合规范要求。例如分批次抽样检测模型训练数据与 GPT 的相似度,避免数据标注人员私自使用 GPT。

  4. 未来几天里,字节会再次全面检查,以确保严格遵守相关服务的使用条款。

 

 参考链接:

https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm

https://www.businessinsider.com/bytedance-openai-tech-artificial-intelligence-tiktok-sam-altman-2023-12

2023-12-18 15:185432

评论 6 条评论

发布
用户头像
666
2023-12-20 21:16 · 北京
回复
用户头像
OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

站在道德制高点说好的事情,就是让我垄断,不要和我竞争,哈哈。
2023-12-19 17:39 · 北京
回复
用户头像
为什么不行,提供服务就是给别人用的,你管他是用来训练模型还是干嘛
2023-12-19 10:36 · 中国香港
回复
那还谈什么知识产权,各种许可协议不就没用了 ,大家可以随便使用。
2023-12-20 16:16 · 广东
回复
你这.....
2023-12-21 21:28 · 广东
回复
用户头像
没被封号的人生,是不完整的
2023-12-18 18:22 · 北京
回复
没有更多了
发现更多内容

从零开始学Spring Boot系列-Hello World

不在线第一只蜗牛

Java 架构 Spring Boot 后端

深度学习模型在游戏测试框架中的迁移学习研究

测吧(北京)科技有限公司

测试

如何用二维码高效收集信息?表单功能轻松实现

草料二维码

二维码 表单 信息收集 草料二维码

如何做代币分析:以 SHIB 币为例

Footprint Analytics

Token 代币

游戏自动化测试框架与平台的模型驱动设计方法研究

测吧(北京)科技有限公司

测试

基于知识图谱的游戏自动化测试用例推导与生成

测吧(北京)科技有限公司

测试

香港游戏服务器的选择与配置:打造极致游戏体验

一只扑棱蛾子

游戏服务器 香港服务器 香港游戏服务器

数字先锋| 天翼云赋能汤房社区数字化“智”理,打造居民生活“幸福圈”!

天翼云开发者社区

云计算 云服务 云平台

SD-WAN案例:总部(MPLS)与分支(普通宽带)的互联互通

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

流量录制回放,不是银弹!

老张

流量录制 投入产出比

数字化转型解锁企业高效协作与管理优化的新篇章!

聚道云软件连接器

案例分享

低代码开发如何助力数字化企业管理系统平台构建

不在线第一只蜗牛

低代码 数字化 企业转型 数字转型

利用AI预测游戏中的潜在问题

测吧(北京)科技有限公司

测试

利用强化学习技术实现游戏自动化测试用例的智能生成

测吧(北京)科技有限公司

测试

The Grapes NFT 概览与数据分析

Footprint Analytics

区块链游戏 NFT

基于人工智能的游戏测试平台:提高测试效率与准确性

测吧(北京)科技有限公司

测试

邀请函 | 2024年数据技术嘉年华集结号已吹响,期待您参会!

墨天轮

数据库 oracle postgresql MySQL 运维 国产数据库

探索比特币现货 ETF 对加密货币价格的潜在影响

TechubNews

用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止_企业动态_褚杏娟_InfoQ精选文章