「一场值回票价的演讲」将重现QCon? 了解详情
写点什么

用 ChatGPT 自研大模型被封号,字节最新回应:最初有用 GPT API,但没发布、已停止

  • 2023-12-18
    北京
  • 本文字数:1071 字

    阅读完需:约 4 分钟

大小:499.86K时长:02:50
用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止

根据 The Verge 报道,字节跳动内部文件证实“其基础 LLM 的开发依赖 OpenAI API 进行”。名为为“Project Seed”的项目报告称,几乎涵盖了模型训练、评估等开发的每个阶段。为此,OpenAI 暂停了字节跳动的帐户。

 

OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

 

“虽然字节跳动对我们 API 的使用很少,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不遵守这些政策,我们将要求他们进行必要的更改或终止他们的帐户。”据称,字节跳动使用 GPT 违反了微软和 OpenAI 的开发者许可。

 

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

 

The Verge 报道称,字节跳动意识到了这一点,但仍继续使用 API 来训练和比较其模型。 The Verge 还表示,它看到了该公司指示员工使用“数据脱敏”来掩盖证据的内部通讯内容。

 

大约在字节跳动的聊天机器人豆包(Doubao)被国内监管机构批准使用时,公司指示员工停止使用该 API 来开发 Project Seed 项目。但 Verge 杂志报道称,该 API 仍被用于评估他们自己的聊天机器人的表现。据悉,豆包是字节在 8 月发布的首款 AI 对话产品,多家媒体评测结果显示,豆包的智能化水平在大模型 C 端助理类产品中不算突出。

 

对此,字节跳动相关负责人回应称,公司在使用 OpenAI 相关服务时,强调要遵守其使用条款。公司也正与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。以下是字节跳动使用 OpenAI 服务相关情况的介绍:

 

  1. 今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在 4 月公司引入 GPT API 调用规范检查后,这种做法已经停止。

  2. 早在今年 4 月,字节大模型团队已经提出了明确的内部要求,不得将 GPT 模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用 GPT 时遵守服务条款。

  3. 9 月,公司内部又进行了一轮检查,采取措施进一步保证对 GPT 的 API 调用符合规范要求。例如分批次抽样检测模型训练数据与 GPT 的相似度,避免数据标注人员私自使用 GPT。

  4. 未来几天里,字节会再次全面检查,以确保严格遵守相关服务的使用条款。

 

 参考链接:

https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm

https://www.businessinsider.com/bytedance-openai-tech-artificial-intelligence-tiktok-sam-altman-2023-12

2023-12-18 15:184953

评论 6 条评论

发布
用户头像
666
2023-12-20 21:16 · 北京
回复
用户头像
OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

站在道德制高点说好的事情,就是让我垄断,不要和我竞争,哈哈。
2023-12-19 17:39 · 北京
回复
用户头像
为什么不行,提供服务就是给别人用的,你管他是用来训练模型还是干嘛
2023-12-19 10:36 · 中国香港
回复
那还谈什么知识产权,各种许可协议不就没用了 ,大家可以随便使用。
2023-12-20 16:16 · 广东
回复
你这.....
2023-12-21 21:28 · 广东
回复
用户头像
没被封号的人生,是不完整的
2023-12-18 18:22 · 北京
回复
没有更多了
发现更多内容

【活动预告】下一代数据平台走向何方?

SphereEx

大数据 大前端 ShardingSphere SphereEx 线上沙龙

恒源云(GPUSHARE)_训练一个专门捣乱的模型

恒源云

人工智能 深度学习 算力

SAP 公有云和私有云解决方案概述

汪子熙

公有云 云平台 SAP 11月日更 公有云私有云

分布式软时钟有多重要?|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

尝试 Promise A+

Jeannette

async/await 优雅永不过时

CRMEB

跨端分布式计算技术初探|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

ETL工具算法构建企业级数据仓库五步法

大数据技术指南

11月日更

Apache Tomcat 7.x安全加固指南

喀拉峻

网络安全 安全 信息安全

硬科技起飞,这家成立仅三年的AI研究院已颇具国际风范

硬科技星球

应急响应入门之Linux分析排查

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

闭包与内存泄露

Jeannette

Tapdata “设擂招贤”携手 LeetCode 举办全球极客技术竞赛

tapdata

先到先得!Alibaba甩出第四次更新的JDK源码高级笔记(终极版)

热爱java的分享家

Java 源码 jdk 面试 经验分享

一周信创舆情观察(11.15~11.21)

统小信uos

架构实战营 模块五

felix

#架构实战营

下单延迟10s撤单性能测试

FunTester

性能测试 延迟队列 接口测试 测试框架 FunTester

字节跳动如何系统性治理 iOS 稳定性问题

字节跳动终端技术

ios 字节跳动 APM APP稳定性

JS函数的this

Jeannette

【Pandas学习笔记01】强大的分析结构化数据的工具集

恒生LIGHT云社区

Python 大数据 数据分析 pandas

两个小时手写了个Zookeeper分布式服务注册中心

热爱java的分享家

Java 面试 程序人生 编程语言 经验分享

10年阿里人告诉你:秒杀系统设计就该这么玩

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

2021年26家大厂Java面试题整理了360道(分布式+微服务+高并发)

热爱java的分享家

Java 架构 面试 程序人生 经验分享

Javascript的内存管理

Jeannette

JS柯里化和反柯里化

Jeannette

广发证券携手HarmonyOS打造智慧金融服务|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

质量基础设施“一站式”线上平台搭建,NQI一站式综合平台解决方案

电微13828808271

智慧园区一体化管理平台开发,园区智能化集成系统

电微13828808271

微信 ClickHouse 实时数仓的最佳实践

科技热闻

SAP ERP classification 和 SAP Cloud for Customer 的同步

汪子熙

中间件 SAP ERP C4C 11月日更

TDengine在理想汽车物联网业务场景的落地实践

TDengine

tdengine 时序数据库

用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止_企业动态_褚杏娟_InfoQ精选文章