报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

没想到国内大模型厂商又一次 high 起来,是因为 OpenAI 断供!

  • 2024-06-26
    北京
  • 本文字数:3275 字

    阅读完需:约 11 分钟

大小:1.58M时长:09:12
没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!

整理 | 褚杏娟、华卫

 

6 月 25 日起,陆续有包括中国大陆在内的各国和相关地区 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的邮件,表示将采取额外措施停止其不支持的地区的 API 使用。

 

根据网上流传的邮件截图,OpenAI 表示:“根据数据显示,你的组织有来自 OpenAl 目前不支持的地区的 API 流量。从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAI 支持的国家、地区名单上的 API 使用。”

 

“要继续使用 OpenAI 的服务,您需要在受支持的地区访问该服务。”在 OpenAI 给出的“支持访问国家和地区”名单上,世界上大部分地区都可以使用 OpenAI,包括几乎整个西方、东欧大部分地区、南亚和大约一半的非洲,但中国大陆、中国香港、俄罗斯、朝鲜、伊朗等地均未在列。

 


而上述不受支持的中国、俄罗斯、朝鲜、伊朗四个国家,似乎“踩在” OpenAI 的雷达上已有一段时间。今年 2 月,这家人工智能公司宣布关闭了其声称由这四个国家的 "国家附属恶意行为者 "使用的账户,表示他们使用 ChatGPT 帮助进行网络钓鱼攻击和开发恶意软件。上个月底,OpenAI 打击了另一组来自中国、俄罗斯、伊朗和以色列的账户。

 

实际上,OpenAI 早先就对中国大陆地区的用户实行了注册门槛,限制了其对 ChatGPT 服务的访问权限。中国大陆的开发者群体在构建基于 OpenAI API 的衍生服务时,往往需要通过代理服务器或在海外部署反向代理机制。这不仅增加了运维成本,也无法保证服务的稳定性。

 

这次,OpenAI 的强制决策一出,便立刻引发了国内大模型厂商的回应,各厂商纷纷表示可以支持企业“无痛”迁移,并发布了不少吸引 OpenAI 用户使用其平台的激励措施。而根据多位行业专业人士的看法和预测,国内大模型行业内部此时也有更深层次的担忧与挑战悄然浮现。

 

“百模大战”

 

首先作出反应的是智谱 AI。当天下午一点半左右,智谱 bigmodel.cn 推出了 OpenAl API 用户特别搬家计划,帮助用户切换至国产大模型,具体包括为开发者提供 1.5 亿 Token(5000 万 GLM-4 +1 亿 GLM-4-Air) 以及从 OpenAl 到 GLM 的系列迁移培训。对于高用量客户,智谱提供与 OpenAl 使用规模对等的 Token 赠送计划(不设上限),以及与 OpenAl 对等的并发规模等。

 


当天下午四点半左右,百度智能云千帆推出了大模型普惠计划,即日起为新注册企业用户提供:

  •  0 元调用:

    文心旗舰模型首次免费,赠送 ERNIE3.5 旗舰模型 5000 万 Tokens 包,主力模型 ERNIE Speed/ERNIE Lite 和轻量模型 ERNIE Tiny 持续免费;

    针对 OpenAI 迁移用户额外赠送与 OpenAI 使用规模对等的 ERNIE3.5 旗舰模型 Tokens 包。

  • 0 元训练:免费模型精调训练服务

  • 0 元迁移:零成本 SDK 迁移工具

  • 0 元服务:专家服务(迁移 &使用指导)

 

不过,百度智能云表示,以上优惠活动均在 2024 年 7 月 25 日 24 点前适用。


不到半小时后,阿里云紧接着宣布,将为 OpenAI API 用户提供最具性价比的中国大模型替代方案,并为中国开发者提供 2200 万免费 tokens 和专属迁移服务。据悉,通义千问主力模型Qwen-plus 在阿里云百炼上的调用价格为 0.004 元/千 tokens,仅为 GPT-4 的 50 分之一。根据斯坦福最新公布的大模型测评榜单 HELM MMLU,Qwen2-72B 得分为 0.824,与 GPT-4 并列全球第四。

 


随后在当天六点 20 分左右,零一万物宣布发起了“Yi API 二折平替计划”,面向 OpenAI 用户推出了平滑迁移至 Yi 系列大模型的服务,并针对接入 OpenAI 的不同模型的用户,一一对应地提供了高模型性能且极具性价比的替换方案。

 


据介绍,目前注册使用 Yi API 的新客户,零一万物立即赠送 100 元额度;平台充值还将赠送 50% 到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受 RPM/TPM 限速直升 Tier3,直达高级别的服务质量和超快响应速度。此外,零一万物 API 还将提供 Prompt 兼容调优服务支持,陪伴用户适配 Yi 系列大模型。

 

零一万物表示,在模型性能相近的同时,Yi-Large 的定价远低于顶配模型 GPT-4o。以 GPT-4o 的定价计算(取 Input 和 Output 均值为 Open API 价格),接入 Yi-Large 后使用成本可下降 72%;而对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上;对于简单任务的处理,Yi-Medium 的使用成本较 GPT-3.5-Turbo-1106 下降 66%。


此外,零一万物还可提供支持实时搜索的 Yi-Large-RAG,适用于需要结合实时信息进行推理的场景,以便用户基于自身需求选择更匹配的模型。

 

当日,AI Infra 厂商硅基流动则直接宣布开放 7 款大模型:SiliconCloud 平台的 Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等开源大模型免费使用。SiliconCloud 是集合主流开源大模型的一站式云服务平台,目前已上架包括 DeepSeek-Coder-V2、Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID 在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud 提供开箱即用的大模型推理加速服务。



当天晚 8 点左右,腾讯云宣布,即日起,新迁移企业用户可免费获得腾讯混元大模型 1 亿 Tokens。目前,腾讯云提供混元 Pro、Standard、Lite 等多个不同版本和尺寸的模型,用户可任意选择。腾讯还将为新迁移企业用户提供免费专属迁移工具和服务,该福利截止 7 月 31 日 24 点前。

 

今日凌晨,百川智能也跟进宣布了“零成本迁移”的措施:免费赠送 1 千万 token、Assistants API 免费使用。另外,百川开设了专家技术群,表示专家随时答疑,五分钟即可完成 API 迁移。


据悉,百川智能前不久刚发布最新一代基座大模型 Baichuan 4,并推出成立之后的首款 AI 助手“百小应”。Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14%和 9%。


一时的机会,更卷的将来


中美之间日益紧张的关系可能是促使 OpenAI 决定打击不受支持的用户的一个因素。自特朗普执政以来,美国已经对中国实施了制裁和关税,包括拜登总统增加对中国芯片、电池和电动汽车的关税。

 

为此,中国也加大了实现技术自给自足的力度,规定其电信公司在 2027 年前停止使用英特尔和 AMD 的 CPU,并要求其汽车制造商在 2025 年前至少在国内采购四分之一的计算机处理器。

 

尽管 OpenAI 正计划阻止在中国的 API 访问,但这对中国公司来说,无疑是一个迅速填补即将到来的市场空白以获得更多用户的好机会。不过,之后国内其他厂商是否会跟进,目前尚不能确定。

 

有专家预测,OpenAI 主动“送生意”的做法,给了国内的大模型厂商喘气的机会,但后续可能就得被迫继续卷价格。这意味着,已经有些降温的“大模型价格战”或将再次“火热”。可以看出,国内大模型行业在机遇重重的同时,竞争也将进一步加剧。

 

正如百川智能 CEO 王小川所说,“我们不需要一千、一万个大模型,在没有价格战的时候,中国可能真的是上百、上千个大模型在进行。”

 

同时,有不少网友纷纷议论:部分国产大模型是否会因 OpenAI 的断服“现原形”。国产大模型中是否存在调用 OpenAI  API 的这一问题暂且不论,目前根据各类大模型用户在公开平台发表的使用反馈来看,许多国产大模型的中文文本上处理能力并不弱于 ChatGPT ,在视频、图片等多模态方面有所不足,但整体来说影响有限。


不可否认的是,对于国内一批使用 OpenAI  API 的开发者来说,影响是巨大的。还有人士对国内用户发出了“谨慎付费”的友善提醒,一些通过调用海外大模型 API 接口来提供服务的套壳网站,之后可能因高昂的站点迁移成本关停跑路。


此外,OpenAI 强制执行其不支持国家列表的访问政策,在对中国开发者产生负面影响的同时,也可能带来其他方面的双向后果。

 

根据 Reddit 上的一篇帖子,总部位于美国的云平台公司 Vercel 的用户如果通过 Vercel 的边缘网络访问 OpenAI,也会收到同样的 OpenAI 邮件。目前还不清楚这封电子邮件是否发送有误,但 Vercel 的边缘网络确实有一个位于香港的区域,与中国大陆一样不受 OpenAI 支持。

2024-06-26 14:337728

评论

发布
暂无评论
发现更多内容

知识管理的成功案例大赏

小炮

实用机器学习笔记二十四:模型调参

打工人!

学习笔记 机器学习算法 3月月更 模型调参

优雅的DO,VO,DTO转换工具MapStruct

卢永德

3月月更

Go学习笔记——条件判断if

为自己带盐

Go 学习笔记 3月月更

恒源云(GpuShare)_医学图像分割:MT-UNet

恒源云

深度学习 机器翻译 transform

毕业总结

whoami

架构训练营

Linux中如何使用Htop监控工具?【网络安全】

H

Linux 网络安全

URL重定向及跳转漏洞

喀拉峻

网络安全

毕业总结

皓月

「架构实战营」

产品帮助中心的制作方法及工具推荐

小炮

科技创新力强,旺链科技创始人刘涛荣登G60科创走廊创业榜单

旺链科技

区块链 产业区块链 创新创业

程序设计优化之管道数据流

有道技术团队

java培训:Redis和Mysql数据怎么保持一致

@零度

MySQL redis JAVA开发

写给20几岁的程序员

shellc

财富 35岁

DNA to Face,会是寻人缉凶的一颗“银弹”吗?

脑极体

虎符交易所完成2月HOO回购 HOO单月涨幅高达40%

区块链前沿News

Hoo 虎符交易所 平台币

CNI 这么多,怎么选?| 容器网络系列第1期

BoCloud博云

Kubernetes 容器云 cni 容器网络平台

Python 获取字典中的第一个键

AlwaysBeta

Python 程序员 编程语言 字典

重点操作之上线、恢复、部署 - 大屏云极简使用手册

shulinwu

Java 8 Stream 从入门到进阶——像SQL一样玩转集合

Geek_rze78a

Java JAVA stream

理解Restful风格

蜜糖的代码注释

RESTful 接口规范 REST API 3月月更

操作系统面试总结

yuexin_tech

操作系统

电商秒杀系统架构设计文档

皓月

「架构实战营」

AHPA:开启 Kubernetes 弹性预测之门

阿里巴巴云原生

阿里云 Kubernetes 云原生 AHPA 弹性预测

华为SmartCare和AUTIN品牌升级:助力运营商走出5G发展迷宫

白洞计划

用 vite 2 平滑升级 vue 2 + webpack 项目实战

CRMEB

程序员硬核测评:全方位测评 GaussDB(for Redis) 和开源 Redis

华为云数据库小助手

性能分析 GaussDB GaussDB ( for Redis ) 华为云数据库 开源Redis

信息安全无小事!教你如何做日志脱敏

卢永德

Go实现并发聚合,批量提交功能

人生如梦

Go 并发 请求聚合

39 个 Java 集合框架面试题

逆锋起笔

java面试 死磕 Java 基础 3月月更 Java集合框架

尚硅谷Maven新版视频教程发布

@零度

maven

没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!_生成式 AI_华卫_InfoQ精选文章