写点什么

没想到国内大模型厂商又一次 high 起来,是因为 OpenAI 断供!

  • 2024-06-26
    北京
  • 本文字数:3275 字

    阅读完需:约 11 分钟

大小:1.58M时长:09:12
没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!

整理 | 褚杏娟、华卫

 

6 月 25 日起,陆续有包括中国大陆在内的各国和相关地区 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的邮件,表示将采取额外措施停止其不支持的地区的 API 使用。

 

根据网上流传的邮件截图,OpenAI 表示:“根据数据显示,你的组织有来自 OpenAl 目前不支持的地区的 API 流量。从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAI 支持的国家、地区名单上的 API 使用。”

 

“要继续使用 OpenAI 的服务,您需要在受支持的地区访问该服务。”在 OpenAI 给出的“支持访问国家和地区”名单上,世界上大部分地区都可以使用 OpenAI,包括几乎整个西方、东欧大部分地区、南亚和大约一半的非洲,但中国大陆、中国香港、俄罗斯、朝鲜、伊朗等地均未在列。

 


而上述不受支持的中国、俄罗斯、朝鲜、伊朗四个国家,似乎“踩在” OpenAI 的雷达上已有一段时间。今年 2 月,这家人工智能公司宣布关闭了其声称由这四个国家的 "国家附属恶意行为者 "使用的账户,表示他们使用 ChatGPT 帮助进行网络钓鱼攻击和开发恶意软件。上个月底,OpenAI 打击了另一组来自中国、俄罗斯、伊朗和以色列的账户。

 

实际上,OpenAI 早先就对中国大陆地区的用户实行了注册门槛,限制了其对 ChatGPT 服务的访问权限。中国大陆的开发者群体在构建基于 OpenAI API 的衍生服务时,往往需要通过代理服务器或在海外部署反向代理机制。这不仅增加了运维成本,也无法保证服务的稳定性。

 

这次,OpenAI 的强制决策一出,便立刻引发了国内大模型厂商的回应,各厂商纷纷表示可以支持企业“无痛”迁移,并发布了不少吸引 OpenAI 用户使用其平台的激励措施。而根据多位行业专业人士的看法和预测,国内大模型行业内部此时也有更深层次的担忧与挑战悄然浮现。

 

“百模大战”

 

首先作出反应的是智谱 AI。当天下午一点半左右,智谱 bigmodel.cn 推出了 OpenAl API 用户特别搬家计划,帮助用户切换至国产大模型,具体包括为开发者提供 1.5 亿 Token(5000 万 GLM-4 +1 亿 GLM-4-Air) 以及从 OpenAl 到 GLM 的系列迁移培训。对于高用量客户,智谱提供与 OpenAl 使用规模对等的 Token 赠送计划(不设上限),以及与 OpenAl 对等的并发规模等。

 


当天下午四点半左右,百度智能云千帆推出了大模型普惠计划,即日起为新注册企业用户提供:

  •  0 元调用:

    文心旗舰模型首次免费,赠送 ERNIE3.5 旗舰模型 5000 万 Tokens 包,主力模型 ERNIE Speed/ERNIE Lite 和轻量模型 ERNIE Tiny 持续免费;

    针对 OpenAI 迁移用户额外赠送与 OpenAI 使用规模对等的 ERNIE3.5 旗舰模型 Tokens 包。

  • 0 元训练:免费模型精调训练服务

  • 0 元迁移:零成本 SDK 迁移工具

  • 0 元服务:专家服务(迁移 &使用指导)

 

不过,百度智能云表示,以上优惠活动均在 2024 年 7 月 25 日 24 点前适用。


不到半小时后,阿里云紧接着宣布,将为 OpenAI API 用户提供最具性价比的中国大模型替代方案,并为中国开发者提供 2200 万免费 tokens 和专属迁移服务。据悉,通义千问主力模型Qwen-plus 在阿里云百炼上的调用价格为 0.004 元/千 tokens,仅为 GPT-4 的 50 分之一。根据斯坦福最新公布的大模型测评榜单 HELM MMLU,Qwen2-72B 得分为 0.824,与 GPT-4 并列全球第四。

 


随后在当天六点 20 分左右,零一万物宣布发起了“Yi API 二折平替计划”,面向 OpenAI 用户推出了平滑迁移至 Yi 系列大模型的服务,并针对接入 OpenAI 的不同模型的用户,一一对应地提供了高模型性能且极具性价比的替换方案。

 


据介绍,目前注册使用 Yi API 的新客户,零一万物立即赠送 100 元额度;平台充值还将赠送 50% 到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受 RPM/TPM 限速直升 Tier3,直达高级别的服务质量和超快响应速度。此外,零一万物 API 还将提供 Prompt 兼容调优服务支持,陪伴用户适配 Yi 系列大模型。

 

零一万物表示,在模型性能相近的同时,Yi-Large 的定价远低于顶配模型 GPT-4o。以 GPT-4o 的定价计算(取 Input 和 Output 均值为 Open API 价格),接入 Yi-Large 后使用成本可下降 72%;而对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上;对于简单任务的处理,Yi-Medium 的使用成本较 GPT-3.5-Turbo-1106 下降 66%。


此外,零一万物还可提供支持实时搜索的 Yi-Large-RAG,适用于需要结合实时信息进行推理的场景,以便用户基于自身需求选择更匹配的模型。

 

当日,AI Infra 厂商硅基流动则直接宣布开放 7 款大模型:SiliconCloud 平台的 Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等开源大模型免费使用。SiliconCloud 是集合主流开源大模型的一站式云服务平台,目前已上架包括 DeepSeek-Coder-V2、Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID 在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud 提供开箱即用的大模型推理加速服务。



当天晚 8 点左右,腾讯云宣布,即日起,新迁移企业用户可免费获得腾讯混元大模型 1 亿 Tokens。目前,腾讯云提供混元 Pro、Standard、Lite 等多个不同版本和尺寸的模型,用户可任意选择。腾讯还将为新迁移企业用户提供免费专属迁移工具和服务,该福利截止 7 月 31 日 24 点前。

 

今日凌晨,百川智能也跟进宣布了“零成本迁移”的措施:免费赠送 1 千万 token、Assistants API 免费使用。另外,百川开设了专家技术群,表示专家随时答疑,五分钟即可完成 API 迁移。


据悉,百川智能前不久刚发布最新一代基座大模型 Baichuan 4,并推出成立之后的首款 AI 助手“百小应”。Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14%和 9%。


一时的机会,更卷的将来


中美之间日益紧张的关系可能是促使 OpenAI 决定打击不受支持的用户的一个因素。自特朗普执政以来,美国已经对中国实施了制裁和关税,包括拜登总统增加对中国芯片、电池和电动汽车的关税。

 

为此,中国也加大了实现技术自给自足的力度,规定其电信公司在 2027 年前停止使用英特尔和 AMD 的 CPU,并要求其汽车制造商在 2025 年前至少在国内采购四分之一的计算机处理器。

 

尽管 OpenAI 正计划阻止在中国的 API 访问,但这对中国公司来说,无疑是一个迅速填补即将到来的市场空白以获得更多用户的好机会。不过,之后国内其他厂商是否会跟进,目前尚不能确定。

 

有专家预测,OpenAI 主动“送生意”的做法,给了国内的大模型厂商喘气的机会,但后续可能就得被迫继续卷价格。这意味着,已经有些降温的“大模型价格战”或将再次“火热”。可以看出,国内大模型行业在机遇重重的同时,竞争也将进一步加剧。

 

正如百川智能 CEO 王小川所说,“我们不需要一千、一万个大模型,在没有价格战的时候,中国可能真的是上百、上千个大模型在进行。”

 

同时,有不少网友纷纷议论:部分国产大模型是否会因 OpenAI 的断服“现原形”。国产大模型中是否存在调用 OpenAI  API 的这一问题暂且不论,目前根据各类大模型用户在公开平台发表的使用反馈来看,许多国产大模型的中文文本上处理能力并不弱于 ChatGPT ,在视频、图片等多模态方面有所不足,但整体来说影响有限。


不可否认的是,对于国内一批使用 OpenAI  API 的开发者来说,影响是巨大的。还有人士对国内用户发出了“谨慎付费”的友善提醒,一些通过调用海外大模型 API 接口来提供服务的套壳网站,之后可能因高昂的站点迁移成本关停跑路。


此外,OpenAI 强制执行其不支持国家列表的访问政策,在对中国开发者产生负面影响的同时,也可能带来其他方面的双向后果。

 

根据 Reddit 上的一篇帖子,总部位于美国的云平台公司 Vercel 的用户如果通过 Vercel 的边缘网络访问 OpenAI,也会收到同样的 OpenAI 邮件。目前还不清楚这封电子邮件是否发送有误,但 Vercel 的边缘网络确实有一个位于香港的区域,与中国大陆一样不受 OpenAI 支持。

2024-06-26 14:337629

评论

发布
暂无评论
发现更多内容

Gartner:如何在中国成功应用多云模式

BeeWorks

理论+案例,带你掌握Angular依赖注入模式的应用

华为云开发者联盟

程序员 前端 华为云

墨天轮访谈 | IvorySQL王志斌—IvorySQL,一个基于PostgreSQL的兼容Oracle的开源数据库

墨天轮

数据库 oracle postgresql 开源

基于微信小程序的婚纱影楼小程序开发笔记

CC同学

小程序

SaaS 云工具,产业互联网下的变革利器

小炮

NLP 论文领读|改善意图识别的语义表示:有监督预训练中的各向同性正则化方法

澜舟孟子开源社区

人工智能 自然语言处理 深度学习 预训练模型

零信任安全模型-下一代网络安全架构

领创集团Advance Intelligence Group

架构 网络安全 零信任

JDK动态代理为什么必须要基于接口?

码农参上

JAVA开发 动态代理 底层知识

你了解shiro吗?手把手教你集成shiro

阿Q说代码

springboot 鉴权 shiro 身份验证

基于 ShardingSphere 的得物数据库中间件平台“彩虹桥”演进之路

SphereEx

数据库 中间件 ShardingSphere 实践

力扣每日一练之字符串Day6

京与旧铺

6月月更

vue快速学习、基础用法

开发微hkkf5566

Go语言Redis API基本功能实践

FunTester

数字经济时代文化消费新特征

CECBC

深入理解和把握数字经济的基本特征

CECBC

FastApi+Vue+LayUI实现前后端分离

Python研究所

6月月更

2023年广州美博会时间地点详情

Geek_0b38bb

美博会 2023年广州美博会 春季广州美博会 广州春季美博会

中国移动应用出海发展天地宽

BeeWorks

观测云更新|观测云帮助文档全新上线;新增 Profile 可观测新增 Profile 可观测;新增 Deployment 网络详情及网络分布等

观测云

泛型的类型擦除后,fastjson反序列化时如何还原?

码农参上

泛型 底层知识 Java 开发

解读2022年度敏捷教练行业现状报告

华为云开发者联盟

后端 开发 华为云

盘点四种WiFi加密标准:WEP、WPA、WPA2、WPA3

wljslmz

wifi 6月月更 无线安全 wpa3 wep

区块链为化解信任危机带来新契机

CECBC

ElasticSearch第二弹之分片原理

阿Q说代码

ES shard replica

20省市公布元宇宙路线图

CECBC

SAVE: 软件分析验证和测试平台

华为云开发者联盟

云计算 测试 后端 开发 软件分析

JDBC 在性能测试中的应用

阿里巴巴云原生

阿里云 云原生 JDBC 压测

Java基础:集合框架之Map

百思不得小赵

map Java’ 6月月更

港股多支个股表现活跃,引发投资者对港股市场回暖猜想与关注

E科讯

如何实现一套容器(C语言版)1

祖维

c 容器 泛型 迭代器

如何利用数仓创建时序表

华为云开发者联盟

数据库 后端 华为云 时序表

没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!_生成式 AI_华卫_InfoQ精选文章