写点什么

阿里通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens

  • 2024-05-21
    北京
  • 本文字数:1268 字

    阅读完需:约 4 分钟

大小:680.74K时长:03:52
阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens

5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400,击穿全球底价。


 

Qwen-Long 是通义千问的长文本增强版模型,性能对标 GPT-4,上下文长度最高达 1 千万。除了输入价格降至 0.0005 元/千 tokens,Qwen-Long 输出价格也直降 90%至 0.002 元/千 tokens。

 

相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。

 

 

通义千问本次降价共覆盖 9 款商业化及开源系列模型:

 

  • 通义千问商业化模型:Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max;

  • 通义千问开源模型:Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。


其中,不久前发布的通义千问旗舰款大模型 Qwen-Max,API 输入价格降至 0.04 元/千 tokens,降幅达 67%。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo,并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

 

 

业界普遍认为,随着大模型性能逐渐提升,AI 应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

 

“公共云+API”企业大模型主流应用方式

 

在武汉 AI 智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

 

刘伟光认为,不管是开源模型还是商业化模型,公共云+API 将成为企业使用大模型的主流方式。

 

首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。

 

刘伟光介绍,阿里云可以从模型自身和 AI 基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

 

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

 

其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。

 

刘伟光表示,阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

 

最后,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。

 

刘伟光表示,阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

 

2024-05-21 14:184640

评论

发布
暂无评论
发现更多内容

极客时间 - 架构师一期 - 第五周作业

_

极客大学架构师训练营 第五周

数字货币可能重构全球货币体系

CECBC

数字货币 金融

极客大学架构师训练营2期第一周 作业

渡江卿

世界上最难的5种编程语言

艾小仙

编程语言 编译 esolang

知识视频创作者何去何从,百度给出解答

脑极体

甲方日常 37

句子

工作 随笔杂谈 日常

食堂就餐卡系统设计

Jack

架构设计

《我想进大厂》之Dubbo普普通通9问

艾小仙

Java dubbo RPC HTTP

这本书可能是给用户最好的礼物——专栏《软件交付那些事儿》上线

刘华Kenneth

惠普中国(HPE)技术总监教你如何做个“火影般”的“架构师”

Java架构师迁哥

Java 程序员 架构

化身“监工”的AI,我们该如何相处?

脑极体

科大讯飞开发者大赛:首届X光安检图像识别挑战赛结果出炉

Talk A.I.

架构师训练营第一周总结

小兵

架构师训练营 - 第一周学习总结

joshuamai

区块链技术本质再认知

CECBC

区块链 大数据

政府和企业如何认识到区块链的好处

CECBC

比特币 区块链

架构师训练营第一周学习总结

韩儿

前端更应懂产品

执鸢者

产品 腾讯 大前端

成为架构师 - 架构师训练营第01周

陈永龙Vincent

笔记本中的“全优生”,英特尔Evo产品上市首日秒光!

E科讯

架构师训练营第一期 - 第五周课后 - 作业二

极客大学架构师训练营

架构训练营第一周学习总结

Jack

食堂就餐系统UML图

小兵

1分钟带你入门 React SCU、memo、pureCom

Leo

react.js 大前端 React

第一周学习总结

Griffenliu

c++nullptr(空指针常量)、constexpr(常量表达式)

良知犹存

c++

《我想进大厂》之JVM夺命连环10问

艾小仙

Java 编程语言 JVM jvm调优

什么! 你还在使用 if (xxx != null)做NullPointerException判断?

刘超

Java Optional

架构师训练营第 1 期第五周总结

Leo乐

极客大学架构师训练营

架构师训练营第一期 - 第周五课后 - 作业一

极客大学架构师训练营

第五周总结

_

架构师一期 架构师第五周总结

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens_AI&大模型_褚杏娟_InfoQ精选文章