写点什么

阿里通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens

  • 2024-05-21
    北京
  • 本文字数:1268 字

    阅读完需:约 4 分钟

大小:680.74K时长:03:52
阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens

5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400,击穿全球底价。


 

Qwen-Long 是通义千问的长文本增强版模型,性能对标 GPT-4,上下文长度最高达 1 千万。除了输入价格降至 0.0005 元/千 tokens,Qwen-Long 输出价格也直降 90%至 0.002 元/千 tokens。

 

相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。

 

 

通义千问本次降价共覆盖 9 款商业化及开源系列模型:

 

  • 通义千问商业化模型:Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max;

  • 通义千问开源模型:Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。


其中,不久前发布的通义千问旗舰款大模型 Qwen-Max,API 输入价格降至 0.04 元/千 tokens,降幅达 67%。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo,并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

 

 

业界普遍认为,随着大模型性能逐渐提升,AI 应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

 

“公共云+API”企业大模型主流应用方式

 

在武汉 AI 智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

 

刘伟光认为,不管是开源模型还是商业化模型,公共云+API 将成为企业使用大模型的主流方式。

 

首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。

 

刘伟光介绍,阿里云可以从模型自身和 AI 基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

 

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

 

其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。

 

刘伟光表示,阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

 

最后,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。

 

刘伟光表示,阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

 

2024-05-21 14:184996

评论

发布
暂无评论
发现更多内容

[Day32]-[二叉树]二叉树中的最大路径和

方勇(gopher)

LeetCode 二叉树 数据结构和算法

nginx配置系列(三)日志配置

乌龟哥哥

4月月更

在 ABAP 技术栈里实施 Continuous Integration 的一些挑战

汪子熙

DevOps 持续集成 abap 5月月更 持续优化

阿里架构师耗时 176 天整理出来的 Java 独家面试题(10 万字面试总结)

Java架构追梦

程序员 java面试 后端开发

C++类设计和实现的十大最佳实践

俞凡

c++ 最佳实践

2020年底跳槽面试5家大厂,最后收获拼多多Java岗offer,分享三面总结!

爱好编程进阶

Java 程序员 后端开发

4000字,详解Python操作MySQL数据库

爱好编程进阶

程序员 后端开发

在线Excel转JSON工具

入门小站

工具

2020最新版Java学习路线图--妈妈再也不用担心我误删数据库被开除了

爱好编程进阶

Java 程序员 后端开发

2020面试官会经常问到的三个并发工具类,你都知道吗?

爱好编程进阶

程序员 后端开发

2021最强面试笔记非它莫属:3000字Java面试核心手册(大厂必备

爱好编程进阶

Java 程序员 后端开发

2021金三银四必备:“基础-中级-高级

爱好编程进阶

Java 程序员 后端开发

7点建议助您写出优雅的Java代码

爱好编程进阶

Java 程序员 后端开发

架构训练 模块4作业

小马

「架构实战营」

11-SpringSecurity:Session共享

爱好编程进阶

Java 程序员 后端开发

手撕阿里 Spring 框架:AOP、IOC、注解、事务,带你统统拿下

Java架构追梦

Java spring 程序员

pinpoint插件开发之二:从零开始新建一个插件

程序员欣宸

Java 分布式 4月月更

GitOps指南

俞凡

DevOps gitops

2021最新分享字节四面成功拿Offer!

爱好编程进阶

Java 程序员 后端开发

32 岁的我裸辞了,八年 Java 老鸟,只因薪水被应届生倒挂

爱好编程进阶

Java 程序员 后端开发

7-52 两个有序链表序列的交集 (20 分)(思路加详解尾插法)come Boby!

爱好编程进阶

程序员 后端开发

linux之秘钥登录

入门小站

Linux

关于人才的招聘的一些看法(31/100)

hackstoic

团队管理 招聘

架构实战营作业四

库尔斯

#架构实战营

Java 从一个 List 中删除 null 元素

HoneyMoose

网站开发进阶(一)Tomcat域名或IP地址访问配置详解

No Silver Bullet

tomcat 网站建设 5月月更

2021年九月最新Java面试必背八股文,338道最新大厂架构面试题

爱好编程进阶

Java 程序员 后端开发

2021最新一次Java面试,快手三面一轮游,如今已拿意向书

爱好编程进阶

Java 程序员 后端开发

高精度在线计时器(秒表)

入门小站

工具

Gitea 的简单介绍

HoneyMoose

决战摸鱼之巅:将vscode撸成可局域网联机对战的moba平台

gamedilong

前端 vscode nodejs Node 摸鱼

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens_AI&大模型_褚杏娟_InfoQ精选文章