HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

阿里通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens

  • 2024-05-21
    北京
  • 本文字数:1268 字

    阅读完需:约 4 分钟

大小:680.74K时长:03:52
阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens

5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400,击穿全球底价。


 

Qwen-Long 是通义千问的长文本增强版模型,性能对标 GPT-4,上下文长度最高达 1 千万。除了输入价格降至 0.0005 元/千 tokens,Qwen-Long 输出价格也直降 90%至 0.002 元/千 tokens。

 

相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。

 

 

通义千问本次降价共覆盖 9 款商业化及开源系列模型:

 

  • 通义千问商业化模型:Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max;

  • 通义千问开源模型:Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。


其中,不久前发布的通义千问旗舰款大模型 Qwen-Max,API 输入价格降至 0.04 元/千 tokens,降幅达 67%。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo,并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

 

 

业界普遍认为,随着大模型性能逐渐提升,AI 应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

 

“公共云+API”企业大模型主流应用方式

 

在武汉 AI 智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

 

刘伟光认为,不管是开源模型还是商业化模型,公共云+API 将成为企业使用大模型的主流方式。

 

首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。

 

刘伟光介绍,阿里云可以从模型自身和 AI 基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

 

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

 

其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。

 

刘伟光表示,阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

 

最后,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。

 

刘伟光表示,阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

 

2024-05-21 14:184477

评论

发布
暂无评论

互联网大厂100道Android面试题助你冲关金三银四!附小技巧

欢喜学安卓

android 程序员 面试 移动开发

单线程、多线程和协程的爬虫性能对比

小小明

Python 爬虫

MySQL锁等待与死锁问题分析

Simon

MySQL 死锁

iOS 面试策略之简历的准备到面试流程

iOSer

ios 面试

nginx配置日志为json格式,nginx按照天实现日志分割,nginx配置负载均衡

Ng

KeyChrone-K8使用体验

ITCamel

批量从Word中提取图片

小小明

Python

Android内存泄漏检测之LeakCanary2.0(Kotlin版)的实现原理

vivo互联网技术

android kotlin 内存泄漏

Hello World !!!

潮湿了我押韵的心情

程序员:如何写出斗帝级简历?

Java架构师迁哥

美团3面(Java后台):NIO+BIO+Zookeeper+线程池+Redis+kafka

钟奕礼

Java 编程 程序员 架构 面试

使用VUE和Element 创建一个dialog对话框组件的详细过程

尔嵘

Java岗位阿里+字节+滴滴+美团+腾讯+百度+京东12万字面试题总结

Java架构追梦

Java 阿里巴巴 架构 腾讯 面试

关于 JavaScript 闭包

程序员海军

JavaScript 大前端 闭包

高并发下的Redis分布式锁

java_wxid

Java redis 高并发 分布式锁 setnx

CloudQuery v1.3.5 上线!

BinTools图尔兹

数据库 oracle 运维 开发工具 dba

用户需求差异化需要更专业的云管理平台 | 演讲实录

BoCloud博云

云计算 多云管理

vue+element中引入百度地图

尔嵘

Vue Element 百度地图

Pandas实战案例-冷空气活动寒潮级别分类

小小明

试着找一下抖音下单的用户路径地图

小匚

产品经理 产品经理训练营

AI技术在小程序生态质量保障方向的落地实践

百度Geek说

小程序 AI

HashMap加载因子为什么是0.75?

java_wxid

Java 面试 hashmap HashMap底层原理 加载因子

将word试卷匹配转换为结构化表格

小小明

Python word

APK反编译

行者AI

编译

最火前端Web组态软件(可视化)

尔嵘

大前端 可视化数据分析搭建 web组态 托拉拽组态

剖析Android开发未来的出路在哪里,终局之战

欢喜学安卓

android 程序员 面试 移动开发

MySQL四大属性(特性) 底层实现原理

java_wxid

Java MySQL 数据库 面试 底层实现原理

Python实现excel公式格式化工具

小小明

Python Excel

产品经理训练营 - 作业六

胡小湖

AI技术在小程序生态质量保障方向的落地实践

百度开发者中心

百度智能小程序

图解 | 原来这就是 IO 多路复用

Java 程序员 架构 面试

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens_AI&大模型_褚杏娟_InfoQ精选文章