写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:296803

评论

发布
暂无评论
发现更多内容

2020 恒生 LIGHT 开发者大会,早鸟票限时开售

DT极客

(1)skyent VMware Workstation Pro下载与安装

休比

社区活动 | Apache Flink Meetup·深圳站,锁定 Flink 最佳实践

Apache Flink

flink

苹果A系列芯片的三年AI进化:为何要大规模升级AI算力?

脑极体

2020年“有史以来”全网最全1309道BAT大厂java面试题(附答案分享)

数据库 程序员 面试 Java 分布式

加强顶层设计 推动数字出版高质量发展

CECBC

区块链 数字经济 数字出版

高并发优雅的做限流

架构师修行之路

限流算法 高并发优化

坚持新媒体写作第21天了,聊聊我为什么喜欢写作

老胡爱分享

学习 写作 习惯养成 坚持 随笔杂谈 讨论写作

谈谈力软快速开发平台B/S专业报表工具

Philips

敏捷开发 开发工具

The Way To Go --- 切片

书旅

slice Go 语言

甲方日常 19

句子

工作 随笔杂谈 日常

穷人也能建个人博客了——阿里云函数计算体验

KAMI

阿里云 云服务 Faas WordPress

深耕边缘计算 揭秘阿里云边缘云网一体化的技术实践

阿里云Edge Plus

5G 边缘计算 视频

第十一周.总结

刘璐

flutter app 打开微信小程序探究

Daniel

开篇:开机界面设置欢迎语显示IP地址

程序饲养员

Linux __init__

阿里面试,让我说说ThreadLocal,我一口气说了四种

root

Java 多线程 ThreadLocal

LeetCode题解:144. 二叉树的前序遍历,递归,JavaScript,详细注释

Lee Chen

大前端 LeetCode

英特尔、阿里巴巴全方位深化技术创新 共同引领数智未来

E科讯

360视觉入局人脸识别:终结行业“裸奔”,“安全”是终极法则

脑极体

掌握这21个Java的核心技术点,涨薪5K起步,告别上班复制粘贴!!

Java架构师迁哥

亚马逊宣布20亿美元“气候宣言基金”首批投资企业名单

爱极客侠

虚拟币交易所搭建,数字货币永续合约平台搭建

拥抱K8S系列-08-命令行工具管理K8S集群1

张无忌

Kubernetes 运维 kubectl

第十二周.命题作业

刘璐

架构师第1课作业及学习总结

小诗

自己实现一个简单的 DevOps 工具系列(后端篇)- 1

sinsy

Shell CI/CD

小白读了这篇JVM,直呼真香!(长篇干货预警)

Java架构师迁哥

HashMap的7种循环姿势你都掌握了吗?

root

hashmap 循环效率 JDK1.8

第十三周.命题作业

刘璐

闪送,为何能从顺丰中杀出一条血路?

学习 编程 架构师

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章