AI 年度盘点与2025发展趋势展望,50+案例解析亮相AICon 了解详情
写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:296444

评论

发布
暂无评论

将 Spring 微服务与 BI 工具集成:最佳实践

互联网工科生

spring 微服务 BI 分析工具

科创人·蓝凌董事长杨健伟:夯实“四梁八柱”,让数字化“城中村上建高楼”

科创人

数字化转型 企业家精神

EndNote 21更新 最新EndNote 21mac破解版下载 支持MacOS14

iMac小白

Util应用框架基础(七)- Redis 缓存

何镇汐

开源 后端 .net core

影视行业如何远程完整快速传输大文件?

镭速

传输大文件

Util应用框架基础(七)- 二级缓存

何镇汐

开源 后端 .net core

如何将Docker的构建时间减少40%

高端章鱼哥

Docker 镜像

加速CI构建,实现高效流水线——CloudBees CI发布工作区缓存功能

龙智—DevSecOps解决方案

ci

JProfiler 14 for Mac(Java开发分析工具) 14.0激活版

iMac小白

mac电脑音乐创作软件Ableton Live Suite 11中文破解版下载

iMac小白

MatrixOne实战系列回顾 | 导入导出项目场景实践

MatrixOrigin

分布式数据库 云原生数据库 MatrixOrigin MatrixOne 超融合数据库

企业软件定制开发的重点是什么?|app小程序网站建设

Geek_16d138

APP开发 软件定制

IBM SPSS Statistics mac激活破解版下载

iMac小白

Past for mac好用的苹果电脑剪切板工具下载

iMac小白

AI,正在「整顿」企业面试

用友BIP

软件测试/人工智能丨视觉与图像识别在自动化测试领域的应用

测试人

人工智能 软件测试

企业app软件定制开发的重点是什么?|小程序网站搭建

Geek_16d138

网站建设 小程序开发 app定制开发

区块链开发公司

区块链技术

Util应用框架基础(七)- 缓存

何镇汐

开源 后端 .net core

Permute 3 for mac(音视频转换器) 3.11.2中文版

iMac小白

矢量图形编辑软件Sketch for mac完美破解版下载

iMac小白

Util应用框架基础(七)- 本地缓存

何镇汐

开源 后端 .net core

什么是Mock?为什么要使用Mock呢?

我爱娃哈哈😍

Mock Mock 服务 mock设计

关联规则挖掘:Apriori算法的深度探讨

不在线第一只蜗牛

Python 大数据 算法

模块一作业

闻明杨

架构实战营

Logic Pro X for Mac v10.8.0中文直装版下载

iMac小白

3D建模工具Archicad 26 完美激活版下载

iMac小白

手把手入门MO | 如何使用SeaTunnel将数据写入MatrixOne

MatrixOrigin

分布式数据库 云原生数据库 MatrixOrigin MatrixOne 超融合数据库

KeyShot 2023.3 Pro for mac激活版下载(3D渲染和动画制作软件)

iMac小白

报名仅剩一周!课程直播和1V1指导助力文心一言插件开发赛事冲榜

飞桨PaddlePaddle

插件开发 文心一言 开发者插件

Camunda、Activiti、Flowable等各大工作流对比选择

小狗围观科幻

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章