「一场值回票价的演讲」将重现QCon? 了解详情
写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:291

评论

发布
暂无评论

恒源云(Gpushare)_模块化oss数据上传小技巧

恒源云

深度学习 GPU服务器

精巧的Boyer-Moore投票算法

皓月

算法

网络安全之内核提权漏洞深入分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

关于一家企业的成长性评价,其评价维度都有哪些?

企评家

企业 分析 成长性 评价 企业成长性分析

编程好习惯

源字节1号

软件开发

多方安全计算(MPC)发展脉络及应用实践

洞见科技

数据安全 隐私计算 多方安全计算 密码学和算法

虎符Hoo即将上线现货网格交易功能

区块链前沿News

虎符交易所

聚焦新基建,企业如何实现供应链管理再升级?

数商云

产业互联网 新基建 供应链

受信通院之邀出席全球信息系统稳定性峰会,数列技术实力再获认可

TakinTalks稳定性社区

架构训练营模块九作业

Geek_16d2b8

架构训练营

云原生时代的搜索服务算力管理

百度Geek说

架构 云原生 后端

nginx配置系列(一)nginx配置语法解读

乌龟哥哥

4月月更

被裁后半月面试8家公司无果,凭借这份Java面试指南成功入职阿里

Java全栈架构师

程序员 JVM 高并发 架构师 java面试

【今晚19点】关于论文复现赛,你想知道的都在这里啦!

OpenI启智社区

PaddlePaddle 论文复现

宜搭小技巧|巧用审批按钮,流程随心流转

一只大光圈

低代码 数字化 钉钉宜搭

架构训练营毕业总结

Geek_16d2b8

架构训练营

数据库管理系统的未来是什么?

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

张文骁:游戏开发的“零件人”梦碎之后|OneFlow U

OneFlow

与多家机构战略合作,背后彰显PlatoFarm元宇宙龙头的实力

BlockChain先知

区块链合约安全系列(一)公链合约权限校验引发的严重安全问题

BSN研习社

区块链

自动化,怎么能少了性能测试

SoFlu软件机器人

利器解读!Linux 内核调测中最最让开发者头疼的 bug 有解了|龙蜥技术

OpenAnolis小助手

开源 内存 技术分享 内核 龙蜥大讲堂

如何用 Serverless 低成本打造个人专属网盘?

阿里巴巴云原生

阿里云 Serverless 云原生 网盘 低成本

堪称完美的SQL调优笔记居然是百万年薪阿里P8大佬熬肝纯手打,内容简直太香

Java架构追梦

Java 程序员 java面试 后端开发

2022年短视频电商品牌营销专题—手机品牌抖音营销分析报告

Geek_2d6073

腾讯云百万容器镜像安全治理运营实践

腾讯安全云鼎实验室

安全服务

易观分析发布:证券类APP用户体验指数评测框架

易观分析

证券app

阿里云EMAS旗下低代码平台Mobi开放定向内测

移动研发平台EMAS

阿里云 低代码 公有云 研发工具 全端

企业团队协同软件,SaaS模式产品快速增长

小炮

SaaS 企业团队协同

Java面试题库答案(技术+人事)

Java架构追梦

Java java面试 后端开发 程序员面试、

企评家|上海星光电影股份有限公司成长性报告简述文章

企评家

大数据 企业 企业评价 企业大数据 企业成长性

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章