写点什么

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

  • 2025-02-27
    北京
  • 本文字数:788 字

    阅读完需:约 3 分钟

大小:407.58K时长:02:19
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。


据悉,区别于 Deepseek R1、混元 T1 等需要“想一下再回复”的慢思考模型,混元 Turbo S 能够实现“秒回”,吐字速度提升一倍,首字时延降低 44%,另外,通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

 

在业界通用的多个公开 Benchmark 上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5 等业界领先模型的效果表现。

 



*表格中,其它模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台

 

据介绍,通过长短思维链融合,腾讯混元 Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进理科推理能力,实现模型整体效果提升。

 

架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。新的融合模式也突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题,一方面发挥了 Mamba 高效处理长序列的能力,也保留 Transformer 擅于捕捉复杂上下文的优势,构建了显存与计算效率双优的混合架构,这是工业界首次成功将 Mamba 架构无损地应用在超大型 MoE 模型上。

 

腾讯表示,作为旗舰模型,Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线。腾讯混元表示,正式版的腾讯混元 T1 模型 API 也将很快上线,对外提供接入服务。

 

当前,开发者和企业用户可以在腾讯云上通过 API 调用腾讯混元 Turbo S,即日起一周内免费试用。定价上,Turbo S 输入价格为 0.8 元/百万 tokens,输出价格为 2 元/百万 tokens,相比前代混元 Turbo 模型价格下降数倍。

 

2025-02-27 18:079883

评论

发布
暂无评论

第22期 | GPTSecurity周报

云起无垠

对话在行人|浙纺服职院:数智赋能教育高质量发展

用友BIP

2023全球商业创新大会 对话在行人

企业如何开展数据管理体系建设,激活数据价值?

用友BIP

数据 数据价值

HarmonyOS数据管理与应用数据持久化(一)

HarmonyOS开发者

手机是数字世界的另一个你,你的隐私还安全吗?

最新动态

Rust中non_exhaustive的enum

胡译胡说

rust

影视企业有哪些方式将视频文件快速海外跨国传输国内?

镭速

跨国文件传输

陈奕迅全新专辑《CHIN UP!》上线华为音乐,五年后心血之作强势来袭

最新动态

客服发送一条消息背后的技术和思考

得物技术

体验 IM 客服

桌面云一体机什么品牌最好?

青椒云云电脑

桌面云 一体机 桌面云一体机

数据库|PostGreSql 和 MySql 的优劣对比

谐云

陌生链接可能是诈骗网址,谁来保护我们的上网安全?

最新动态

单模光纤与多模光纤是什么呢?

小齐写代码

特权账号管理系统PAM的优势特点

尚思卓越

网络安全 数据安全 PAM

跨国文件传输为什么要用专业的大文件传输软件?

镭速

跨国文件传输

Python JSON 使用指南:解析和转换数据

小万哥

Python 程序员 软件 后端 开发

缺客户、缺钱、缺时间——实业经营的真挑战,中国企业分别突破

B Impact

华为Mate 60必备,这几个保护隐私的设置太实用了

最新动态

Java while 和do while 循环

HoneyMoose

还得是PHP

谐云

一座 “数智桥梁”,华为助力“天堑变通途”

脑极体

AI

Gartner发布2024年十大战略技术趋势

谐云

在线涂鸦画板软件哪款好?这7款涂鸦神器值得推荐!

彭宏豪95

效率工具 画图软件 在线白板 涂鸦 绘画软件

低代码可视化逻辑编排工具

树上有只程序猿

低代码 可视化编排 JNPF

高能有料 | 第二届OpenHarmony技术大会议程速递

OpenHarmony开发者

Ping和ARP流程解析

王玉川

router Switch ping ICMP ARP

Serverless,无服务器时代的创新之旅开启了吗

谐云

技术、前沿、未来、AI:Stack Overflow 2023 年度报告重磅发布

谐云

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线_AI&大模型_褚杏娟_InfoQ精选文章