写点什么

科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

  • 2025-01-15
    北京
  • 本文字数:2309 字

    阅读完需:约 8 分钟

大小:1.17M时长:06:49
科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗

1 月 15 日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火 X1。据讯飞测试,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

 

同时,讯飞星火 4.0 Turbo 底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于 5 秒。

 

首个基于全国产算力的推理大模型

 

讯飞星火一直走全国产化路线。科大讯飞与华为合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火 X1。 

 

发布演示中,讯飞星火 X1 不仅准确给出了高考题、AIME 竞赛题以及高中奥赛题题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

 

讯飞星火 X1 展现出了深度推理模型的三大典型特征:化繁为简,运用长思维链分步骤解析能力,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

 

 

根据介绍,目前讯飞星火 X1 率先在教育等真实场景中实现了应用落地。去年 1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。星火 X1 现已经部署上述试点区域。随着讯飞星火 X1 相关技术的深度融入,科大讯飞 AI 学习机也将持续升级。

 

医疗领域,讯飞星火 X1 的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达 90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火 X1 的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

 

讯飞星火 4.0 Turbo 底座能力再升级,变得更懂行业

 

此次发布会,讯飞星火 4.0 Turbo 底座能力实现了全新升级,七大核心能力全面提升,全面对标 OpenAI 最新版的 GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。


 

据介绍,此次基于讯飞星火 X1 的高质量合成数据,讯飞星火 4.0 Turbo 的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

 

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况。为此,讯飞星火 4.0 Turbo 图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了 40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了 60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试显示,讯飞星火 4.0 Turbo 的图文识别能力显著领先国内外顶尖竞品。

 

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了 10 倍以上。对于一份 500 页的项目文件,从扫描、识别到解析的全过程,仅需 2 分钟即可全部完成。 

 

大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了 40%,句子级溯源效果更是超越了 GPT-4o,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

 

考虑到不少用户在写报告、做调研这类工作时,往往需要花费大量时间搜集信息、整理资料,基于图文、长文本能力的提升和行业应用能力的积累,讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

 

 

首发星火语音同传大模型

 

发布会上,科大讯飞带来了在智能翻译领域又一突破:针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

 

“现在大模型能力的发展,结合讯飞在智能语音技术上的独特算法积累,可以做端到端的语音同传。”据了解,该模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。

 

 

根据讯飞的技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅 5 秒的同传时延,达到人类专家译员的水平。

 

另外,除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,使得科大讯飞全系产品的翻译能力都得到显著提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,为各种国际交流场景提供高质量翻译服务。 

 

发布会最后,科大讯飞透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在 2025 年推出商务套装,满足用户在不同的商务洽谈场景的使用需求。

 

2025-01-15 18:169514

评论

发布
暂无评论

架构师训练营—第九周作业

Geek_shu1988

【喜讯】Apache DolphinScheduler 荣获 “2020 年度十大开源新锐项目”

代立冬

Apache 大数据 开源 DolphinScheduler Apache DolphinScheduler

架构师训练营第二期 Week 5 作业

bigxiang

极客大学架构师训练营

架构师训练营第二期 Week 5 总结

bigxiang

极客大学架构师训练营

我的亲历:一行代码,百万人民币打水漂

白色蜗牛

Java 程序员 架构 程序人生 职场

【架构师训练营第 1 期 09 周】 作业

Bear

极客大学架构师训练营

架构师训练营第 9 周课后练习

叶纪想

极客大学架构师训练营

应届秋招生,熬夜吃透华为架构师这份‘典藏级’计算机网络+计算机操作系统,成功上岸腾讯

网络协议 编程之路 计算机知识

架构师训练营 - 第九周作业

一个节点

极客大学架构师训练营

架构师训练营 - 第九周总结

一个节点

极客大学架构师训练营

架构师训练营 week5 课后作业

花果山

极客大学架构师训练营

第五周总结

孤星

架构师训练营第九周课程笔记及心得

Airs

【架构师训练营】第九周作业:性能优化

MindController

秒杀系统

【架构师训练营第 1 期 09 周】 学习总结

Bear

极客大学架构师训练营

Java 中常见的细粒度锁实现

rookiedev

Java 多线程 细粒度锁

一次用户故事拆(SPIDR)法实践

Bruce Talk

Agile 用户故事 User Story

Week5 作业1

Sean Chen

架构师训练营第 9 周作业

netspecial

极客大学架构师训练营

真零基础Python开发web

MySQL从删库到跑路

Python django Web bottle

架构师训练营—第九周学习总结

Geek_shu1988

架构师训练营第 9 周学习总结

netspecial

极客大学架构师训练营

架构师训练营 week5 学习总结

花果山

极客大学架构师训练营

5G+工业互联网的中国登山队,如何攀跃“产业化”山峦?

脑极体

技术选型总结一

Mars

技术选型

架构师训练营 1 期第 9 周:性能优化(三)- 总结

piercebn

极客大学架构师训练营

JVM垃圾回收原理,秒杀系统架构方案

garlic

极客大学架构师训练营

秒杀系统

橘子皮嚼着不脆

InfoQ 写作平台的魔力

Yolanda

二分法求平方根,swift面向协议编程protocol从入门到精通、《格局》吴军著读后感、John 易筋 ARTS 打卡 Week 27

John(易筋)

collection ARTS 打卡计划 格局 吴军 李嘉图定律 面向协议protocol编程

能源区块链研究|区块链与核电安全

CECBC

区块链 核电

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗_AI&大模型_褚杏娟_InfoQ精选文章