写点什么

科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

  • 2025-01-15
    北京
  • 本文字数:2309 字

    阅读完需:约 8 分钟

大小:1.17M时长:06:49
科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗

1 月 15 日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火 X1。据讯飞测试,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

 

同时,讯飞星火 4.0 Turbo 底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于 5 秒。

 

首个基于全国产算力的推理大模型

 

讯飞星火一直走全国产化路线。科大讯飞与华为合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火 X1。 

 

发布演示中,讯飞星火 X1 不仅准确给出了高考题、AIME 竞赛题以及高中奥赛题题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

 

讯飞星火 X1 展现出了深度推理模型的三大典型特征:化繁为简,运用长思维链分步骤解析能力,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

 

 

根据介绍,目前讯飞星火 X1 率先在教育等真实场景中实现了应用落地。去年 1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。星火 X1 现已经部署上述试点区域。随着讯飞星火 X1 相关技术的深度融入,科大讯飞 AI 学习机也将持续升级。

 

医疗领域,讯飞星火 X1 的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达 90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火 X1 的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

 

讯飞星火 4.0 Turbo 底座能力再升级,变得更懂行业

 

此次发布会,讯飞星火 4.0 Turbo 底座能力实现了全新升级,七大核心能力全面提升,全面对标 OpenAI 最新版的 GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。


 

据介绍,此次基于讯飞星火 X1 的高质量合成数据,讯飞星火 4.0 Turbo 的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

 

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况。为此,讯飞星火 4.0 Turbo 图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了 40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了 60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试显示,讯飞星火 4.0 Turbo 的图文识别能力显著领先国内外顶尖竞品。

 

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了 10 倍以上。对于一份 500 页的项目文件,从扫描、识别到解析的全过程,仅需 2 分钟即可全部完成。 

 

大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了 40%,句子级溯源效果更是超越了 GPT-4o,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

 

考虑到不少用户在写报告、做调研这类工作时,往往需要花费大量时间搜集信息、整理资料,基于图文、长文本能力的提升和行业应用能力的积累,讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

 

 

首发星火语音同传大模型

 

发布会上,科大讯飞带来了在智能翻译领域又一突破:针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

 

“现在大模型能力的发展,结合讯飞在智能语音技术上的独特算法积累,可以做端到端的语音同传。”据了解,该模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。

 

 

根据讯飞的技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅 5 秒的同传时延,达到人类专家译员的水平。

 

另外,除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,使得科大讯飞全系产品的翻译能力都得到显著提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,为各种国际交流场景提供高质量翻译服务。 

 

发布会最后,科大讯飞透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在 2025 年推出商务套装,满足用户在不同的商务洽谈场景的使用需求。

 

2025-01-15 18:169616

评论

发布
暂无评论

mysql存储引擎

急需上岸的小谢

9月月更

构筑校园防线  “云资环”助力精准防控

神奇视野

SD-WAN网络编排原理

阿泽🧸

9月月更 网络编排

2022-09-07:给你一个由正整数组成的数组 nums 。 数字序列的 最大公约数 定义为序列中所有整数的共有约数中的最大整数。 例如,序列 [4,6,16] 的最大公约数是 2 。 数组的一个

福大大架构师每日一题

算法 rust 福大大

Go vs Python,我该选哪一门语言?

宇宙之一粟

Python 编程语言 Go 语言 9月月更

程序员成长那些事儿

图灵教育

程序员 进阶 代码 计算机

关于C语言结构体(struct),你不知道的用法?(初阶篇)

Albert Edison

指针 C语言 结构体 9月月更

当代用电行为大赏:有人心疼电费,有人靠屋顶光伏“理财”

白洞计划

SpringBoot源码 | prepareEnvironment方法解析

六月的雨在InfoQ

源码 springboot 源码刨析 SpringBoot实战 9月月更

人工智能、机器学习和深度学习,到底有什么区别?

Finovy Cloud

人工智能 云计算 影视渲染

给我一起学jdbc之sql注入

楠羽

JDBC 笔记 9月月更

每日一R「22」内存:堆与栈

Samson

学习笔记 ​Rust 9月月更

概述大数据技术在智能运维中四大挑战

穿过生命散发芬芳

智能运维 9月月更

英特尔oneAPI工具大幅提升腾讯云数据库MySQL的性能

科技之家

「趣学前端」关于iframe跨域通信

叶一一

前端 iframe 跨域 9月月更

面试突击81:什么是跨域问题?如何解决?

王磊

Java 面试

如何让百度搜索结果显示网站 logo

源字节1号

网站建设 网站开发

纠删码在实时视频流中的应用丨Dev for Dev 专栏

声网

音视频 人工智能’

C++学习------clocale头文件的源码学习

桑榆

c++ 源码阅读 9月月更

极狐GitLab CI 月来袭!2小时 get CI 流水线设计秘籍

极狐GitLab

DevOps gitlab 运维 CI/CD 持续交付

【译】像CSS一样在Flutter里应用滤镜效果

iofod jude

SLO新解,一种行之有效的故障处理方法

华明

监控系统 SLO 稳定性保障

程序员成长那些事儿

图灵社区

程序员 进阶 代码 计算机

云备份服务CBR

创意时空

「趣学前端」来逛逛数字博物馆

叶一一

小程序 前端 9月月更

Unity 关于低版本是否可以引用高版本构建内容的可行性验证

CoderZ

C# dll Unity3D 9月月更

JAVA StreamAPI

流火

Stream API java 8 的新特性

一起玩转!SOFA 飞船 Layotto 星球登陆计划

SOFAStack

golang 微服务 云原生 新手指南 开源软件

一文讲透B端和C端产品经理的区别

产品海豚湾

产品经理 SaaS 职业发展 B端产品 9月月更

通过Jenkins构建CI/CD实现全链路灰度

阿里巴巴中间件

阿里云 云原生 jenkins 全链路灰度

2022年中国新能源汽车用户体验指数(UEI)

易观分析

新能源汽车 UEI

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗_AI&大模型_褚杏娟_InfoQ精选文章