写点什么

讯飞星火 4.0 Turbo、超拟人数字人等 11 个首发,科大讯飞如何深入大模型国产化“无人区”

  • 2024-10-25
    北京
  • 本文字数:3852 字

    阅读完需:约 13 分钟

大小:1.98M时长:11:31
讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”

10 月 24 日,第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布最新的讯飞星火 4.0 Turbo:七大核心能力全面超过 GPT-4 Turbo,数学和代码能力超越 GPT-4o,国内外中英文 14 项主流测试集中讯飞星火 4.0 Turbo 实现 9 项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。

 

科大讯飞还首发了 10 项基于讯飞星火底座能力的硬核产品与创新应用:定义多模 AIUI 标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板 2.0、AI 作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人 VIAS 以及科大讯飞多语种 AI 翻译透明屏。

 大模型能力如何?

 

讯飞星火 4.0 Turbo,提效 50%

 

根据介绍,讯飞星火大模型 4.0 Turbo 在数学能力、代码能力上超过了 GPT-4o。由艾伦人工智能研究所、OpenAI 等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的 14 项主流测试集中,讯飞星火 4.0-Turbo 在其中 9 项测试集中实现超越,效率相对提升 50%。



刘庆峰特别提到了“硬碰硬”的数学能力和代码能力。

 

根据实用数学任务构建测试集 CAppliedMath-1.0,讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务中均超过 GPT-4o 水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。

 

而根据代码生成 HumanEval 测试集上的效果对比,讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上和 GPT-4o 的差距微弱,在 C++能力上超过 GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的 iFLYCode-Eval-2.0 代码实用场景测试集,讯飞星火 4.0 Turbo 在代码生成、代码检错、单元测试等任务上都超过了 GPT-4o。同时,讯飞推出了星火代码 7B 版本,满足代码生成、代码补全等极速响应型任务,效果业界最优。

 

首发语音视觉虚拟人交互“三合一”

 

发布会上,科大讯飞重新定义万物智联时代的多模 AIUI 交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。

 

超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。

 

多模态视觉能力加持下的人机交互有多惊喜?刘聪现场给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,无需拍照,超拟人数字人看图说话,马上回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽 ”,和刘聪畅聊不同角度的所见。

 

刘聪还演示了更实用的旅游购物场景,当摄像头转向印有外文的化妆品及酒类产品时,超拟人数字人能对画面中产品的品牌、功能等信息进行“秒回”,超拟人数字人已成为“跨语言”购物的好帮手。

 

“讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,已支持 1300+种人设打造。目前,超拟人数字人能力正式开通内测。

 

 

首发星火多语言大模型、汽车端侧星火大模型

 

在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。在多语言能力上,首次实现全国地级市方言全覆盖,含全国 288 个地市、202 种方言,讯飞输入法 14.0 即将支持 202 种方言免切换自由说。

 

在多语种能力上,科大讯飞首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等 8 个语种。根据实用任务场景构建测试集 MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了 GPT-4o。

 

刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,“我们一定要代表中国给世界第二种选择。”

 

多模态多语言能力升级,将全面赋能汽车产业。科大讯飞还首发了汽车端侧星火大模型,相比云端大模型,端侧 1.3B 大模型效果损失≤1%,端侧首响 40ms,端云融合交互低至 1.3s。据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。



首个国产万卡算力集群“飞星二号”平台上线

 

刘庆峰认为人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。刘庆峰说:“坚持这五个关键点,我们的人工智能就有大未来,就能真正的解放生产力、释放想象力。”

 

为此,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。去年 10 月 24 日,首个国产万卡算力集群“飞星一号”平台上线,星火大模型持续引领全国产算力平台发展,刘庆峰介绍一年以来攻克了很多‘疑难杂症’,解决了 500 多次以上的基础软硬件问题和模型适配问题。

 

此外,科大讯飞表示,讯飞星火大模型开发者规模达到了 78.1 万。科大讯飞还将牵头成立 AI 基金,用 5 亿创业基金推动开发者创业加速前沿技术产业化进程,并与地方政府联合为 AI 创业团队提供产业落地支撑。

大模型应用如何?

 

“用人工智能技术解决社会刚需”,此次 1024 科大讯飞全球开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。

 

在教育行业,科大讯飞首次发布基于“问题链”的高中数学智能教师系统。据悉,此次发布的高中数学智能教师系统,中国教科院牵头、北京、上海、重庆、深圳、合肥、成都、大连、广州、哈尔滨等 12 个区域 50 多位数学教研员、400 多位优秀教师与讯飞星火大模型人机共创的智慧成果。它可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,同时基于精准学情定位学生薄弱点、融合最近发展区规划路径、鼓励学生基于真实世界的主动提问、探究式学习,帮助学生实现知识、到能力、再到素养的综合培养。

 

搭载了高中数学智能教师系统的星火智慧黑板 2.0 也将于 10 月 25 日在第 84 届教育装备展上正式发布。另外,讯飞 AI 学习机中首发 AI 作业过滤器。

 

在医疗行业,讯飞星火医疗大模型 2.0 发布,医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成、医疗诊断治疗推荐、医疗多轮交互、医疗多模态交互等六大医疗核心场景能力重大升级。另外,基于讯飞星火医学影像大模型打造的智能医学影像助手也正式发布,在智能质控环节,可帮助影像技师快速评估图像质量,及时纠正检查问题;在智能诊断环节,可帮助影像医师快速生成诊断报告,解释溯源并多期对比;在智能读片环节,可接入医学影像大模型,通过相关问答,帮助临床医师制定诊疗方案。



会上,讯飞医疗还联合安徽省卫生健康委员会、认知智能全国重点实验室,共同发布全谱系全模态医学影像大模型开放合作计划,旨在汇聚全球最顶尖的影像 AI 科研团队,共同推进医学影像大模型的发展。

 

在司法领域,星火法律大模型赋能庭审笔录制作、裁判文书编写、法条类案检索等司法场景,和星火通用大模型相比,效率提升从 61.7%提升到 87.9%。

 

在政务服务场景,政务大模型持续迭代,全面覆盖 4500 多种标准化事项和 60 多种材料,老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,审核时间缩短 80%,登记效率提升 5 倍。此外,发布会上首发了搭载政务大模型的“星火智办一体机”,方便群众从“问着办”到“领着办”。

 

“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出了大模型应用成绩单:央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。截至 2024 年 10 月,科大讯飞已与各头部企业共建 20 多个行业大模型,覆盖 300+应用场景,所覆盖行业和场景数都是第一。

 

为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖 300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”刘庆峰说。

AI for Science 成为科技发展新引擎

 

今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了 AI 领域的科学家。刘庆峰表示,AI for Science 带来科研范式的根本变革,正在成为科技发展的新引擎。

 

刘庆峰介绍,星火科研助手自去年底发布以来,已在中科院下属 116 个院所使用。北京邮电大学 EZCoding 雏雁/大创团队基于讯飞星火大模型打造的编程教学应用平台“码上”,目前已在全国 332 所院校开通使用,学生主动提问率增加 1 倍,教师辅导工作减少 80%。

 

刘庆峰提到,人工智能赋能科研工作的三个台阶:依托科研文献助手和代码助手提升基础工作效率,基于深度神经网络对科学任务进行精准建模,以及借助认知大模型学习领域知识并辅助设计科研实验方案。

 

据悉,科大讯飞已在大模型+科研领域做了许多探索,如联合中国科学技术大学刘海燕教授团队,成功设计了 48 个自然界不存在的全新蛋白质;联合中科院动物研究所李鑫团队,研究单细胞基因表达课题;联合中科院等离子体物理研究所李建刚院士团队,研究托卡马克等离子体控制。此外,科大讯飞还联合中国科技大学研发“化学大模型”,联合中科院大连化学物理研究所研发“化工大模型”。

 

“AI for Science 决定了中国科技发展的速度,赋能科研是讯飞星火的重要使命”,刘庆峰说道。


2024-10-25 11:237755

评论

发布
暂无评论
发现更多内容

超强版干货投递!Milvus 的部署心得、运维秘籍都在这里了!

Zilliz

Milvus Zilliz ChatGPT LLM zillizcloud

CSS奇思妙想之-利用CSS裁剪(clip-path)完成各种图形

肥晨

三周年连更

百度智能云亮相CCBN 2023,共拓媒体数智化转型新征程

Geek_2d6073

云上数据变革:Databend Cloud 正式发布

Databend

即时通讯系统为什么选择GaussDB(for Redis)?

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

PCB生产工艺 | 第十三道主流程之包装

华秋电子

免费领取 | ONES 联合中国信通院发布《中国企业软件研发管理白皮书》

万事ONES

景区共享电单车如何投放?投放意义?

共享电单车厂家

共享电动车厂家 景区共享电单车 共享电单车投放

多元融合成为音视频技术发展新风向

中关村科金

实时音视频 监管合规

4 月 25 日直播预告 | 深入解读 Flink 1.17

Apache Flink

大数据 flink 实时计算

2023年全互联网最新版Java面试突击手册PDF版开源,押题率高达97%

开心学Java

Java 面试 java; 八股文 Java八股文

阿里大牛纯手写的微服务入门笔记,从基础到进阶直接封神

做梦都在改BUG

Java 微服务 spring cloud alibaba

连接 1 次孤岛,服务 N 个场景(报名中)

tapdata

DaaS

macOS下快速复制文件或文件夹路径的技巧

互联网搬砖工作者

【Linux】之创建普通用户并禁止root用户远程登陆

A-刘晨阳

Linux 三周年连更 用户名

Neuron 2.4.0发布:体验下一代工业物联网连接和管理

EMQ映云科技

UI 物联网 IoT neuron 企业号 4 月 PK 榜

面试官:Redis有什么持久化策略?

做梦都在改BUG

Java redis 缓存 面试 持久化

物联网常见协议之Amqp协议及使用场景解析

华为云开发者联盟

后端 物联网 华为云 华为云开发者联盟 企业号 4 月 PK 榜

谷歌 Chrome 正式发布 WebGPU!Orillusion开源倒计时!

Orillusion

开源 WebGL 元宇宙 web3d #WebGPU

GitHub星标48k!蚂蚁金服开源的这份SpringBoot笔记

做梦都在改BUG

Java spring Spring Boot 框架

微服务 - 注册中心和配置中心(Consul)

做梦都在改BUG

Java 微服务 注册中心 配置中心

即时通讯技术文集(第13期):Web端即时通讯技术精华合集 [共15篇]

JackJiang

网络编程 即时通讯 IM

从零到跑通TPC-H:如何快速实现查询计划

MatrixOrigin

分布式数据库 MatrixOrigin MatrixOne TPC-H

PCB阻焊桥存在的DFM(可制造性)问题,华秋一文告诉你

华秋电子

OneNote 2019 for Mac 中文版附激活工具

真大的脸盆

Mac Mac 软件 笔记应用

AIGC的阿克琉斯之踵

华为云开发者联盟

人工智能 AI 华为云 华为云开发者联盟 企业号 4 月 PK 榜

保险行业如何将质检覆盖率从5%提升至100%?

中关村科金

保险 智能质检

Viu联合华为HMS生态,共创影音娱乐新体验

HarmonyOS SDK

HMS Core

数据中台建设:千万级的瀑布式,和十万级的迭代式,你会选择哪一个?

tapdata

中台 服务化 Tapdata DaaS 现代数据栈

10万字干货:《数字业务连续性提升最佳实践》免费领取|TakinTalks社区

TakinTalks稳定性社区

讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”_AI&大模型_褚杏娟_InfoQ精选文章