AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

奇富科技推出智能语音模型 Qifusion,语音识别准确率可达 93% 以上

  • 2024-07-10
    北京
  • 本文字数:778 字

    阅读完需:约 3 分钟

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上

近日,奇富科技智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》(Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition)被全球语音与声学顶级会议 INTERSPEECH 2024 收录。



我国地域广阔,方言种类繁多,其语法和语音特征存在显著差异。同时,由于噪声的干扰、方言的混杂现象、主观感知在标注过程中的偏差,以及人力标注工作的复杂性和系统性不足,语音识别技术的准确性和智能化水平受到了一定程度的限制。


在金融服务领域,现有的通用语音识别技术在处理方言时往往难以达到理想的效果,不仅影响了人机交互的准确性和智能化水平,也对服务的效率和质量产生了负面影响。


奇富科技引入了全自研 Qifusion 框架模型,并将其集成到智能营销及贷后提醒等业务场景中。在应用上,Qifusion 框架模型能够提升智能营销、贷后提醒、风险控制业务应用场景识别准确率,帮助解决以上问题。并且在复杂的通话环境中,Qifusion 的语音识别准确率达到了 93%以上,意图识别准确率超过 95%。


  • 方言种类丰富:凭借丰富的数据样本,Qifusion 框架模型在原有东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话等国内八种主流方言的基础上,强化了四川、重庆、山东、河南、贵州、广东、吉林、辽宁、黑龙江等用户密集地区的方言识别能力。


  • 方言识别准确:Qifusion 框架模型具备自动识别不同口音的能力,并能在时间维度上对解码结果进行口音信息修正,使方言口音的语音识别误差率降低了 30%以上,整体语音识别字错率降低了 16%以上,提升了用户体验。


  • 方言识别高效:Qifusion 框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。



2024-07-10 11:083721

评论

发布
暂无评论
发现更多内容

Wave-2 802.11ac SoC for Routers, Gateways and Access Points//IPQ4019,IPQ4029,Wallys

wallys-wifi6

IPQ4019 ipq4029

十问分布式数据库:技术趋势、选型及标准思考

OceanBase 数据库

技术分享 | app自动化测试(Android)--显式等待机制

霍格沃兹测试开发学社

测试人生 | 疫情之下工资翻了2倍多,这4个月学习比工作8年学到的还多

霍格沃兹测试开发学社

还在为如何编写Web自动化测试用例而烦恼嘛?资深测试工程师手把手教你Selenium 测试用例编写

霍格沃兹测试开发学社

使用 Zpan 搭建低成本个人私有网盘,还不限速

华为云开发者联盟

云计算 华为云 网盘 企业号十月 PK 榜

笔记本电脑内卷之争:华硕4+4无忧保脱颖而出

极客天地

干货 | 接口自动化测试分层设计与实践总结

霍格沃兹测试开发学社

三方库移植之NAPI开发[1]—Hello OpenHarmony NAPI

离北况归

OpenHarmony

技术分享 | app自动化测试(Android)-- 属性获取与断言

霍格沃兹测试开发学社

技术分享 | app自动化测试(Android)-- 参数化用例

霍格沃兹测试开发学社

2022Q3消费级AR眼镜市场季度分析:国产品牌纷纷发力,市场全面启航

易观分析

科技 AR眼镜 季度报告

十大 CI/CD 安全风险(三)

SEAL安全

DevOps CI/CD DevSecOps 软件供应链安全

如何在 SAP BTP Java 应用里使用 SQLite 数据库

汪子熙

云原生 云平台 SAP 10月月更 btp

技术分享 | 常见接口协议解析

霍格沃兹测试开发学社

Jchardet——支持检测并输出文件编码方式的组件

OpenHarmony开发者

OpenHarmony

记录第二天-Vue起步

默默的成长

前端 Vue 3 10月月更

StampedLock:一个并发编程中非常重要的票据锁

华为云开发者联盟

高并发 开发 华为云 企业号十月PK榜

技术分享 | 接口测试价值与体系

霍格沃兹测试开发学社

技术分享 | 使用 cURL 发送请求

霍格沃兹测试开发学社

技术分享 | app自动化测试(Android)-- 特殊控件 Toast 识别

霍格沃兹测试开发学社

干货 | 测试专家(前阿里P8)聊测试职业发展常见瓶颈

霍格沃兹测试开发学社

秒验 运营商SDK错误码

MobTech袤博科技

sdk 运营商

Java基础(三)| switch、循环及Random详解

timerring

Java random Switch 循环 10月月更

6步搭建一个飞机大战游戏

华为云开发者联盟

云计算 软件开发 华为云 企业号十月PK榜

技术分享 | 抓包分析 TCP 协议

霍格沃兹测试开发学社

技术分享 | 接口测试常用代理工具

霍格沃兹测试开发学社

VUE 初学者基础知识

默默的成长

Vue 前端 10月月更

一个值得深思的话题:Wi-Fi 7的诞生会不会取代 5G 网络?

wljslmz

5G 无线技术 10月月更 WiFi7

技术分享 | app自动化测试(Android)-- Capability 使用进阶

霍格沃兹测试开发学社

技术分享 | 使用postman发送请求

霍格沃兹测试开发学社

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上_AI&大模型_赵明华_InfoQ精选文章