速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

奇富科技推出智能语音模型 Qifusion,语音识别准确率可达 93% 以上

  • 2024-07-10
    北京
  • 本文字数:778 字

    阅读完需:约 3 分钟

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上

近日,奇富科技智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》(Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition)被全球语音与声学顶级会议 INTERSPEECH 2024 收录。



我国地域广阔,方言种类繁多,其语法和语音特征存在显著差异。同时,由于噪声的干扰、方言的混杂现象、主观感知在标注过程中的偏差,以及人力标注工作的复杂性和系统性不足,语音识别技术的准确性和智能化水平受到了一定程度的限制。


在金融服务领域,现有的通用语音识别技术在处理方言时往往难以达到理想的效果,不仅影响了人机交互的准确性和智能化水平,也对服务的效率和质量产生了负面影响。


奇富科技引入了全自研 Qifusion 框架模型,并将其集成到智能营销及贷后提醒等业务场景中。在应用上,Qifusion 框架模型能够提升智能营销、贷后提醒、风险控制业务应用场景识别准确率,帮助解决以上问题。并且在复杂的通话环境中,Qifusion 的语音识别准确率达到了 93%以上,意图识别准确率超过 95%。


  • 方言种类丰富:凭借丰富的数据样本,Qifusion 框架模型在原有东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话等国内八种主流方言的基础上,强化了四川、重庆、山东、河南、贵州、广东、吉林、辽宁、黑龙江等用户密集地区的方言识别能力。


  • 方言识别准确:Qifusion 框架模型具备自动识别不同口音的能力,并能在时间维度上对解码结果进行口音信息修正,使方言口音的语音识别误差率降低了 30%以上,整体语音识别字错率降低了 16%以上,提升了用户体验。


  • 方言识别高效:Qifusion 框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。



2024-07-10 11:083564

评论

发布
暂无评论
发现更多内容

ETL中元数据处理的方式

RestCloud

数据处理 元数据 ETL 数据集成

淘宝/天猫按关键字搜索API:返回值详解,轻松获取商品信息

技术冰糖葫芦

api 货币化 API 接口 API 文档 API】 pinduoduo API

助力数智化转型:使用检索增强生成【RAG】构建物业行业大模型

智在碧得

深度学习算法 AI大语言模型 大语言模型 人工智能深度学习 #大模型

TapData + 实时数仓:实时数据如何赋能船舶制造业,助力数字化应用升级和科学管理运营

tapdata

大数据 实时数仓场景实践

开发备受欢迎的网络直播体育赛事平台,需要这些内容和功能

软件开发-梦幻运营部

EMQX Platform 产品发布会回顾:全球部署与无缝数据集成,驱动汽车行业智能化转型

EMQ映云科技

mqtt mqtt broker

Python 中删除文件夹下文件的方法详解

霍格沃兹测试开发学社

使用 Dockerfile 构建和定制 Docker 镜像

霍格沃兹测试开发学社

信创发展到现在技术上有什么关注重点

Onegun

信创 信创产业 信创化

如何通过代理服务器加速您的网站浏览体验

摘星星的猫

Flink 作业管理器:核心功能、角色与责任详解

木南曌

flink 实时计算

企业未来都会用上云原生开发工具吗?它有什么优势

Tp_jh

AI 云原生 K8s 多集群管理

企业规模扩大,SD-WAN实现跨省快速组网

Ogcloud

网络协议 网络加速 SD-WAN 企业组网 SD-WAN组网

淘宝/天猫API接口:轻松获取商品详情原数据

技术冰糖葫芦

​腾讯云异构计算平台全面支持Llama 3,助力一键部署、性能翻倍

Geek_2d6073

淘宝商品详情API接口:全面解析商品属性与数据

技术冰糖葫芦

api 货币化 API 接口 API 文档 API】 pinduoduo API

Python 字符串格式化指南

霍格沃兹测试开发学社

如何在 Windows 上安装 SQL Server,保姆级教程来了!

霍格沃兹测试开发学社

如何在 Windows 上安装 SQL Server,保姆级教程来了!

霍格沃兹测试开发学社

管理者如何在团队里讨论敏感话题

伤感汤姆布利柏

用海外云手机做tiktok怎样保障安全性?

Ogcloud

云手机 海外云手机 tiktok云手机 国外云手机 tiktok运营

CentOS 系统常用命令详解

霍格沃兹测试开发学社

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上_AI&大模型_赵明华_InfoQ精选文章