写点什么

奇富科技推出智能语音模型 Qifusion,语音识别准确率可达 93% 以上

  • 2024-07-10
    北京
  • 本文字数:778 字

    阅读完需:约 3 分钟

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上

近日,奇富科技智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》(Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition)被全球语音与声学顶级会议 INTERSPEECH 2024 收录。



我国地域广阔,方言种类繁多,其语法和语音特征存在显著差异。同时,由于噪声的干扰、方言的混杂现象、主观感知在标注过程中的偏差,以及人力标注工作的复杂性和系统性不足,语音识别技术的准确性和智能化水平受到了一定程度的限制。


在金融服务领域,现有的通用语音识别技术在处理方言时往往难以达到理想的效果,不仅影响了人机交互的准确性和智能化水平,也对服务的效率和质量产生了负面影响。


奇富科技引入了全自研 Qifusion 框架模型,并将其集成到智能营销及贷后提醒等业务场景中。在应用上,Qifusion 框架模型能够提升智能营销、贷后提醒、风险控制业务应用场景识别准确率,帮助解决以上问题。并且在复杂的通话环境中,Qifusion 的语音识别准确率达到了 93%以上,意图识别准确率超过 95%。


  • 方言种类丰富:凭借丰富的数据样本,Qifusion 框架模型在原有东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话等国内八种主流方言的基础上,强化了四川、重庆、山东、河南、贵州、广东、吉林、辽宁、黑龙江等用户密集地区的方言识别能力。


  • 方言识别准确:Qifusion 框架模型具备自动识别不同口音的能力,并能在时间维度上对解码结果进行口音信息修正,使方言口音的语音识别误差率降低了 30%以上,整体语音识别字错率降低了 16%以上,提升了用户体验。


  • 方言识别高效:Qifusion 框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。



2024-07-10 11:083426

评论

发布
暂无评论

为什么选择学习 Sanic 框架

宇宙之一粟

4月月更 sanic

Dio —— Flutter 网络请求之王者

岛上码农

flutter 移动端开发 4月月更 跨平台开发 安卓 ios

残酷春天里的中国科技(二):和全球供应链一起“仰卧起坐”

脑极体

一文了解异步编程基础

宇宙之一粟

Python 异步编程 4月月更

王者荣耀商城异地多活架构设计

Fingal

架构实战营

关于OpenHarmony3.1,想随便聊一点

坚果

OpenHarmony 4月月更

EasyRecovery15数据恢复软件

茶色酒

EasyRecovery15

15 张图 | 深入理解 OpenFeign 远程调用的架构原理

悟空聊架构

Feign 4月日更 悟空聊架构 openfeign 4月月更

CNCF生态蓝图的八个领域及路线图概述

穿过生命散发芬芳

4月月更

泛型真的会让程序变慢吗?(Go1.18新特性)

蔡超

golang 编程 编程、 Go 语言

在线CSV转多行数据工具

入门小站

工具

[Day17]-[动态规划]打家劫舍

方勇(gopher)

LeetCode 数据结构和算法

Android C++系列:C++最佳实践4多重继承与虚继承

轻口味

c++ android 4月月更

设计消息队列存储消息数据的 MySQL 表格

孙强

架构师实战营

学生管理系统详细架构设计文档

哈喽

「架构实战营」

下单流程解耦新方案-你知道Spring事件监听机制吗

越长大越悲伤

事件驱动 SpringBoot 2 实战

linux之read命令

入门小站

嵌入式进阶从小白到内核大神学习全攻略(学习路线+学习书籍+练习项目)

简说Linux内核

Linux 驱动开发 嵌入式开发 linux内核、 内核工程师

如何从 Java 的 List 中删除第一个元素

HoneyMoose

在线脑图思维导图生成工具

入门小站

工具

HttpClient使用详解与实战一:普通的GET和POST请求

乌龟哥哥

4月月更

Tuxera NTFS Mac2022磁盘读写工具

茶色酒

Tuxera NTFS Mac2022

残酷春天里的中国科技(三):持续缠绕的科技封锁线

脑极体

咨询公司也要挑客户吗?

秋去冬来春未远

数字化 信息化 客户 咨询

东方园林召开2022年度全员大会

科技大数据

消息队列存储消息数据的 MySQL 表格

AragornYang

架构训练营 架构实战营

GitOps的12个痛点

俞凡

DevOps 研发效能 gitops

深入解析JVM-Java对象头组成

janyxe

Java JVM Java内存布局 Java对象头 Java对象组成

读《Software Engineering at Google》(07)

术子米德

架构师成长笔记

【PIMF】OpenHarmony啃论文俱乐部——“六脉神剑”详解

离北况归

OpenHarmony Openharmony啃论文俱乐部 六脉神剑

Linux驱动开发-内核定时器

DS小龙哥

4月月更

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上_AI&大模型_赵明华_InfoQ精选文章