HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

声网一站式智能语音识别方案升级 语音审核“快准省”

  • 2020-04-10
  • 本文字数:1899 字

    阅读完需:约 6 分钟

声网一站式智能语音识别方案升级 语音审核“快准省”

近日,我们的“一站式智能语音识别方案”将实现升级。升级后,在原有合作伙伴“数美科技”基础上,将新增依图、阿里云这两家智能语音识别服务商,通过整合行业 TOP3 服务商的语音识别技术优势,帮助直播、语音聊天室等互联网平台更智能、高效的识别语音中存在的涉黄、涉政、广告等不良信息,实现全面、深入地净化平台网络环境。


依图、阿里云重磅加入,智能语音识别方案升级

近年来,随着直播、短视频、语音社交等行业的快速发展,由用户创造的 UGC 内容成为了互联网内容生态的重要构成,并丰富了人们的互联网生活。而另一方面,随着用户 UGC 内容越来越多,涉黄、涉政、不良广告等违法、违规的内容也频频出现,成为了“害群之马”,给很多平台带来了风险。同时,相对于图文和视频,音频审核本身在技术上也更具难度,又增加了平台方的内容审核压力。


在去年 8 月,声网 Agora 就推出了“一站式智能语音识别方案”,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,在语音识别服务方面接入了数美科技的“天净”智能语音审核系统,通过声纹检测、语音识别等技术,智能识别语音环境中的涉黄、涉政、广告等违法违规信息,受到了很多企业的好评。


而此次升级后的“一站式智能语音识别方案”新增接入了阿里云、依图科技先进、智能的语音识别技术,整合了业界 TOP3 智能语音识别服务商的技术优势以提供目前互联网行业最全面、最高效的智能语音识别技术。例如,数美科技的“天净”智能语音识别,基于深度学习语音识别技术,多维度智能实时审核。深挖场景需求,为直播视频流、UGC 短视频、FM 电台、语音广场、语音直播间等各类场景提供智能内容过滤服务,通过语音识别转文本的方式,识别文本内容中涉政、色情、广告等不良信息;业内首创的娇喘语音识别,基于基于 Bi-GRU、Attention 模型,精准识别声音中含有娇喘、呻吟、耳骚、喊麦等违规音频,准确率达到 90%以上。声纹识别与检索对比”技术可进行声纹聚类、关联,发现线上、线下语音广告与欺诈行为等。


而依图科技在公共安全领域早已深耕多年。依靠世界级算法团队自研的语音识别、自然语言理解和声纹算法,依图的“智能语音审核”拥有准、快、省三大特点。准——凭借世界级算法能力加已有场景数据的螺旋迭代提升,依图的召回和准确率居行业前列,帮企业最大程度的降低风险。快——实时监测并在 3 秒内返回结果。省——同步返回高精准转写文本和违规音频片段,帮人工审核员提高效率、节省时间。


打通实时音视频+智能语音识别+AI,企业一站式接入

声网 Agora 的“一站式智能语音识别方案”可为企业提供实时音视频+实时录制+实时智能语音识别的一站式高度集成服务,也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外 SDK、无需自己对接 CDN 厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。


在智能语音识别方面,声网 Agora 整合了业界 TOP3 智能语音识别服务商的技术优势。而在实时音视频功能方面,声网自建的软件定义实时网 SD-RTN™专为实时音视频业务提供 SLA/ QoS 质量保证,能为企业提供高并发、高可靠性、低延时和抗弱网等特性的实时音视频技术。


声网 Agora 目前在全球拥有 250 多个数据中心。在网络架构设计上能够应对 10 倍以上的负荷,具备千万级并发能力。声网的软件定义实时网 SD-RTN™拥有超低延时特性,可做到全球端到端延时小于 400ms,延时中位数 76ms,处于行业领先水平。声网还具备优秀的弱网传输和抗丢包算法,可以在 60%的丢包环境下保障音视频流畅,70%的网络丢包环境下保障语音的流畅。在终端性能和适配方面,声网针对实时互联网 last mile 做了深度优化,目前已经适配 6000 多款终端设备,网络覆盖全球 200 多个国家和地区,即使在网络环境差的偏远山区或跨国场景中用户也能实现顺畅互动。


此外,对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案还融合声网 Agora 语音引擎与 AI 音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高 30% 以上。


通过声网 Agora 的“一站式智能语音识别方案”可以帮助企业严格、有效的净化平台内容质量,降低监管风险,提升用户体验,同时还能为企业大幅节省接入成本。据了解,接下来声网还将联合更多业界知名智能语音识别服务商,为企业持续提供业界最高效、最严格的内容审核机制,促进网络生态健康发展。


本文转载自 声网 Agora 公众号。


原文链接:https://mp.weixin.qq.com/s/A7lL1FYdUfru3-TELGOqLA


2020-04-10 17:38711

评论 1 条评论

发布
暂无评论
发现更多内容

大数据开发之Hive如何提高查询效率

@零度

大数据 hive

云堡垒机和普通堡垒机的三大区别分析-行云管家

行云管家

云计算 网络安全 数据安全 堡垒机 云堡垒机

全国首个!OceanBase 助力江西省养老保险全国统筹信息系统上线

OceanBase 数据库

OceanBase 开源 OceanBase 社区版 核心系统

iOS 编译器__Attribute__的入门指南

37手游iOS技术运营团队

xcode LLVM Clang编译 Clang Attribute

回顾2021,展望2022 | TDengine一年“成绩”汇总

TDengine

数据库 tdengine 2021年终总结

链计算、新基建:区块链助力数字经济新生态

CECBC

一个cpp协程库的前世今生(二)协程切换的原理

SkyFire

c++ 协程 cocpp

HTTPDNS 快速入门

37手游iOS技术运营团队

DNS httpdns

OpenMLDB 12月会议纪要

第四范式开发者社区

人工智能 机器学习 第四范式 OpenMLDB

你设备中的木马藏在哪里?为什么查杀困难?

喀拉峻

黑客 网络安全 安全 信息安全 木马病毒

COSCL开源评选名单公布!OceanBase 社区版荣获2021优秀开源项目奖

OceanBase 数据库

OceanBase 开源 OceanBase 社区版

重塑企业创新方式 Serverless让云“开箱即用”

WorkPlus

OceanBase 通过工信部电子标准院首批开源项目成熟度评估

OceanBase 数据库

数据库 工信部 OceanBase 开源

2022年购买服务器运维管理软件选择哪家好?

行云管家

IT运维 服务器运维

2021MongoDB技术实践与应用案例征集活动获奖通知

MongoDB中文社区

《国产分布式数据库选型及满意度调查报告》出炉,OceanBase获得双料第一

OceanBase 数据库

分布式数据库 OceanBase 开源 OceanBase 社区版

SpringMVC框架基础知识(01)

海拥(haiyong.site)

28天写作 12月日更

盘点 2021|一个新的开始

IT蜗壳-Tango

28天写作 12月日更 盘点2021 盘点 2021

【签约计划第二季】百位签约创作者名单公布

InfoQ写作社区官方

签约计划第二季 热门活动

Greenplum内核源码分析-分布式事务(二)

王凤刚(ginobiliwang)

源码分析 分布式事务 greenplum

Greenplum内核源码分析-分布式事务(三)

王凤刚(ginobiliwang)

源码分析 分布式事务 greenplum

Xcode 配置多套 App 图标的方法 --- AppStore 图标 A/B Test 实践

37手游iOS技术运营团队

ios xcode appstore 产品页优化 自定产品页

2021年末总结

编号94530

工作 架构设计 心得 2021 项目经验

“千言”开源数据集项目全面升级:数据驱动AI技术进步

百度开发者中心

千言

区块链赋能生猪养殖,让“猪”事有迹可循

CECBC

谁编写了区块链的规则?

CECBC

Veritas:2022年数据安全及合规领域行业预测

WorkPlus

CRM系统为什么被认为是企业的重要资产?

低代码小观

企业管理 资产管理 CRM 企业管理系统 CRM系统

Greenplum内核源码分析-分布式事务(一)

王凤刚(ginobiliwang)

源码分析 分布式事务 greenplum

MongoDB基本介绍与安装(1)

Tom弹架构

Java mongodb

DTC 2021 | 一体化架构的原生分布式数据库正在成为核心系统首选

OceanBase 数据库

数据库 OceanBase 开源 OceanBase 社区版

声网一站式智能语音识别方案升级 语音审核“快准省”_文化 & 方法_声网_InfoQ精选文章