写点什么

百度 UNIT3.0 及语音技术平台迎来重磅升级,技术细节独家解读

  • 2019-05-20
  • 本文字数:2298 字

    阅读完需:约 8 分钟

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读

2017 年 7 月,百度在 AI 开发者大会上发布对话系统定制平台 UNIT,它搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力。


2018 年 7 月,UNIT 推出的 2.0 版本,技术、功能与架构实现全面升级,为开发者提供更加易用、更加专业的对话系统定制能力。


2019 年 5 月 15 日,"与未来对话——百度大脑智能对话引擎及产品发布会"正式举行,会上首次曝光百度大脑智能对话生态,并推出全新的智能对话引擎。


基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的 AI 技术,百度已形成包含 UNIT 3.0 和语音技术平台的百度大脑智能对话引擎,并在此基础上推出客服、消费电子和出行三大智能对话场景方案。会上,百度自然语言处理部主任架构师孙珂博士宣布百度大脑对话系统定制平台 UNIT3.0 全新升级,并发布 9 大核心特性,为国内智能对话领域打造了技术最强、能力最丰富、使用规模最大的智能对话定制平台。



孙珂介绍,UNIT 平台已累计超 460 亿次的交互量。而在应用中,从对话核心技术到一个场景化的真实对话系统落地,企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此,百度大脑推出 UNIT3.0 版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级。



技能搭建包括预置技能和自定义技能。此次全新发布了智能问答、设备控制、影音休闲、生活服务等多个方面共 58 项积累自真实业务的预置技能;同时,预置技能也支持开发者结合特定场景进行再次开发,使其更符合场景业务需要。自定义问答技能方面,全新发布了文档问答功能,支持开发者上传业务文档并一键训练,在 1 分钟内快速定制问答系统。自定义对话技能方面,正式发布训练数据生产与标注辅助工具 DataKit,实现自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。此外, “深度训练”模型全新升级融入百度最新发布的语义表示预训练模型 ERNIE,可在标注数据大量减少的情况下达到同样效果。升级后的 DataKit 和基于深度训练的理解技术可谓是“强强联合”,可使对话技能的综合研发成本节省 60%。


据了解,70%的企业在智能对话系统构建过程中,都面临梳理和准备企业知识的困难环节,针对这一痛点,UNIT3.0 在构建知识方面实现重磅升级。全新发布问答知识库构建工具,帮助开发者构建问答知识库,节省人工成本。新发布的图谱知识库构建工具可以辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识也可以导入 UNIT 问答技能词槽词典,进一步帮助对话理解效果的优化。


UNIT3.0 也进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。技能管理实现多技能顺序可调,并共享全局记忆;对话管理具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,HTTP 服务全面支持接入。


听懂语音、理解对话、快速反馈是智能对话中的重要组成部分,对此语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。在呼叫中心场景中,提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型、呼叫中心场景专属的语音合成音库,满足适配主流厂家 MRCP 对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。


除了端到端的呼叫中心语音技术方案,全新发布的语音自训练平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。


深入落地场景,是智能对话发展的必然趋势,也是普及化的必经过程。基于在智能对话领域多年的经验、技术积累,百度大脑推出了典型的、有针对性的三大对话场景方案,分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。这三大方案都从领域业务需求、集成与配合、部署与维护做出了不同程度的升级。



客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点,推出全新的语音语义一体化中控,实现一次交互完成语音和对话理解服务访问同时,预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。此外,在部署与维护方面实现了云端部署和私有化部署的多样化部署,可按需匹配。


消费电子对话场景方案综合考虑其场景、资源的开放性,软硬件终端产品的多元化等特点,除了前面提到的沉淀至真实场景的 58 项预置技能和优质的信息与问答资源外,还开源了对话管理模块 DMKit、对话中控模块 USKit,它们具备与云端理解能力无缝对接,帮助开发者深度定制对话技能。也支持公有云、虚拟私有域部署模式,提供完善的 Android、iOS SDK 接入方式,还可一键接入 DuerOS 和小程序等。


出行智能对话场景方案是面向出行场景专属定制的,拥有车载专属语音解决方案和车厂专属语义定制平台。车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。车厂专属语义定制平台提供丰富的预置能力和车厂技能自定制能力支持。此外,面向车载网络稳定性不可控特性,我们推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能,高性能离线语义嵌入式 SDK;也推出了支持出行场景离在线对话能力融合的框架。


活动的最后,百度 AI 技术生态部总经理喻友平发布了智能对话引擎生态计划,推出了百度大脑智能对话深度训练营以及百度大脑智能对话引擎白皮书,提供从智能对话技术纲领到应用实践的全面指导。未来,百度大脑将持续发力智能对话领域,让语言推动机器进步。


2019-05-20 12:296123
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 283.9 次阅读, 收获喜欢 1303 次。

关注

评论

发布
暂无评论
发现更多内容

Flutter:如何在没有插件的情况下制作旋转动画

坚果

flutter 11月日更

深入理解 volatile 关键字

编程江湖

volatile JAVA开发

架构实战营-模块六

瓜子葫芦侠

「架构实战营」

[Pulsar] 消息生命历程(四)——Broker的消息处理

Zike Yang

Apache Pulsar 11月日更

Android C++系列:Linux进程间通信(二)

轻口味

c++ android jni 11月日更

搞定大厂算法面试之leetcode精讲6.深度优先&广度优先

全栈潇晨

算法面试 Leet Code

vue3 学习笔记 (三)——vue3 自定义指令

码仔

Vue3 自定义指令

程序员如何应对职业天花板

石云升

职场天花板 职场经验 11月日更

博文推荐 | 基于 Pulsar 事务实现 Exactly-Once 语义

Apache Pulsar

Java 架构 云原生 中间件 Apache Pulsar

央视新闻联合百度智能云打造首个AI手语主播

百度大脑

人工智能

详解阿里开源分布式事务框架Seata

博文视点Broadview

Java开发基础之开发环境搭建

@零度

JAVA开发

docker vs docker-compose 解密

liuzhen007

11月日更

《深入理解JVM虚拟机》读书笔记:第二章 Java内存区域与内存溢出异常

Joseph295

贪心算法:加油站 ⛽

空城机

算法 大前端 11月日更

Prometheus Exporter (十)Ping Exporter

耳东@Erdong

Prometheus ping exporter 11月日更

【高并发】浅谈AQS中的CountDownLatch、Semaphore与CyclicBarrier

冰河

Java 并发编程 多线程 高并发 异步编程

风口上的低代码:我们看到了这些变化与趋势

脑极体

在线文本按列截取工具

入门小站

工具

如何使用find和locate 命令在Linux 中查找文件和目录?

Ethereal

Linux find locate

JSRE中的多任务与多线程

编程江湖

html5 大前端

Hadoop 入门笔记—核心组件 YARN

编程江湖

大数据 hadoop

架构原则

卢卡多多

架构 11月日更

译文 | Apache Pulsar 集群如何确保消息不丢

Apache Pulsar

Java 分布式 云原生 中间件 Apache Pulsar

云小课|打造企业数据“高内聚,低耦合”--试试GaussDB(DWS)逻辑集群,实现数据物理隔离

华为云开发者联盟

EI企业智能 数据仓库服务GaussDB(DWS) 逻辑集群

Apache APISIX request_uri 变量控制不当,存在路径穿透风险公告(CVE-2021-43557)

API7.ai 技术团队

Apache 云原生 漏洞修复 Apache APISIX ingress-controller

如何与 Dapr 集成打造 Apache APISIX 网关控制器

API7.ai 技术团队

云原生 网关 dapr Apache APISIX ingress-controller

linux 上查找包含特定文本的所有文件

入门小站

Linux

复杂业务系统高扩展架构设计与实践

鲸品堂

构架

小谈C#异常

喵叔

11月日更

没有人比我更会使用集合!对,是dart中的集合

程序那些事

Java flutter dart 程序那些事 11月日更

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读_AI&大模型_陈思_InfoQ精选文章