写点什么

百度 UNIT3.0 及语音技术平台迎来重磅升级,技术细节独家解读

  • 2019-05-20
  • 本文字数:2298 字

    阅读完需:约 8 分钟

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读

2017 年 7 月,百度在 AI 开发者大会上发布对话系统定制平台 UNIT,它搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力。


2018 年 7 月,UNIT 推出的 2.0 版本,技术、功能与架构实现全面升级,为开发者提供更加易用、更加专业的对话系统定制能力。


2019 年 5 月 15 日,"与未来对话——百度大脑智能对话引擎及产品发布会"正式举行,会上首次曝光百度大脑智能对话生态,并推出全新的智能对话引擎。


基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的 AI 技术,百度已形成包含 UNIT 3.0 和语音技术平台的百度大脑智能对话引擎,并在此基础上推出客服、消费电子和出行三大智能对话场景方案。会上,百度自然语言处理部主任架构师孙珂博士宣布百度大脑对话系统定制平台 UNIT3.0 全新升级,并发布 9 大核心特性,为国内智能对话领域打造了技术最强、能力最丰富、使用规模最大的智能对话定制平台。



孙珂介绍,UNIT 平台已累计超 460 亿次的交互量。而在应用中,从对话核心技术到一个场景化的真实对话系统落地,企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此,百度大脑推出 UNIT3.0 版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级。



技能搭建包括预置技能和自定义技能。此次全新发布了智能问答、设备控制、影音休闲、生活服务等多个方面共 58 项积累自真实业务的预置技能;同时,预置技能也支持开发者结合特定场景进行再次开发,使其更符合场景业务需要。自定义问答技能方面,全新发布了文档问答功能,支持开发者上传业务文档并一键训练,在 1 分钟内快速定制问答系统。自定义对话技能方面,正式发布训练数据生产与标注辅助工具 DataKit,实现自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。此外, “深度训练”模型全新升级融入百度最新发布的语义表示预训练模型 ERNIE,可在标注数据大量减少的情况下达到同样效果。升级后的 DataKit 和基于深度训练的理解技术可谓是“强强联合”,可使对话技能的综合研发成本节省 60%。


据了解,70%的企业在智能对话系统构建过程中,都面临梳理和准备企业知识的困难环节,针对这一痛点,UNIT3.0 在构建知识方面实现重磅升级。全新发布问答知识库构建工具,帮助开发者构建问答知识库,节省人工成本。新发布的图谱知识库构建工具可以辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识也可以导入 UNIT 问答技能词槽词典,进一步帮助对话理解效果的优化。


UNIT3.0 也进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。技能管理实现多技能顺序可调,并共享全局记忆;对话管理具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,HTTP 服务全面支持接入。


听懂语音、理解对话、快速反馈是智能对话中的重要组成部分,对此语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。在呼叫中心场景中,提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型、呼叫中心场景专属的语音合成音库,满足适配主流厂家 MRCP 对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。


除了端到端的呼叫中心语音技术方案,全新发布的语音自训练平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。


深入落地场景,是智能对话发展的必然趋势,也是普及化的必经过程。基于在智能对话领域多年的经验、技术积累,百度大脑推出了典型的、有针对性的三大对话场景方案,分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。这三大方案都从领域业务需求、集成与配合、部署与维护做出了不同程度的升级。



客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点,推出全新的语音语义一体化中控,实现一次交互完成语音和对话理解服务访问同时,预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。此外,在部署与维护方面实现了云端部署和私有化部署的多样化部署,可按需匹配。


消费电子对话场景方案综合考虑其场景、资源的开放性,软硬件终端产品的多元化等特点,除了前面提到的沉淀至真实场景的 58 项预置技能和优质的信息与问答资源外,还开源了对话管理模块 DMKit、对话中控模块 USKit,它们具备与云端理解能力无缝对接,帮助开发者深度定制对话技能。也支持公有云、虚拟私有域部署模式,提供完善的 Android、iOS SDK 接入方式,还可一键接入 DuerOS 和小程序等。


出行智能对话场景方案是面向出行场景专属定制的,拥有车载专属语音解决方案和车厂专属语义定制平台。车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。车厂专属语义定制平台提供丰富的预置能力和车厂技能自定制能力支持。此外,面向车载网络稳定性不可控特性,我们推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能,高性能离线语义嵌入式 SDK;也推出了支持出行场景离在线对话能力融合的框架。


活动的最后,百度 AI 技术生态部总经理喻友平发布了智能对话引擎生态计划,推出了百度大脑智能对话深度训练营以及百度大脑智能对话引擎白皮书,提供从智能对话技术纲领到应用实践的全面指导。未来,百度大脑将持续发力智能对话领域,让语言推动机器进步。


2019-05-20 12:296054
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 280.1 次阅读, 收获喜欢 1301 次。

关注

评论

发布
暂无评论
发现更多内容

Python实现发送邮件(实现单发/群发邮件验证码)

Python研究者

8月日更

为什么要了解复杂科学?

石云升

8月日更

fil矿机什么时候开始挖?fil矿机能挖多久?

fil矿机能挖多久 fil矿机什么时候开始挖

Go 与 C++ 的对比和比较

恒生LIGHT云社区

c++ 编程语言 Go 语言

易灸灸系统开发

(王经理)专业app小程序开发

数字资产多链钱包搭建,区块链多币种钱包

13530558032

fil挖矿收益如何?fil挖矿一天可以挖多少?

区块链 分布式存储 IPFS fil挖矿 filecoin收益

架构设计系列一 架构方法论的入门

nydia

架构学习

读书笔记-《数据密集型应用系统设计》-概论

KayTin

存储大师班 | ZFS存储池块管理与事务模型

QingStor分布式存储

文件存储 分布式存储

女巫面具软件开发

(王经理)专业app小程序开发

fil挖矿步骤教程是什么?fil挖矿规则是什么?

fil挖矿步骤教程是什么 fil挖矿规则是什么

Java内存问题从工具到诊断平台

徐敏

Java 监控 垃圾回收 故障诊断

优雅的故障处理:快速创建 Pulsar 重试队列

Apache Pulsar

消息队列 Apache Pulsar StreamNative

七月速递:人脸特征值同步私有化部署包发布、EdgeBoard车辆分析软硬一体方案助力交通管理智能化

百度大脑

人工智能 EdgeBoard 软硬一体

一周信创舆情观察(8.16~8.22)

统小信uos

赋能生态,合力同行!博睿数据成为光合组织成员单位

博睿数据

RocketMQ-学习记录

春秋易简

云行、数治、慧用 打造直抵基层的数字化高速公路

云计算

盲盒星球系统开发

(王经理)专业app小程序开发

联邦计算能力,让企业异构数据源数据合作畅通无阻

星环科技

异构数据 联邦计算

强大的OCR技术+多元的用户场景 口碑型App白描的开发之路

百度大脑

人工智能 OCR 视障

Go- 字符串、切片和数组的使用

HelloBug

数组 字符串 Go 语言 切片

关于开发视图

编程三昧

8月日更 开发视图

太厉害了,终于有人把TCP-IP协议整合成864页学习笔记了

Java~~~

Java 架构 面试 TCP 网络

初学架构师养成の微信业务架构分析&学生管理系统架构

Yina🌝很浪🌊

架构

现货量化策略系统开发,量化软件开发

13530558032

02. 到底什么是人工智能

Databri_AI

人工智能

美团年货-2020年(记录)

春秋易简

吃透这份Github点赞120k的Spring全家桶笔记Offer拿到手软

Java~~~

Java spring 架构 面试 Spring Cloud

学生管理系统架构设计

晓波

架构实战营

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读_AI&大模型_陈思_InfoQ精选文章