写点什么

百度 UNIT3.0 及语音技术平台迎来重磅升级,技术细节独家解读

  • 2019-05-20
  • 本文字数:2298 字

    阅读完需:约 8 分钟

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读

2017 年 7 月,百度在 AI 开发者大会上发布对话系统定制平台 UNIT,它搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力。


2018 年 7 月,UNIT 推出的 2.0 版本,技术、功能与架构实现全面升级,为开发者提供更加易用、更加专业的对话系统定制能力。


2019 年 5 月 15 日,"与未来对话——百度大脑智能对话引擎及产品发布会"正式举行,会上首次曝光百度大脑智能对话生态,并推出全新的智能对话引擎。


基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的 AI 技术,百度已形成包含 UNIT 3.0 和语音技术平台的百度大脑智能对话引擎,并在此基础上推出客服、消费电子和出行三大智能对话场景方案。会上,百度自然语言处理部主任架构师孙珂博士宣布百度大脑对话系统定制平台 UNIT3.0 全新升级,并发布 9 大核心特性,为国内智能对话领域打造了技术最强、能力最丰富、使用规模最大的智能对话定制平台。



孙珂介绍,UNIT 平台已累计超 460 亿次的交互量。而在应用中,从对话核心技术到一个场景化的真实对话系统落地,企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此,百度大脑推出 UNIT3.0 版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级。



技能搭建包括预置技能和自定义技能。此次全新发布了智能问答、设备控制、影音休闲、生活服务等多个方面共 58 项积累自真实业务的预置技能;同时,预置技能也支持开发者结合特定场景进行再次开发,使其更符合场景业务需要。自定义问答技能方面,全新发布了文档问答功能,支持开发者上传业务文档并一键训练,在 1 分钟内快速定制问答系统。自定义对话技能方面,正式发布训练数据生产与标注辅助工具 DataKit,实现自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。此外, “深度训练”模型全新升级融入百度最新发布的语义表示预训练模型 ERNIE,可在标注数据大量减少的情况下达到同样效果。升级后的 DataKit 和基于深度训练的理解技术可谓是“强强联合”,可使对话技能的综合研发成本节省 60%。


据了解,70%的企业在智能对话系统构建过程中,都面临梳理和准备企业知识的困难环节,针对这一痛点,UNIT3.0 在构建知识方面实现重磅升级。全新发布问答知识库构建工具,帮助开发者构建问答知识库,节省人工成本。新发布的图谱知识库构建工具可以辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识也可以导入 UNIT 问答技能词槽词典,进一步帮助对话理解效果的优化。


UNIT3.0 也进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。技能管理实现多技能顺序可调,并共享全局记忆;对话管理具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,HTTP 服务全面支持接入。


听懂语音、理解对话、快速反馈是智能对话中的重要组成部分,对此语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。在呼叫中心场景中,提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型、呼叫中心场景专属的语音合成音库,满足适配主流厂家 MRCP 对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。


除了端到端的呼叫中心语音技术方案,全新发布的语音自训练平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。


深入落地场景,是智能对话发展的必然趋势,也是普及化的必经过程。基于在智能对话领域多年的经验、技术积累,百度大脑推出了典型的、有针对性的三大对话场景方案,分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。这三大方案都从领域业务需求、集成与配合、部署与维护做出了不同程度的升级。



客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点,推出全新的语音语义一体化中控,实现一次交互完成语音和对话理解服务访问同时,预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。此外,在部署与维护方面实现了云端部署和私有化部署的多样化部署,可按需匹配。


消费电子对话场景方案综合考虑其场景、资源的开放性,软硬件终端产品的多元化等特点,除了前面提到的沉淀至真实场景的 58 项预置技能和优质的信息与问答资源外,还开源了对话管理模块 DMKit、对话中控模块 USKit,它们具备与云端理解能力无缝对接,帮助开发者深度定制对话技能。也支持公有云、虚拟私有域部署模式,提供完善的 Android、iOS SDK 接入方式,还可一键接入 DuerOS 和小程序等。


出行智能对话场景方案是面向出行场景专属定制的,拥有车载专属语音解决方案和车厂专属语义定制平台。车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。车厂专属语义定制平台提供丰富的预置能力和车厂技能自定制能力支持。此外,面向车载网络稳定性不可控特性,我们推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能,高性能离线语义嵌入式 SDK;也推出了支持出行场景离在线对话能力融合的框架。


活动的最后,百度 AI 技术生态部总经理喻友平发布了智能对话引擎生态计划,推出了百度大脑智能对话深度训练营以及百度大脑智能对话引擎白皮书,提供从智能对话技术纲领到应用实践的全面指导。未来,百度大脑将持续发力智能对话领域,让语言推动机器进步。


2019-05-20 12:296086
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 281.8 次阅读, 收获喜欢 1302 次。

关注

评论

发布
暂无评论
发现更多内容

13张图,深入理解Synchronized

程序猿阿星

synchronized java 并发 锁机制 锁升级

记一次真实的JVM性能调优过程

北游学Java

Java JVM 性能调优

抖音快手seo获客系统开发(可贴牌)

获客I3O6O643Z97

抖音霸屏

校友资料登记平台小程序开发笔记二-云数据库设计

CC同学

校友录小程序 校友资料小程序

看焱融云CSI动态感知如何扩展Kubernetes Scheduler

焱融科技

云计算 技术 云原生 高性能 分布式存储

价值连城 知名深度强化学习Pieter Abbeel的采访 John 易筋 ARTS 打卡 Week 56

John(易筋)

ARTS 打卡计划

WorkPlus高端制造业数字化解决方案—航天科工

BeeWorks

开源 移动 解决方案 即时通讯 私有云

Go语言:new还是make?到底该如何选择?

微客鸟窝

Go 语言

带你了解WDR-GaussDB(DWS) 的性能监测报告

华为云开发者联盟

数据库 数据 GaussDB(DWS) WDR 负荷诊断报告

哪类技术助力了隐私计算的工业化?如何“组装”发挥更大价值?

棒极了!可以让你Java程序快上180%以上的阿里性能优化笔记

Java架构追梦

Java 阿里巴巴 架构 面试 性能优化

Java的这个强大功能,很多人都不知道

华为云开发者联盟

Java c++ jdk 算法 jni

抖音快手短视频获客软件开发系统

去中心化薄饼交易所开发|PancakeSwap去中心化交易所搭建方案

Geek_23f0c3

交易所开发 去中心化交易所系统开发 PancakeSwap交易所

Spark 开源新特性:Catalyst 优化流程裁剪

华为云开发者联盟

sql spark 开源 Catalyst 优化器

一周信创舆情观察(7.12~7.18)

统小信uos

SaaS市场百花齐放:厂商数量已达4500家,用户数量已达915万家

海比研究院

应届女生美团Java岗4面,一次性斩offfer,我受到了万点暴击

Java 编程 程序员 架构师 计算机

从 Web 图标演进历史看最佳实践

百度Geek说

大前端

WorkPlus高端制造业数字化解决方案—长江存储

BeeWorks

开源 企业 解决方案 即时通讯 私有云

校友资料登记平台小程序开发笔记一-系统整体设计

CC同学

校友登记小程序 校友资料小程序

详解API Gateway流控实现,揭开ROMA平台高性能秒级流控的技术细节

华为云开发者联盟

华为 ROMA 集成平台 ROMA Connect API Gateway

EasyRecovery软件帮你快速恢复图片数据

淋雨

EasyRecovery 文件恢复 硬盘数据恢复

测试开发之系统篇-安装KVM虚拟机

禅道项目管理

虚拟机 测试开发

经典好文!BAT大厂Android面试真题锦集干货整理

欢喜学安卓

android 程序员 面试 移动开发

作为Android开发程序员,已获千赞

欢喜学安卓

android 程序员 面试 移动开发

网络研讨会|为什么在开发流程中应用静态代码分析工具?

鉴释

在线研讨会 静态代码分析

Cassandra的调优总结

林一

分布式数据库 Cassandra

利用亚马逊云科技Direct Connect和Transit Gateway轻松构造企业混合云解决方案

亚马逊云科技 (Amazon Web Services)

腾讯T3大牛手把手教你!三面腾讯,已拿offer

欢喜学安卓

android 程序员 面试 移动开发

ZooKeeper 分布式锁 Curator 源码 04:分布式信号量和互斥锁

程序员小航

Java zookeeper 源码 分布式锁 zookeeper分布式锁

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读_AI&大模型_陈思_InfoQ精选文章