写点什么

百度 AI 开发者大会百度大脑论坛:详解“多模态深度语义理解”

  • 2018-07-06
  • 本文字数:2611 字

    阅读完需:约 9 分钟

7 月 4 日召开的百度 AI 开发者大会(Baidu Create 2018)上,百度高级副总裁、AI 技术平台体系(AIG)总负责人王海峰发布百度大脑 3.0,并指出,百度大脑 3.0 的核心是“多模态深度语义理解”,包括数据的语义,知识的语义,以及图像、视频、声音、语音等各方面的理解。

在上午的主论坛上,李彦宏现场演示的一段 AI 客服给参会者打电话的视频让人印象深刻:

https://v.qq.com/x/page/o0711bxuu7z.html

据了解,这一功能的实现就是依靠百度大脑 3.0 的多模态深度语义理解能力。

多模态深度语义理解如何在技术上实现?拥有多大的能量?它将如何被应用来改变我们的生活?当天下午的百度大脑论坛中,百度大脑 3.0 的核心技术一一“亮相”,为开发者们带来一场技术盛宴。

可容纳 1000 人的会场座无虚席,开发者们甚至席地而坐,或者站在会场最后听完整场分享。一位开发者表示,“干货太多、时间太少,回去要找回放视频好好消化一下。”

从“看清听清”到“看懂听懂”

“多模态深度语义理解能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”王海峰表示。

视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,视觉语义化技术首先识别人、物体和场景,同时捕捉它们之间的行为和关系,通过时序化、数字化、结构化的方式形成语义知识,最终结合领域和场景进行智慧推理,落地行业应用。比如在零售领域,它可以准确判断每个人的动作、行为,真正实现顾客拿起商品就走。未来,视觉语义化技术还可进一步延展,它结合新型的传感器和 AI 芯片,可以在感知层面和计算层面得到大幅提升;结合手机可以带给用户更佳地使用体验。未来,百度视觉语义化技术将在百度 AI 开放平台中开放给开发者使用。

语音技术的升级则让机器更好地听懂世界。百度语音技术部总监高亮表示,百度基于远场的语音语义一体化技术取得重大突破,为业界提供更顶尖的远场语音技术。语音语义一体化将远场交互中高频 Query 识别准确率提升 10 个点,并保持普通 Query 识别率不降;多语种混合声学建模基于 Deep Peak2 大幅提升中英文混合 Query 识别准确率,相对错误率比业界最好竞品降低 20%;新升级的 TTS 技术业界首创传统拼接技术与 Wavenet 技术融合方案,保证合成质量的同时大大降低成本,让大规模应用落地成为现实。此外,百度重磅发布远场语音技术低成本解决方案“度小云”,它基于 Deep Peak V2 语音识别技术、语音语义一体化技术及 LSTM-VAD 深度学习语音切分技术,实现业界领先的五级唤醒技术,并拥有基于 Wavenet 的精致音库,支持远场优化的音频通信技术。未来开发者可以平等便捷地一站式获取百度远场语音能力。

想要让机器像人一样拥有智能,将语言变成知识必不可缺。百度 AI 技术平台体系执行总监吴甜表示,百度自然语言处理技术经过多年的发展,已形成全面、前沿的格局。百度知识图谱已发展为复杂、多元、全面的多元语义知识图谱,包含实体图谱、行业图谱、事件图谱、关注点图谱、多媒体图谱,其中实体图谱已经能够覆盖通用需求中 90% 的实体及其属性。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于 6 万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识,并通过“学习”真实应用每天产生的知识不断优化。在对话理解方面,百度理解与交互技术平台 UNIT 升级至 2.0,进一步增强冷启动能力,支持像人类一样在对话当中学习,同时开放了第一个工业级对话系统开源框架,降低搭建门槛,让开发者无缝对接云端。百度将持续开源新的技术,提供更灵活便捷的方案,推动自然语言理解技术的创新与发展。

夯实基础:数据、算法、算力并驾齐驱

数据、算法、算力是影响人工智能技术发展的重要因素。主论坛中,王海峰表示百度大脑 3.0 首次将芯片纳入技术体系,带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能 AI 芯片“昆仑”也在会上首次亮相。未来,AI 芯片将与百度自主研发的 PaddlePaddle 深度学习框架相结合,推动 AI 行业生态快速发展。

百度在 2016 年正式开源的 PaddlePaddle,是最适合中国开发者的深度学习框架。主论坛中,王海峰发布 PaddlePaddle3.0,下午,百度 AI 技术生态部总经理喻友平对此进行了详细解读。PaddlePaddle3.0 包括完整的核心框架,以及 AI Studio、AutoDL、EasyDL 等可以让开发者平等便捷获取顶尖 AI 能力的平台。PaddlePaddle3.0 核心框架对服务器版本以及移动端版本进行了全面优化,PaddlePaddle Fluid 提供丰富的满足常见主流模型搭建需求的 API,支持广泛的模型搭建,训练 Runtime 可以满足各类型的模型训练需求;PaddlePaddle Serving 可灵活适配多种预测引擎;PaddlePaddle Mobile 集成百度移动端预测的实践经验,提供多平台支持。

PaddlePaddle3.0 中,AutoDL 备受关注。百度大数据(北京)实验室主任浣军介绍,AutoDL 能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型。AutoDL 提供多种能力,支持设计全新深度学习网络结构,以及优化现有深度学习网络结构及参数,同时能够适配特定任务场景。

海量数据爆发式增长,发掘数据价值成为众多行业的普遍需求。百度大数据部总监郭谢表示,百度已形成从数据到数据工程、数据科学、数据产品再到行业方案的大数据产品技术栈,基于大数据特性,从生产资料和生产工具两方面促进产业发展。为了最大程度保证数据安全,百度正式发布大数据众智开放平台“点石”,基于全球领先的百度 AI 技术,全方位保障数据安全,并逐步开放工具能力,为行业数据安全赋能。

现场,百度启动了多项大赛。百度之星开发者大赛将如期回归,此外还有基于 PaddlePaddle 的中国高校计算机大赛人工智能创意赛、KG- 知识抽取赛、交通预测赛、无人车系列大赛,以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛。百度方面表示,欢迎各路高手挑战,通过大赛携手推动整个 AI 产业的发展。

业内人士评价,百度在推动技术落地的同时不断反哺技术升级,如今已成为国内人工智能领域的领航者。百度大脑升级至 3.0,也标志着百度 AI 技术的一次跨越式升级,正如王海峰在开场中所强调,“百度 AI 能力的核心是百度大脑,百度大脑 3.0 是百度 AI 能力的集大成者。”。基于百度大脑持续突破的技术实力,百度有能力把顶尖的 AI 技术提供给中国开发者、企业,更让每个开发者和企业都能平等获取顶尖 AI 能力,继而让 AI 在中国遍地开花。

2018-07-06 03:151824
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 279.8 次阅读, 收获喜欢 1301 次。

关注

评论

发布
暂无评论
发现更多内容

一文了解全面静态代码分析

龙智—DevSecOps解决方案

perforce Helix QAC

Alibaba内部流行的“Java突击宝典”

爱好编程进阶

Java 面试 后端开发

Filter 过滤器和 Listener 监听器

爱好编程进阶

Java 面试 后端开发

区块链+数字资产,未来财富的新起点

CECBC

有道词典Android客户端包体积优化之路

有道技术团队

andiod Groovy

数据仓库架构演变和建设思路

五分钟学大数据

数据仓库 4月月更

Docker:第七章:Docker搭建私服-本地镜像库

爱好编程进阶

Java 面试 后端开发

IDEA中Maven依赖下载失败解决方案

爱好编程进阶

Java 面试 后端开发

一级等保怎么做?要收费吗?等保要求是什么?

行云管家

网络安全 等保 等保2.0 一级等保

中商惠⺠交易中台架构演进:对 Apache ShardingSphere 的应⽤

SphereEx

Apache 数据库 ShardingSphere SphereEx

研讨会回放视频:如何提升Jenkins能力,使其成为真正的DevOps平台

龙智—DevSecOps解决方案

CI/CD CloudBees

2020年4面美团(多线程+redis

爱好编程进阶

Java 面试 后端开发

36天突击腾讯终拿Offer! Redis、高并发

爱好编程进阶

Java 面试 后端开发

Ceph实战(一)-分布式存储介绍与原理架构概述

爱好编程进阶

Java 面试 后端开发

龙智被评估为CMMI [3] 级

龙智—DevSecOps解决方案

CMMI 龙智

2021最新最全Java基础高频面试题汇总(1W字详细解析)

爱好编程进阶

Java 面试 后端开发

2022年4月中国数据库排行榜:春风拂面春意暖,分数回升四月天

墨天轮

数据库 opengauss 国产数据库 KingBase gbase8a

LLVM之父Chris Lattner:编译器的黄金时代

OneFlow

编程语言 编译器 LLVM 加速器 MLIR

如何以Sonar为例创建一个适用与所有企业的测试步骤

阿里云云效

阿里云 运维 测试 sonar 研发测试

用数字“钥匙”打开发展新空间

CECBC

游戏+NFT,脱虚向实外的另一可行场景

CECBC

精彩联动!OpenMLDB Pulsar Connector原理和实操

第四范式开发者社区

机器学习 数据库 特征 特征平台 连接器

星环科技基础软件产品全面落地开花,为企业数字化转型带来“星”动能

星环科技

企业官网有啥用?一定要搭建官方网站吗?

源字节1号

微信小程序 网站开发

最佳实践 | 通过使用 Jira Service Management 改进 HR 工作流程

龙智—DevSecOps解决方案

Atlassian jsm

海口等保测评公司有几家?具体在哪里?哪里可以查到?

行云管家

网络安全 等保 等保测评 海南 海口

“如何实现集中管理、灵活高效的CI/CD”在线研讨会精彩内容分享

龙智—DevSecOps解决方案

CI/CD CloudBees

2021金九银十最新338道大厂Java架构面试高频题目+答案详解

爱好编程进阶

Java 面试 后端开发

53w字!阿里首推系统性能优化指南太香了,堪称性能优化最优解

爱好编程进阶

Java 面试 后端开发

Docker镜像超详细介绍

爱好编程进阶

Java 面试 后端开发

二进制文件版本控制工具选择难?看完这篇你会找到答案

龙智—DevSecOps解决方案

perforce Helix Core

百度AI开发者大会百度大脑论坛:详解“多模态深度语义理解”_百度_陈思_InfoQ精选文章