11 月 19 - 20 日 Apache Pulsar 社区年度盛会来啦,立即报名! 了解详情
写点什么

余凯谈百度大脑与深度学习最新发展

  • 2014-09-09
  • 本文字数:1915 字

    阅读完需:约 6 分钟

在最近举行的百度世界 2014 大会大数据论坛上,百度深度学习实验室主任余凯分享了百度大脑和深度学习的最新发展,由此可以看出对未来产业的影响。

与传统的观念不同,余凯认为,百度从它诞生的第一天开始它就是一个人工智能公司:

一方面我们通过搜索引擎满足用户每天的搜索请求,产生大量的用户数据。另一方面我们提供价值,连接人和广告,让千千万万的商家能够找到他的顾客资源,这种从数据到价值之间有一个桥梁,这个桥梁在百度就是基于百度大数据人工智能,包括机器学习,自然语言理解、语音识别,图象识别等方方面面的技术,使得百度能够把大量的海量数据转化成用户价值和商业价值。

余凯指出,深度学习是人工智能取得最突破性的进展并且迅速在工业界产生影响的一个极为成功的例子。同样这也是麻省理工学院科技评论杂志将深度学习技术列为 2013 年度十大突破性技术之首的原因,这个最初来自学术界的研究成果影响到各大高科技公司的速度和广度是非常罕见的。

机器学习在过去 30 多年的时间里大致分为两个阶段,第一个阶段是浅层学习。第二个阶段从 2006 年开始进行更深层的学习。深度学习最吸引大家的一个原因在于它在很大程度上模拟了人脑神经网络的结构和行为,这里面的细节不多讲,但是就我们目前所知道的比如说对于图象的处理,我们通过训练得到的深度卷积网络,跟我们目前所知道的对人的视觉皮层神经元的行为有惊人的类似,我们同样发现人对听觉感知也有类似的情况。

谈到百度大脑的最新发展,余凯表示,经过过去一年多的时间,它经历了一个高速发展的阶段。

百度过去在大数据处理技术方面的积累,通过这种能力我们才能更好的开发各种不同的深度学习模型,应用于图像识别,语音识别、网页搜索,和广告推荐技术等等。

百度大脑如何让连接更智能?余凯解释说,首先人来到百度这个平台,表达他的搜索需求,这个搜索需求有可能是关键词,有可能是一段话,有可能是拍个照片,就要靠百度大脑来识别用户的意图,在精确识别用户搜索意图后,我们用深度学习来对网页语义相关性排序,从而匹配用户需求,这就完成了人与信息的连接。另一方面是连接人与广告和服务,我们通过大规模的深度学习,去估计和优化点击率和转化率,进而把人连接到所需要的广告和服务。我们的深度学习已经用在百度核心业务的方方面面,真正实现智能连接人和信息,智能连接人和服务。

深入百度大脑,我们开发了一种叫深度语义神经网络的模型,它是百度大脑用于自然语言的一个成功案例,目的在于匹配 query 和网页的语义相关性,这是业界第一次把深度学习成功应用于提升搜索引擎的排序,也是迄今为止深度学习用于语言文本信息最成功的例子。另外,我们的凤巢广告系统,它背后基于机器学习的点击率预估模型,从第一代浅层的机器学习模型,已经过度到到用更复杂的模型、更深的模型的深度学习时代。

大数据为人工智能带来何种影响? 余凯表示,大数据实际上给深度学习给人工智能带来很大的机会。但如何处理大数据、如何获得大知识、给我们带来了新的技术挑战。怎么样去处理?

作为世界上最早大规模的利用 GPU 做深度学习的高科技公司,我们通过各种各样的数据并行,模型并行去处理这些海量数据。我们还可以支持生成、配置针对不同的应用、不同的场景和不一样的网络结构。

整体来说,模式发生了变化,服务离现实世界越来越近:

我们以前是获取互联网信息,然后做搜索做广告,所有一切都是在虚拟世界完成。但是现在所有的服务离现实世界越来越近,离人越来越近,所以我们通过自然交互,通过穿戴式,了解人的需求,另外物理世界的信息,比如商店、场景、街道、天气等等,都跟我们推送的服务的相关性息息相关,我们现在需要通过智能感知技术获取人和场景的信息,才能推荐更加相关的服务。还有,我们看服务的执行阶段,以前互联网上完成一个预测,做出一个决策,之后是由人去执行,从而完成整个互联网服务环节。未来的互联网服务,需要机器,或者说机器人,自动的完成这服务的最后一公里。比如说某一个人想吃披萨,在网上下单后,一般是要由人来完成制作披萨,然后递送到家的。但是,这个体验不一定最好,因为如果机器知道个性化的口味需求,能千人千面的私人定制这个披萨,而且,自动驾驶能更高效便捷的将披萨送到家里。所以说,互联网的人工智能一定会从数字世界的智能延伸到物理世界的智能,机器人是大势所趋。

最后,余凯特别提到了自动驾驶项目,它需要建立感知能力,决策能力,还有不断自主学习的能力,可以说是人工智能技术的集大成者。从这里的画面可以看到,我们的团队是非常精神饱满的去做这个项目,不光是硬件,我们需要算法做各种条件下面的路面目标检测,比如车和行人,我们还需用 OCR 技术识别交通标志,还有集成配准各种传感器的信息,形成统一的路况感知。

2014-09-09 07:534576
用户头像

发布了 501 篇内容, 共 232.6 次阅读, 收获喜欢 54 次。

关注

评论

发布
暂无评论
发现更多内容

一文搞懂三级管和场效应管驱动电路设计及使用

不脱发的程序猿

28天写作 电路设计 三极管 3月日更 场效应管

GO训练营第10周——日志&指标&链路追踪

Glowry

快点来学吧!Android性能优化面试题集锦,深度解析,值得收藏

欢喜学安卓

android 程序员 面试 移动开发

Python 生成 QR 二维码

HoneyMoose

跟我学ModelArts丨探索ModelArts平台个性化联邦学习API

华为云开发者联盟

AI 联邦学习 API 华为云 modelarts

电子门锁没电的解决办法

孙叫兽

生活 程序人生 电子锁

拍乐云推出“实时标注”,助力少儿编程、在线金融等行业场景实现高效互动

拍乐云Pano

音视频 在线教育 互动白板 实时标注 在线金融

源中瑞智慧社区解决方案,社区服务平台

13530558032

区块链电子发票平台,区块链电子发票优势

13530558032

如何批量下载YouTube视频到本地

科技猫

软件 音视频 经验分享 资源分享 工具分享

【前端面试题】关于一些js的一些面试题(金融行业),我和面试官扯了三个小时

孙叫兽

JavaScript 大前端 金融 笔试题

论文免费开源:NB-IoT智慧路灯监控系统

不脱发的程序猿

28天写作 论文 3月日更 NB-IoT智慧路灯 大学生毕业

Java面试必看!阿里(嵩山版)分布式核心原理笔记来了

Java架构追梦

Java 阿里巴巴 架构 面试 架构分布式

看了上百份面经,发现每次面试的问题都逃不过这几方面

yes

面试

冲击大厂!阿里P9纯手打Java面试小抄(21版)在GitHub上已获80万star

Java 程序员 面试

干货 | 万字详解整个数据仓库设计体系

五分钟学大数据

大数据 数据仓库 28天写作 3月日更

【LeetCode】设计停车系统Java题解

Albert

算法 LeetCode 28天写作 3月日更

使用“零信任”,不惧“内部威胁”!

龙归科技

管理 数据完整性 零信任 内部威胁

安卓嵌入式底层开发!整理出这份8万字Android性能优化实战解析,已开源

欢喜学安卓

android 程序员 面试 移动开发

2021 年要了解的 34 种 JavaScript 简写优化技术

LeanCloud

JavaScript 面试 大前端

寻找被遗忘的勇气(十九)

Changing Lin

3月日更

在线数据迁移,数字化时代的必修课 —— 京东云数据迁移实践

京东科技开发者

数据库 数据迁移

一个合格的CloudNative应用:程序当开源软件编写,应用配置外置

华为云开发者联盟

云原生 华为云 Cloud Native CCE CSE

智慧党建信息管理平台系统建设

13530558032

2B营销路径: 9大步骤自我拆解

boshi

营销数字化 七日更

LeetCode题解:213. 打家劫舍 II,动态规划(不缓存偷盗状态),JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

收藏!Linux常用命令合集

roseduan

Linux

「面试高频」秒杀架构的设计套路,你值得拥有

我爱娃哈哈😍

架构设计 架构设计实战 秒杀架构

EGG Network公链技术创新,EFTalk打造高效全能公链

币圈那点事

区块链

Java 和 Python 关于 % 的那些坑

与你一起学算法

Java Python

2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)

比伯

Java 编程 架构 面试 程序人生

余凯谈百度大脑与深度学习最新发展_百度_崔康_InfoQ精选文章