写点什么

技术大神脑内的三重世界:打通不同维度,用数据驱动指数级增长

  • 2017-09-18
  • 本文字数:2208 字

    阅读完需:约 7 分钟

在由 TalkingData 主办的 T11 2017 智能数据峰会上,TalkingData 首席数据官黄洋成发表了主题演讲,以下是他的演讲概要。

这两年最热门的词是什么?我想没有异议,就是 AI。作为引领新一轮 AI 浪潮的标志性事件主角,AlphaGo 是指数级增长的一个典型案例。我们和国内顶尖的职业围棋培训机构葛道场有很多合作,从他们的经验来看,如果要想成为一个职业围棋选手,这还不算顶级选手,最晚也要从六岁到七岁开始学棋。即使是像柯洁这样的奇才,从五、六岁学起,到成为世界冠军也需要十多年的时间。而 AlphaGo,前年最初连樊晖这样不太知名的围棋职业选手都无法战胜;而短短几个月后,到去年已经可以击败李世石;再到今年以 Master 的身份复出,人类围棋选手已经完全没有抵抗之力。这些都让我们看到,与人类的学习速度相比,AlphaGo 的学习速度可能在几个月时间内就能顶上人类几十年,棋力的进展绝对是指数级的。

我们回来看看 AlphaGo 为什么这么厉害?首先我们来看看要是在物理世界里有没有可能演化得这么快?我们知道在物理世界中,大家都学习过的牛顿第一定律表明,引力和质量成正比,这是一个线性的关系,也就是说我们的物理世界总体是由线性的规律主导的。所以,即使你可以造一台下围棋非常快的机器,每秒可以移动 1000 个棋子,也不太可能造出 AlphaGo。

AlphaGo 广为人知的三个部分分别是策略网络、价值网络和蒙特卡洛树搜索。策略网络所代表的是人类的经验、历史的经验。从公开的论文来看,AlphaGo 的策略网络准确度基本在 57%。这个比喻未必特别精确,但类比考试成绩,如果期末考试才考了 57 分,这在人类世界不是特别可以拿出手的成绩,这说明什么?说明这个策略网络和人类可以学到的相比并不是特别厉害。

让我们再来看看价值网络,做过计算机围棋的都知道,这个价值网络特别不好训练,很难获得一个质量特别好的结果;也就是说价值网络评估当前棋局形势的能力其实也不如人类。策略网络和价值网络都不如人类,那为什么 AlphaGo 还能这么厉害?所以最根本的还是在于它使用的蒙特卡罗树搜索,这块能力比人强。人类每下一步棋,能考虑到几十步已经是顶尖的高手,但 AlphaGo 却可以搜索几十万、几千万、几亿步。

咱们再来看看商业,在传统零售领域有一个经典的模型——人、场、货。去掉字面的意思看内涵,这个模型可以推广到所有商业。人,代表了需求;货,就是产品、代表供应;场,是供与需的匹配。这几年互联网对传统商业模式的冲击非常大,互联网 + 已经上升为国家策略,为什么在与传统商业的竞争中,互联网会有巨大优势?互联网没有解决供应的问题,也没有改变人的需求,但是解决了匹配的问题。放眼看过去,大部分的互联网企业都是在做匹配。互联网企业在匹配上能够比传统商业做的更好,背后方法也与 AlphaGo 的例子类似,都是将物理世界建立的模型投影到计算机的数字世界,然后利用由摩尔定律支撑的指数级增长的计算力,在数字世界中进行无限的模拟、探索,并且结合以往的经验找到更好的方案,再把这个方案反过来应用到现实世界中,并从现实世界获得真实即时的反馈,并用于在数字世界中找到更好的方案。

就像 AlphaGo 从与樊晖试棋,再到在网上与邀请的顶级围棋选手对弈,都是期望通过现实棋局得到真实的反馈,再回到数字世界中找到更好的解决方案。

日前,还有一个特别火爆的领域,那就是自动驾驶。像谷歌,做自动驾驶近十年时间,积累的路测数据有几百万英里;特斯拉每年卖出几万辆汽车,号称路测数据积累了上亿英里。然而根据专家的估计,想让自动驾驶汽车能够可靠地上路行驶,最乐观的估计也需要至少 100 亿英里的路测,这对企业来说几乎是不可能实现的。现在很多自动驾驶企业都建立了模拟系统,在数据世界搭建一个虚拟世界,例如谷歌已经把凤凰城完全数字化,自动驾驶系统可以在这个虚拟世界中每天行驶超过几亿英里。

这样做的好处是,在现实的、线性的世界中,试错的成本非常高。而通过数据的方法在虚拟数字世界中建立一套与现实世界对应的模拟,利用计算机强大的计算能力去尝试各种可能性,尽量找到最好解决方案,再应用到现实世界中,这样可以极大的提高迭代速度。

观察这三个例子,我们可以发现他们有一种共同的模式,那就是建模,投射,探索,应用和反馈;这就是数据驱动方法的基本框架,而其成功的核心,则是试错的成本和迭代的速度。

最后回到现实的商业中,有没有可能在商业中应用类似的方法?目前大部分的商业活动还是处于线下。如果应用像刚才说的方法,首先要做的,就是在数字世界中建立一套对物理世界的投影,把物理世界数字化。坦率说,目前世界上在这方面的探索还没有做得特别好。这也是我们今年在硅谷设立感知计算实验室的原因;感知计算实验室的使命就是尽可能的把这个世界数字化。

让我们再看看另一面,目前我们记录下来的都是用户的行为,但这个世界除了计算机领域的数字世界、我们生活的物理世界,其实还有每个人大脑中的思维世界。而人的行为,其实都是由大脑中的世界驱动的。那我们有没有能力把每个人大脑中的世界也数字化呢?这是比我们以往做的更前沿、也更少人去做的事情;而人本实验室的使命就是试图去解决这些问题。

综上所述,对于奇点大学执行总裁 Kian 先生所讲的“指数级增长”,我不知道有多少方法可以去实现,但是我们知道,数据的方法是一种已经被证明的可以支撑这种指数级增长、指数级迭代、指数级创新的方法。所以,最后也希望能和大家携手,一起用数据的心智,知机领变,共同开创一个指数级增长的新世界,谢谢。

2017-09-18 20:361482
用户头像
张晓楠 InfoQ总编辑

发布了 144 篇内容, 共 104.7 次阅读, 收获喜欢 378 次。

关注

评论

发布
暂无评论
发现更多内容

Golang领域模型-六边形架构

奔奔奔跑

微服务 领域驱动设计 架构设计 Go 语言

物理实现(Physical Implementation)

老壳有点爽

芯片 集成电路 IC 物理设计 PI

中国大陆芯片行业发展概况

老壳有点爽

芯片 集成电路 IC

魅力非凡的半导体电路行业

老壳有点爽

芯片 集成电路 IC 芯片营销

半导体行业个人理解

老壳有点爽

芯片 半导体 集成电路 IC

sed语言学习技巧(1)

老壳有点爽

vim 编程语言 sed 脚本语言

商业计划书制作(1):商业计划书的信息需求

老壳有点爽

创业 商业计划书 信息需求

PySpark RDD 基础运算和操作总结

是老郭啊

spark pyspark RDD

2020深圳站-GIAC全球互联网架构大会PPT分享

九叔(高翔龙)

架构 分布式系统 服务治理 大型网站演变 全链路压测

数字后端工程师发展六阶段

老壳有点爽

芯片 集成电路 IC 数字电路工程师

区块链之物流产业上链解决痛点

CECBC

区块链 供应链

集成电路工艺基础介绍

老壳有点爽

芯片 集成电路 IC 工艺 制程

数字电路后端设计流程

老壳有点爽

设计 flow 集成电路 IC

世界集成电路发展概况

老壳有点爽

芯片 集成电路 IC 芯片营销

芯片行业基本生态:设计生产封装的行业分工

老壳有点爽

芯片 集成电路 IC

MySQL DDL详情揭露

Simon

MySQL

Linux指令简述&vim引入(1)

老壳有点爽

vim Linux 脚本

MySQL备份与恢复场景示例

Simon

MySQL

成都信息工程大学的区块链工程成全国首个区块链工程本科专业

CECBC

区块链技术 区块链工程

芯片行业的主要生意模式

老壳有点爽

芯片 集成电路 IC

IC设计流程及工具

老壳有点爽

芯片 集成电路 IC IC设计流程及工具

Vim小技巧(2)

老壳有点爽

vim Linux 脚本语言

看门狗 | 分布式锁架构设计方案-01

九叔(高翔龙)

redis 分布式锁 RedLock WatchDog

看门狗 | 分布式锁架构设计方案-02

九叔(高翔龙)

redis 分布式锁 Jedis RedLock

最初芯片国产化是怎么来的?

老壳有点爽

芯片 集成电路 国产化 替代

Verilog 的debug技巧(1)

老壳有点爽

芯片 集成电路 IC Verilog 电路

Python 核心技术与实践 input&output

Bonaparte

强势入局,区块链专利将成为银行下一个战场?

CECBC

区块链 金融 银行

集成电路设计概括

老壳有点爽

芯片 集成电路 IC

模拟电路设计工程师发展九段

老壳有点爽

集成电路 IC 芯片设计 模拟电路

sed 语言学习技巧(2)

老壳有点爽

vim sed 脚本语言

技术大神脑内的三重世界:打通不同维度,用数据驱动指数级增长_大数据_张晓楠_InfoQ精选文章