中科院院士张钹提出人工智能“四要素”:知识、数据、算法与算力

2020 年 7 月 09 日

中科院院士张钹提出人工智能“四要素”:知识、数据、算法与算力

2020 年 7 月 9 日,世界人工智能大会云端峰会以“智联世界 共同家园”为主题,以“高端化、国际化、专业化、市场化、智能化”为特色,集聚全球智能领域最具影响力的科学家和企业家,以及相关政府的领导人,围绕智能领域的技术前沿、产业趋势和热点问题发表演讲和进行高端对话。会上,中国科学院院士、清华大学人工智能研究院院长 张钹教授发表演讲《迈向第三代人工智能》。以下为 InfoQ 带来的现场报道(直播链接: https://ai.worldaic.com.cn/ )。


以下为演讲实录,内容未经本人确认,由 InfoQ 依据现场视频进行整理:



第一代人工智能


张钹院士介绍到,第一代人工智能主要依靠知识驱动,从而对问题进行推理、决策等等。


一个比较知名的案例就是 1971 年,斯坦福大学建立的专家系统,通过将医生诊断的过程作为推理机制放进计算机,并以此来诊断血液传染病。由于内科医生都不是专业的传染病专家,因此这样的计算机辅助系统可以帮助医生做诊断。


而第一代人工智能最具代表性的成果,就是 IBM 推出的深蓝国际象棋程序,它在 1997 年打败了当时的世界冠军卡斯帕罗夫。



张钹院士认为,深蓝成功的秘诀有如下几点:



它据有知识与经验,因为它已经学习过 700000 盘象棋大师下过的棋局,并且有象棋大师参与对 8000 个评价函数参数的调试;此外,深蓝采用了α-β剪枝算法,同时还有 IBM 为它提供的强大算力,使它能够以平均每秒 8-12 步的搜索深度进行“思考”,这远非人类象棋大师能做到的。


总结起来,第一代人工智能优势如下:



但是,第一代人工智能的缺陷也很明显:



因此,为了能够解决更多复杂的问题,第二代人工智能出现了。


第二代人工智能


张钹院士介绍到,第二代人工智能就是以深度学习为代表的智能技术。



它能够模拟人类的感知,但是没法像人类学习知识一样。以图像识别为例,首先要给模型输入大量的图片,告诉它长成什么样的是马,这样模型才能学会分类;然后再用没训练过的图片进行输入,让模型进行识别,如果可以识别,则说明它的识别率达到了某一高度,通常用百分比来表示。


仅从图像识别或语音识别领域来说,现在不少模型已经可以达到或超过人类水平,比如著名的 ImageNet 比赛,2015 年微软推出的识别系统其误识率已经低至 3.57%,远低于人类 5.1%的误识率。



详细来说,深度学习优势有以下两点:



也正因如此,深度学习受到了更加广泛地关注。


应用深度学习最典型的例子,要数著名的围棋程序 AlphaGo 了。



从 2015-2017,短短三年的时间里,通过深度学习的应用,使得 AlphaGo 从业余 5 段水平成长到到专业棋手水平,从专业棋手又升级成世界一流的高手,最后,AlphaGo Zero 的诞生更是击败了以前的 AlphaGo,成为了超世界水平的围棋高手。


张钹院士分析道,AlphaGo 的成功来自三个方面:数据、算力、算法。



与深蓝一样,它也大量地学习了围棋大师的棋局,还有更加丰富的算法作为支撑,同时它也拥有在当时相当强大的算力来进行处理。


但是,第二代人工智能仍然有一些局限性:



张钹院士举例说明:下图中的雪山放在已经训练过的模型中,模型认为这座雪山有 94%可能性是阿尔卑斯山,然而当研究人员在其中加入了很小的噪声干扰后,模型就将雪山错误地识别成了狗:



张钹院士说:“深度学习虽然识别率很高,但是它不够安全、不够可靠,且不可解释。”


第三代人工智能


由于前两代人工智能都各有优劣,因此,第三代人工智能要解决的问题就是:



张钹院士认为,只有从技术上取得突破,才能推进创新应用,因此,综合第一代知识驱动型 AI 与第二代数据驱动型 AI,张钹院士提出了第三代人工智能的四要素:知识、数据、算法、算力


张钹院士也举了几个例子来对第三代人工智能进行了简要说明。



计算机如何识别一匹马?前两代人工智能的方法是:将马的局部特征分析出来,与其他动物作比较,通过局部特征进行区别,即黑箱学习。


但是,这样的 AI 只能学习局部,不能进行高级学习,因此张钹院士认为要要借鉴人脑的模型。



他介绍到,仅仅是将人脑中稀疏放电这一特征放进模型中去,就可以看到系统能够分辨出人脸的轮廓,并检测出语义的特征。



但是,张钹院士也表示,目前在这一领域的研究还是初步工作,未来需要全世界一起努力,共同取得更大的进步。


虽然目前的 AI 系统在棋类游戏,这样的完全信息博弈中取得了不错的成果,但是在牌类这样不完全信息博弈的游戏中,表现仍然比较弱。因此,需要在对抗环境中进行训练。



比如,张钹院士的团队就利用游戏对 AI 系统进行对抗训练,使其能够即时处理复杂多样的任务。



基于知识的强化学习,能够帮助模型进行更加正确的决策。



另外在自动驾驶问题上,张钹院士也建议加入知识,通过强化学习的方法进行训练,从而让无人车更好地应对突发情况,以及更加复杂的路况。


总结



在演讲的最后,张钹院士提到:人类智能最重要的表现就是随机应变,举一反三,因此要充分应用的只是数据、算法和算力,知识也是非常重要的一环。通过不断地解决不完全信息、不确定性、动态环境下的问题,人们离达到真正的人工智能才能更进一步。


张钹院士认为,第一、第二代人工智能不过是智能时代的序幕,而第三代人工智能才是大戏的开始,希望全世界能够一起努力,解决问题,取得进步。


2020 年 7 月 09 日 17:072221
用户头像
陈思 InfoQ编辑

发布了 555 篇内容, 共 189.7 次阅读, 收获喜欢 1064 次。

关注

评论

发布
暂无评论
发现更多内容

人生就是体会矛盾的过程

封不羁

成长 感悟

技术选型课程小结

行下一首歌

极客大学架构师训练营

golang内存对齐

PONPON

go golang go内存对齐

架构师训练营第六周总结

Melo

极客大学架构师训练营

Struct embedding in Go

Interstate5

golang time.Time dynamodb apigateway

依旧乐观的李彦宏,十年寻光的百度AI

脑极体

开发者必备——API设计问题

Noneplus

ArrayList源码阅读

慌张而黑糖

ArrayList 源码阅读

阿里四面你都知道吗?

java金融

Java 程序员 互联网 阿里 简历

Scala中如何优雅地实现break操作

吴慧民

scala

鲲鹏说:高考之路你们走,高考阅卷我来守

脑极体

redis系列之——分布式锁

诸葛小猿

Java redis 分布式 分布式锁

Hadoop大数据存算分离下,如何解决新旧存储共存?

XSKY融合存储

毕业三年了,我开始明白为什么说三年是一个坎

鄙人薛某

程序员 程序人生 程序员成长 职场回顾

统一物品编码破解追溯“断链”困局

CECBC区块链专委会

分布式缓存与消息队列

紫极

为了把握新基建风口,科技公司都在紧密筹备这件事...

极客时间企业版

数据库分片

Arthur

vagrant

飞翔

极客大学架构师训练营

如何学习Visual Studio Code

博文视点Broadview

学习 读书笔记 vscode 能力提升 编辑器

架构师训练营-作业5

紫极

这样的二维码,你见过吗?

诸葛小猿

Java Python 后端开发 二维码 myqr

typora设置图片自动上传,实现快速发文章

诸葛小猿

Typora PicGo gitee 上传图片

Newbe.Claptrap 框架入门,第一步 —— 创建项目,实现简易购物车

newbe36524

Docker Reactive ASP.NET Core

聊聊Spring的IOC以及JVM的类加载

小隐乐乐

CORS 和 CSRF 修炼宝典

pingan8787

前端 Web CORS CSRF

如何通过DDD构建一辆汽车

Winfield

领域驱动设计 DDD

信创舆情一线--5省发布区块链发展计划

统小信uos

区块链 舆情

啃碎并发(七):深入分析Synchronized原理

猿灯塔

Java

华为云FusionInsight MRS通过信通院大数据能力评估 单集群突破2万+规模

FI洞见

大数据 FusionInsight MRS 华为云

数据分析师成长体系漫谈-数仓模型设计

analysis-lion

学习 数据仓库 数据分析 随笔杂谈

中科院院士张钹提出人工智能“四要素”:知识、数据、算法与算力-InfoQ