8月24日,北京智源人工智能研究院在京举办了人工智能的认知神经基础发布会。会上,智源研究院发布了重大研究方向——“人工智能的认知神经基础”,以跨学科交叉方式进一步夯实人工智能的科学基础。来自清华大学的智源“人工智能的认知神经基础”方向首席科学家刘嘉教授对认知神经基础重大研究方向规划进行了分享。以下内容根据刘嘉教授的演讲整理而来,未经本人确认。
认知神经科学基础 ABC:AI of Brain & Cognition
刘嘉教授认为,认知神经科学是三种学科的组合,他用了三个字母来概括:ABC(AI of Brain & Cognition)。这个缩写包含了两层含义,第一层含义是指这三个学科的组合,意味着认知神经科学是在交叉的学科里面,希望在这个交叉学科的交叉点中做一些有意义的探索;第二层含义是指 ABC 这三个字母所代表的意思,就像英文中我们总是从 ABC 开始学起一样,这三个领域的学者即便在各自领域中有了一定的知识积累,但是进入到认知神经科学这个交叉领域后,他们会抱着虔诚的态度,从零开始,希望能为人工智能的下一步发展给出一点新的启发。
目前,OpenAI的GPT-3受关注度极高。很多人认为 GPT-3 是万能的,能做很多事情,很多 AI 从业者都会把它称之为“暴力美学”,至少现在大家会认为它已经达到了一个巅峰。实际上,训练 GPT-3 的是一台超级计算机,从其计算性能上来讲,在 Top 500 中它能进入到前五名;从架构上来讲,GPT-3 有 1750 亿个参数,比上一代高出两个数量级;从训练数据上来看,英文维基百科大约有 600 万篇文章,仅占其训练数据集的 0.6%;同时,它也特别烧钱,即使投入了大量经费,但也不够一次训练的费用,它一次训练的费用是 460 万美元,如果换成 GPU 的时间,那么一个 GPU 要不停地跑 355 年。
这样一个极其烧钱、庞大的系统,它的功效也是惊人的。人们发现可以利用它做编程、可以诊断和开药,甚至还能当成搜索引擎。就在人们为它感到兴奋之时,一些测试者慢慢发现了一些问题。
我们之所以觉得它非常智能、非常聪明,是因为我们一直在问它一些智能的问题,GPT-3 会根据我们提出的智能的问题找到人类以前给出的智能答案,如果我们问它一些弱智的、人类从不会问起的问题,它究竟会给我们什么样的回答?
比如你问它:“你的脚有几只眼睛?” 它会回答:“你的脚有两只眼睛。”
面对这种弱智的提问,“暴力美学”的 GPT-3 也给出了弱智的回答。
这也正好可以回应当年爱因斯坦说过的一句话:“任何一个傻瓜都可以知道,但是关键点是理解。”GPT-3 之所以能够做出这些不恰当的回答,不是因为它的训练数据不够,是因为它知道但并没有真正地理解什么是眼睛,并没有关于眼睛的尝试,它仅仅是把知识链接在一起来回答问题,它更多的是一个联想的模型。
我们再来看一个感知的例子,下图是一个动画,我们看到了都会有一个反应,AI 的反应就是一个人从柱子上掉下来,显然这不是人的第一反应。人的第一反应是痛,太痛了。那么,AI 和人类两种回答的差别就在于,人是有共情和同理心的。
AI 的鼻祖之一 Marvin Minsky 曾说过:“现在的问题不是计算机是否能拥有情感,重要的是一个没有情感的计算机是否能够拥有智能。” 也就是说,他认为,情感(Emotion),是机器能能够变得智能的一个先决条件。
再来看一个推理的例子,我们经常能在美国片子中看到黑手党的对话。一个黑手党对一个蛋糕店老板说:“你的蛋糕店太漂亮了,但是如果一把火把蛋糕店烧掉了,就太可惜了。”显然,黑手党背后的意思是让蛋糕店老板尽快交“保护费”,如果不交,就会一把火烧掉蛋糕店。这背后我们看到是存在个推理逻辑的。这对我们来说很容易,但是对 AI 来说却很难。
简单地把感知、理解和推理总结起来,就可以总结为笛卡尔在 400 年前说过的一句话:
在很多情况下,机器可以做很多很好的事情,甚至超越人类,但如果要让这台机器去做其他事情的时候,它会失败。最主要的原因是,机器之所以能完成某件事,并不是因为它理解怎么去做这件事,而它只是按照预设的路径来做。
但时至今日,我们仍然没有教会机器如何去理解、推理。
如何实现智能?
那么如何实现智能呢?有两种途径:第一种是所谓的暴力美学,数据不够就增加数据,就像 GPT-3 一样,未来相信就会有 GPT-4、GPT-5,这是一种思路,刘嘉教授认为,这种思路也许能成功。但是也可以换一种视角,看看生物智能是怎么做的。生物智能能实现很多目标,并不是要依赖非常多的神经元或者暴力美学来解决事情。有 302 个神经元的线虫和有 860 亿神经元的人类都能完成生存、繁殖后代等任务。
如果我们把通用人工智能定义为三个条件:第一、多任务,能做很多事情,不仅仅是单一的事情;第二、具有鲁棒性;第三、能够适应多种环境的存在,那么,基于以上理论,无论是线虫还是人类,并不是说有多少神经元,而是这种简单的结构,就能拥有一种通用智能。
未来,希望基于脑科学、认知科学能为 AI 探索出新的方向或者说提供一个新的思路。
实施框架和路径
目前,认知神经的实施框架大致分为三个框架外加一个底层支撑的平台。
未来,我们要将神经科学、认知科学和计算科学进行交叉融合,加强人工智能和脑科学的双向互动和螺旋发展,揭示生物智能系统的精细结构和工作机理,构建功能类脑、性能超脑的智能系统,以视觉等功能和典型模式动物作为参照物测试智能水平,为人工智能未来发展探索可行道路。
演讲嘉宾介绍:
刘嘉,美国麻省理工学院博士,清华大学基础科学讲席教授,智源“人工智能的认知神经基础”方向首席科学家。
评论