1982 年,日本通商产业省(现称经济产业省)发布了一项重磅的研发计划:开发一部划时代的电脑,利用大量平行计算,使它拥有超级电脑的运算效能和可用的人工智能能力。名字中的“第五代”用于指明它将会是具划时代意义的电脑。
这个看上去宏伟的计划最后却以失败告终。近日,一位科学家对第五代计算的一篇回顾文再次引发了讨论,作为亲历者,Scott Locklin 对这一事件的起因、过程、影响发表了自己的一些看法。或许年代有些久远,但第五代计算机依旧是计算机科学历史上值得记住的一个特殊阶段。
Dominic Connor 的一篇文章,让我想起了当初每个人都热烈讨论过的“第二次 AI 寒冬”——也就是“第五代计算”。那时候我虽然已经出生了,但对这事并没有太大的感觉,只记得在科普杂志上读过“第五代计算”这类话题。
当时是 1982 年,咱们不妨先聊聊那年发生了什么事情,也帮屏幕前年纪较长的朋友们找找回忆。
那年的大事包括:泰诺感冒药恐慌、Bell Systems 与 Bell Labs 强制拆分、福克兰群岛战争、疯狂的暴风雪、首例人工心脏手术、Sun Microsystems 成立、Commodore 64 发布。从这一年起,人们开始谈论个人机器人助理;雅达利公司创始人 Nolan Bushnell 建立起一家个人机器人公司。上一年刚刚发布的 IBM PC,在这一年中售出了 20 万台,MS-DOS 1.1 版本也已经与用户见面。英特尔 80286 处理器在这年早些时候推出,成为首批具备内存保护与硬件支持的多任务微处理器之一。最后,Thinking Machines 公司正在筹备当中——这家于 1983 年正式建立的公司希望推动大规模并行计算,这也正好对应当时的“第五代计算”威胁论。
那时候,“AI 革命”也正在孕育当中;各个企业开始大量引入所谓专家系统 shell——Xcon、Symbolics 以及 Lisp Machine 等初创企业的表现也令人振奋。就在几年之后,终极专家系统 Cyc 也将正式面世。
年轻的朋友可能不信,当时对这类产品的炒作可要比现在夸张得多;您可以回头翻翻当初的电脑以及金融杂志,体会体会个中风味。基本上就是这样了,总之都是些看起来像是数学软件一样的东西。Wolfram 成为唯一一家挺过了八十年代的“AI”企业,他们的主要业务是复制七十年代的“AI”符号代数系统,并使用“现代”C++语言重现 Lisp 中的某些重要部分。
另外,日本当时正以前所未有的方式冲击着美国作为工业强国的霸主地位。人们感到害怕:我们虽然在第二次世界大战,也就是 37 年之前战胜了日本,但他们如今在汽车技术与消费级电子产品方面又卷土重来。初尝胜利果实的日本人希望把握下一次计算机革命,而 1982 年的美国当然也不愿放弃这项战略目标。在这样的背景下,人们开始狂热地追捧一切大肆宣传下的技术成果:人工智能、大规模并行计算、数据库、经过改进的平版印刷术以及 prolog 语言等等。他们希望把这些整合起来,再加上可观的资金投入,最终建立起第一台拥有感知能力的机器。
当时,科学界有过一些关于第五代计算机的预测:
第五代计算机将采用超大规模集成芯片(可能选用非冯-诺依曼架构)。
这些计算机将拥有人工智能。
它们将能够识别图像与图形。
第五代计算机旨在解决包括决策以及逻辑推理在内的高复杂度问题。
它们将能够使用多个 CPU 以加快处理速度。
第五代计算机能够处理自然语言。
很明显,第五代计算机的设计目标是将《星际迷航》中的那种先进计算设备变成现;这种半感知型机器将能够以对话方式与用户进行交谈。
人们害怕得不行。虽然那时候我年纪还小,但仍记得那种恐慌的感觉。自由市场就要结束了!我们都会成为日本的奴隶!工业社会将就此终结!DARPA(美国国防高级研究计划局,Defense Advanced Research Projects Agency)开始将高达 80 亿美元资金投入到名为战略计算计划的项目当中,希望解决日本崛起带来的挑战(有趣的是,当时无人驾驶汽车还没有被提上议事日程)。大多数美国半导体企业以及各主要框架供应商开始进行投资合作,希望阻止那些“邪恶”的日本人并防止“珍珠港事件”在 AI 领域再次发生。
最终的合资产物名为微电子与计算机技术公司(简称 MCC),它的历史曲折而有趣,研究技术发展史的研究生完全可以用它来写上一篇毕业论文。总之,日本提出的第五代计算概念太重要了,就连英国人(当时英国在半导体技术领域还有一席之地)都建立起自己的“Alvey 计划”,并为其投入了相当于现在 10 亿英镑的资金。不甘落后的前欧盟各国也拿出了类似的资金,建立起所谓 ESPIRIT 项目。
译注:阿尔维计划是英国发展高级信息技术的计划。面对美国和日本在信息技术方面的挑战,英国政府于 1982 年成立了以阿尔维任主席并以其姓氏命名的阿尔维委员会,负责制定和实施发展高级信息技术计划。包括软件工程、人机接口、智能系统和超大规模集成电路等领域,共 150 个研究项目。该计划从 1983 年开始,研究期为 10 年,投资 3.5 亿英镑旨在通过大学与工业界的密切合作,发展英国的高级信息技术工业。该计划直接费用由 3/4 由政府提供,其余由工业界资助。
Prolog(Programming in Logic)在当时自然就是代表未来科技的编程语言。那个时候,prolog 的地位跟现在的深度学习差不多;它采用约束编程、数据库(对于超灵活数据库查询需求来讲,prolog 直到现在也是种不错的选择)、并行架构以及专家系统 shell 等技术。不用废话,prolog 就是实现感知机器的希望。但多年的实践证明,prolog 本身并没有那么强大:由于语言的一些天然特质,prolog 存在极高的不确定性,而且经常被 NP 问题难倒。在这种情况下,无论并行模型多么强大,计算机都无法回答我们的问题。
关于第五代计算机,还有个情况让人印象深刻,就是所有人都认为这一定会实现——完全不容置疑。他们真的认为当下我们所做的就是未来,把最新最流行的理念搅拌在一起,然后就能实现足以模拟大脑的人工智能。那些没尊严的计算机科学家们纷纷跳出来表示:“嘿,虽然大规模并行计算可能无法很好地映射到约束求解器上,也许有些愿望我们甚至连基本实现思路都没有。但这可是第五代计算!”这是我第一次感觉这些所谓拥有严格学术纪录的研究人员,整体上表现得如同性工作者——就为了一点研究经费,他们就可以放下自己的所有坚持。好吧,我承认这样的比喻对性工作者是种冒犯,毕竟人家能够提供真正的服务。
更直白地讲,事实证明第五代计算当中并没有什么真正重要、有用甚至是理性的成果。好吧,可能 VLSI(超大规模集成电路, Very Large Scale Integration)以及 DBMS(数据库管理系统,Database Management System)确实出现在这一时期,但却并不是第五代计算的直接产物;至于其余部分,则完全就是荒谬可笑加上阿谀拍马的杂糅混合。举例来说,不知何故,他们认为光学数据库将能够实现图像搜索。直到现在我也理解不了他们的思维方式,因为这听起来更像是那些不懂技术的官僚做出的狂妄论断。下面再来看看其它例子:
“目标(Moto-oka 1982 p.49)描述了一种架构开发方式,主要关注内存结构,旨在使用关系代数作为数据库系统基础以处理集合操作。”
“目标(Moto-oka 1982 p.53)描述了一种分布式功能架构的开发方式,其具有高效率、高可靠性、结构简单、易于使用、且能够适应未来技术与不同系统级别的要求等特性。”
“目标是:关系数据库机器,容量为 100 GB,每秒处理 1000 次交易;实践,1000 GB 容量与每秒 10000 次交易。8.3.3 节详尽阐述了这种采用数据流技术的关系数据库机器实现方案。”
“目标(Moto-oka 1982 p.57)描述了一种能够输入与输出字符、语音、图像、图片并可与用户进行智能交互的系统。字符输入/输出的目标是:当前,以四到五种字体支持 3000 至 4000 个汉字;未来,支持用户语音输入,以及假名与汉字字符间的翻译。图像输入/输出的目标是:当前,输入 5000 x 5000 到 10000 x 10000 分辨率的元素;未来,智能处理图像输入。语音输入/输出目标:当前,识别 500 到 1000 个单词;未来,智能处理语音输入。这套系统还将把上述功能集成至多模个人计算机终端当中。”
“The Fifth Generation plan is difficult and will require much innovation; but of what sort? In truth, it is more engineering than science (Fiegenbaum & McCorduck 1983 p 124). Though solutions to the technological problems posed by the plan may be hard to achieve, paths to possible solutions abound.第五代计划非常困难,需要大量创新;但具体是怎样的创新?事实上,其更多属于工程学而非科学的产物(Fiegenbaum & McCorduck 1983 p 124)。虽然该计划提出的技术问题可能很难利用现有解决方案实现,但仍存在众多其它可行的潜在实现途径。” (这话怎么听着那么耳熟呢?)
那时候的出版物中充斥着这样的屁话,其内容毫无可取之处,能看到的只有荒谬的愿望和干干巴巴的现实。就像下面这张图:
这里可能有很多教训值得我们吸取。当初的第五代计算完全是种自上而下的发展思路。我不知道日本那边是谁提出这个鬼主意,他们可能借此成为名噪一时的科学家,但后来应该是很快变得寂寂无名、甚至因此受到惩罚。当然,他们也有可能搬到了美国,发现这里聚集着一大堆捧其狗屁为圭臬,在毫无产出的虚假市场里上窜下跳的家伙。这些人最喜欢充满玄学气氛的话题,并借此迎合着整个国家充满宗教倾向的妄想。
当然,这里我并不是指责日本:到目前为止,他们取得的大部分成功都来自自上而下式的产业政策,用以指导优秀的工匠们实现国家目标。但其中的问题是……日本的计算机行业从来没有真正出现过影响世界的大工匠,而这也给了当初提出第五代计算概念的小丑们可乘之机。正如 10 年之前的纳米技术概念、量子计算或者无人驾驶汽车一样,他们让整个科学界陷入了“纳斯鲁丁的驴子”怪圈(故事里,纳斯鲁丁的驴子总要朝着相反的方向前进,所以纳斯鲁丁决定一切顺着驴子,这样反倒显得这头驴温驯听话)。
日本这次扮演了一把江湖骗子的角色,整个世界也被忽悠得够呛。唯一受益的,就是那些鼓吹第五代计算概念的计算机科学家们。听起来很熟悉吧?一般来讲,自上而下式方法在大规模项目当中总会造成某些荒谬的影响——不够坚实的能力基础与拍脑袋想出来的动机,决定既有研发方向根本不能起到良好的导向性作用。
换言之,自上而下式方法比较适合解决单一问题,或者是能够被分解成明确阶段的特定任务——例如登月计划以及曼哈顿计划,这二者都有着风险相对较低的成功路径。而且无论是在 1982 年还是在 2019 年,说起要建立一台能够实现智能对话的计算机,这就像是在 1492 年想要飞上月球或者开发一款网络浏览器。是的,根本就不存在能够以当前情况为基础,逐步推进至预期结果的路径。从现在的角度来看,真正的“人工智能”仍然像 1982 年时一样更像是种戏法,而且没人知道要如何实现。
另一项要点在于,人们希望解决的很多实际问题,其最终解决依靠的都是某些增量化方式。就以人机交互为例,之所以强调所谓智能对话,就是为了扩大能够使用计算机的人群规模。历史告诉我们,攻克这个问题的办法绝不是当初人们想象中的构建先进模型、提升机器智能程度、实现人机自然语言对话并让普通最终用户学会使用电脑。相反,成本更低的网络工作站使得图形用户界面快速普及,最终以更简单的方式搞定了一切。有了图形用户界面,普通群众也能运用计算机的一部分力量。当然,界面的设计中仍然需要引入一些心理学要素,免得傻傻的普通用户弄不懂该怎么使用。但在整体原则上,这种“自下而上、小额投入、培养人类”的方式确实完成了计算机普及化这一伟大的工作,并产生了数万亿美元的价值。
就在第五代计算大红大紫的短短两年之后,苹果公司就推出了采用图形用户界面的微型计算机。最终,几十年之后,有人开发出一台由微型计算机构成的智能机械,其实现了第五代计算提出的诸多目标,而且具有独立的图形用户界面前端。我相信当时的日本研究人员会惊讶于,这只是一台使用 C++、排序以及哈希表的普通商用微型计算机,而不是他们想象的“非冯-诺依曼”式 prolog 超级计算机。但这正是人类工程学中最伟大的进步:增量。把登月工作留给真正的科学家(而不是「计算机科学家」),他们至少能理解自己说出来的话。
延伸阅读
[1]1988 年关于第五代计算概念在日本大受欢迎的文章:
https://www.nngroup.com/articles/trip-report-fifth-generation/
[2]1992 年《纽约时报》发表的项目失败文章:
https://www.nytimes.com/1992/06/05/business/fifth-generation-became-japan-s-lost-generation.html
[3]几年之后,五位诚实的人共同探讨了 AI 寒冬的问题;但这些项目仍在不可阻挡地向前推进。这是一份了不起的历史文件,其中一些思考与观点直到今天仍然极具现实意义:
https://www.aaai.org/ojs/index.php/aimagazine/article/view/494
[4]Nick Szabo 发表的一篇关于技术前沿的文章:
https://unenumerated.blogspot.com/2006/10/how-to-succeed-or-fail-on-frontier.html
评论