IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?

2019 年 2 月 13 日

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?

北京时间 2 月 12 日早上 9:00,一场特殊的辩论赛在美国举行,IBM 研发的 AI 辩手 Project Debater 迎战人类辩手。四次荣获艾美奖,同时也是辩论节目“Intelligence Squared”主持人,John Donovan 主持本次比赛。经过将近 1 小时的激辩,比赛最终以人类选手获胜而落下帷幕。以下是详细报道。


“机”不如人,AI 辩论尚差火候



主持人 John Donvan


人机辩论赛的规则是这样的:参赛双方在赛前均不知道辩论的题目,所以选手无法进行提前准备,这也就增加了比赛的难度,最终的结论将由观众以投票的方式进行判决。



Project Debater 与 Harish Natarajan


辩论的话题为:是否应该对学前教育进行补贴。人类辩手 Harish Natarajan 迎战,Harish 是剑桥大学的硕士生,曾在牛津大学获得政治、哲学和经济学学士学位,目前是剑桥联盟协会的现任辩论官,曾获得 2012 年欧洲辩论冠军。



辩论话题:是否应该对学前教育进行补贴


这场辩论赛除了吸引不少现场观众外,还在线上引发了超过 5000 人同时观看及讨论。在比赛刚刚开始的时候,就有好事者问观看的网友:支持 AI 还是人类选手?不知是出于恶搞的目的还是真实的想法,有不少人都为 AI 打 call。



最终的结果可能让他们失望了,人类辩手守住了辩论领域的疆土,人工智能暂时无法在这一领域击败人类。不过,Project Debater 凭借强大丰富的知识库,让观众学到了更多的知识,在这一方面仍旧获得了较高的票数。



但是在一些观众来看,这场比赛仍旧是炒作大于实用的一场秀。


有网友评论道:辩论比赛本就带有较强的主观性,最终的比赛结果由观众投票决定,就这一点上来说,人为操作的可能性就增加了不少。如果一开始不告诉观众哪一方是 AI,通过匿名展示的方式进行辩论以及投票,或许更能体现出 AI 的水平。


AI 辩手:噱头 or 实用产品?


说起 IBM 的 Project Debater,作为一个 AI 辩手,这并不是它首次与人类辩手比赛。


Project Debater 于 2018 年首次亮相,当时它与两名人类辩论家 Noa Ovadia 和 Dan Zafrir 进行了辩论。主题分别是:“是否应该补贴太空探索费用”和“是否应该增加远程医疗的使用”。在那场比赛的过程中,Project Debater 不仅能够与其对手进行辩论,甚至可以与辩手开玩笑,并最终赢得了比赛。



在 CES 2019 大会上,IBM 也将 Project Debater 进行了展示,研发人员表示:众包演讲(Speech By Crowd)的应用前景很是广泛,小至训练校园辩论队、大至准备诉讼案件的论证,都可以在 AI 的帮助下完成。


研发人员认为,Project Debater 代表了一种新的 AI 挑战,因为 AlphaGo 相比,辩论是更具开放性的活动,这种根本差异具有重要意义。在复杂的棋盘游戏中,AI 系统可能会提出任何确保获胜的策略,即使一些棋路不能被人类所理解,而在辩论中,情况则完全不同, 人工智能系统必须适应人类理性,并提出人类可以遵循和理解的推理路线。


其次,与之前的棋类挑战形成鲜明对比的是,在辩论中,AI 系统无法依赖自然评分功能。个人行动的价值,即论据,往往具有内在的主观性;此外,甚至没有商定的客观指标来确定谁是赢家。Project Debater 证明人工智能可以在这个未知领域发挥重要作用,研发人员相信它将实现一种新颖的决策形式,将人与机器协同结合,让人们做出更明智的决策。


为了开发 Project Debater,IBM 研究团队必须赋予系统三个功能,每个功能都在 AI 中开辟了新天地:


1)数据驱动的语音写作和交付: Project Debater 能够消化大量语料库,并且给出一个有争议的主题的简短描述,写出结构良好的语音,并以清晰的方式进行表述,甚至在适当的时候加入幽默元素。


2)听力理解:识别对手长期连续口语中隐藏的关键概念和主张的观点。


3)对人类困境进行建模:以独特的知识表示模拟人类争议和困境,使系统能够根据需要提供原则性的论据。


专家观点:有意义的开始,仅限于开始


为了给各位读者更加深度的解读这场比赛,我们采访到了海知智能 CEO 谢殿侠先生,作为同行,谢殿侠老师也观看了这场比赛,在他看来,Project Debater 项目是个有意义的开始,但是也仅限于开始。


他认为,从积极的方面来看,Project Debater 对于长句子内容的语音识别、语义理解都是有一定进步的,它可以通过对海量语料进行搜索,从而抽取事实,形成一定的逻辑,对于具体观点可以推理判断与决策,这样的尝试是有意义的。


但是,这一切的前提是:仅限于命题辩论


8 分钟的发言,Project Debater 或许可以通过搜索进行文字匹配,促成有一定观点的回复,但是本质上来说,它并没有真正理解对手的论点和论据,普适性不够强,如果遇到开放性主题,最终呈现的效果可能差别会非常之大。


谢殿侠告诉我们,如果用棋类比赛的 AI 进行类比,目前的 Project Debater 就像早期的国际象棋选手“深蓝”,通过算力可以计算出一些结果,但是也仅限于国际象棋领域。如果遇到围棋这样充满变化的棋类游戏,深蓝或许也会“歇菜”,只有 AlphaGo 这样拥有学习能力,可以自我升级的 AI 才会称霸围棋游戏。


谢殿侠说,对于 Project Debater 这类 AI 来说,最终的发展目标是能够“自由辩论”的境界,然而受限于目前的技术,几乎没有一款 AI 产品达到这个位置,所以 Project Debater 是一个有意义的开始,但是能够真正达到人类辩手的水平,仍需要努力。


参考链接:


https://www.cbronline.com/opinion/project-debater-ai


https://edition.cnn.com/2019/02/11/tech/ai-versus-human-ibm-debate/index.html


2019 年 2 月 13 日 08:007232
用户头像
陈思 InfoQ编辑

发布了 555 篇内容, 共 189.6 次阅读, 收获喜欢 1064 次。

关注

评论

发布
暂无评论
发现更多内容

第三周作业一

dll

个人数字人民币钱包即将亮相

CECBC区块链专委会

央行 数字人民币

肝到头秃!阿里爆款的顶配版Spring Security笔记

周老师

Java spring 编程 程序员 架构

Kubeless 如何基于 CPU 自动伸缩? | 玩转 Kubeless

donghui2020

Serverless kubeless

典型的大型互联网系统使用了哪些技术方案和手段,主要解决什么问题?

极客海

拜托,学妹,别再问我怎么自学 Java 了!和盘托出

沉默王二

Java 自学编程

国外的公司都是如何对待大龄程序员的?在国内该如何应对?

Java架构师迁哥

区块链 | 最火的七大职业了解一下

CECBC区块链专委会

区块链技术人才

中国银行正式启动区块链产业金融服务项目 ​

CECBC区块链专委会

区块链 金融 金融服务

【第四周】系统架构

云龙

Programmatic Navigation using SwiftUI| 使用SwiftUI进行程序化导航

Daniel

来喽,来喽,Python 3.9正式版发布了~~~

华为云开发者社区

Python 编程

图解 K8S 源码 - Informer 篇

郭旭东

Kubernetes Kubernetes源码

The story of programmers in famous enterprises.

Marilyn

敏捷开发 快速开发

华为云专家讲述知识图谱构建流程及方法

华为云开发者社区

华为 数据 知识图谱

我和我的智能联接

脑极体

服务器的发展历史

德胜网络-阳

图扑软件联手阿里Lindorm数据库开启工业物联超融合存储模式

许力

IoT AIOT

高难度对话读书笔记—聆听篇

wo是一棵草

OKR-VUCA时代目标管理利器实践分享

张兆东

苦难过后,终会团聚

hellocj

在线教育企业迎来“秋招”大考,数字用户体验成胜负关键手

BonreeAPM

运维 APM 在线教育 AIOPS 用户体验

LeetCode题解:94. 二叉树的中序遍历,使用栈,JavaScript,详细注释

Lee Chen

LeetCode 前端进阶训练营

有了TA,领域外企业里的小IT团队,也能轻松搞定大型项目

Marilyn

敏捷开发 快速开发

OpLog4j

Geek_746da6

亚马逊Prime会员日火爆开启一站购全球逾3000万正品商品

爱极客侠

翻译之深入注释俄罗斯民间故事的语料库,以实现对俄罗斯形式主义理论的机器学习

AI代笔

JVM-技术专题-类加载机制

李浩宇/Alex

Java JVM

JVM-技术专题-Java类文件结构

李浩宇/Alex

Java JVM

从哲学源头思考自动驾驶网络架构设计

华为云开发者社区

自动驾驶 架构

年轻人大企打拼多年,刚升迁便遇巨大阻力难以解决,到底如何才能在职场中幸存?

Marilyn

敏捷开发 快速开发

IBM AI辩手对战世界级人类辩手,炒作还是秀肌肉?-InfoQ