技术与人性间平衡的支点,如何寻找?
最近,Medscape《医学与机器》栏目的主持人、《深度医学(Deep Medicine)》的作者 Eric J. Topol 博士与李飞飞围绕“人工智能、医疗、人性”三个关键词展开了交谈。自从离开谷歌回到斯坦福,李飞飞就立即开启了一项“以人为中心的 AI 计划(Human-Centered AI Initiative,HAI)”,李飞飞曾在 twitter 上表示该项目的愿景是:推进 AI 研究、教育、政策和实践,以惠及全人类。
Eric J. Topol 博士:大家好,这里是 Eric Topol,也是 Medscape《医学与机器》的主持人。很高兴能有机会与斯坦福大学的李飞飞教授面对面交流。她是斯坦福大学 Human-Centered 人工智能(HAI)研究所的负责人。多年以来,她在人工智能领域拥有巨大的影响力,同时也是我心中的巨人以及挚友。欢迎你,飞飞。
李飞飞:多谢,Eric。很高兴来到这里。其实我对你也抱有同感,你永远是我心中的医学数字化英雄。
Topol: 哈哈,太客气啦。此前,你在斯坦福大学开设了新的研究院,能不能结合背景讲讲开设新研究院的原因,以及这家研究院的定位?
李飞飞: 你指的应该是斯坦福大学 Human-Centered AI 研究院。这所研究院当然有很多新鲜元素,但也继承了不少学术机构的特性,毕竟在斯坦福大学乃至美国其他地区,AI 技术代表着一大跨学科领域,从业者们也一直在 AI 社会下的人性问题方面推动着相关探索性研究。除此之外,AI 正在与人文、医学、教育乃至其他各类领域开展跨学科合作。
新的研究院将把这一切结合起来,在我称其为“重大历史时刻”的当下,也是过去十年中的第一次,我们将见证“人工智能”从小众计算机科学议题逐步融入现实生活。此外,我们也将见证 AI 技术给人类生活以及社会结构造成的深远影响,观察它在各行各业的实际应用,以及可能在无数产品及服务中迸发出的巨大能量。
无论是从科学性、应用性还是对人类生活的切实影响层面出发,我们都有必要了解 AI 技术的发展导向,这一点应该得到全世界的高度重视。
Topol: 毫无疑问,在医学领域,AI 将给我们的生活带来更重要的影响。也正因为如此,你才适合在新的研究院当中担任负责人一职。
多年之前,你曾经创立过名为 ImageNet 的项目,而该项目也随着时间推移改变了整个 AI 领域的面貌。从各类图像扫描场景来看,无论是视网膜图像、心电图图像还是其他任何图像,很多从事医学领域并运用这类技术的人们,还不清楚 ImageNet 正是当前众多医学发展成果的最初萌芽。但我知道,如今的累累硕果,确实始于你当初建立的 ImageNet 项目。
你能给大家讲讲当初为什么要建立 ImageNet 项目,它又在深度学习领域引发了哪些变革吗?
李飞飞: 我在 AI 领域的专业方向,主要是研究计算机视觉与机器学习之间的交集。早在 2006 年,我就试图解决计算机视觉领域的一个核心难题——用直白的话来说,就是如何实现物体“识别”。
人类是一种非常聪明的动物,我们会以非常丰富的方式观察这个世界。但是,这种视觉智能的基础,在于首先准确识别出周遭环境中多达几十万种不同的物体,包括小猫、树木、椅子、微波炉、汽车乃至行人等。从这个角度出发探索机器智能的实现,无疑是实现人工智能的第一步,而且直到现在也仍然是重要的一步。
我们一直在为此努力。当时我还年轻,在学校担任副教授。在评上副教授的第一年,我就开始研究这个问题。但我突然间意识到,那个时代下的所有机器学习算法,在本质上只能处理来自几十种对象的一组极小数据类别。这些数据集中的每个类别只包含 100 张或者最多几百张图片,这样的素材量远远无法与人类及其他动物的实际成长经历相契合。
受到人类成长过程的启发,我们意识到大数据对于推动机器学习发展的重要意义。充足的数据量不仅能够改善模式的多样性,同时也在数学层面有着关键的积极意义,能够帮助一切学习系统更好地实现泛化,而非被束缚在总量远低于真实世界的数据集内,经历一次又一次过度拟合。
以这一观念为基础,我们认为接下来不妨做点疯狂的事情,那就是把我们周遭环境中的所有物体都整理出来。具体是怎么做的?我们受到了英语词汇分类法 WordNet 的启发,这种方法由语言学家 George Miller 于上世纪八十年代提出。在 WordNet 当中,我们能够找到超过 8 万个用于描述客观对象的名词。
最终,我们收集到 22000 个对象类,这些对象类通过不同的搜索引擎从互联网上下载而来。此外,我们还通过 Amazon Mechanical Turk 发动了规模可观的众包工程项目,这一干就是两年。最终,我们吸引到来自 160 多个国家和地区的超过 5 万名参与者,他们帮助我们清理并标记了近 10 亿张图像,并最终得到一套经过精心规划的数据集。数据集中包含 22000 个对象类以及下辖的 15000 万张图像,这就是今天大家所熟悉的 ImageNet。
我们立即把成果向研究社区开源。从 2010 年开始,我们每年举办一届 ImageNet 挑战赛,诚邀全球各地的研究人员参与解决这一代表计算机视觉领域终极难题的挑战。
几年之后,来自加拿大的机器学习研究人员们利用名为“卷积神经网络”这一颇具传统的模型刻了 2012 年 ImageNet 挑战赛。没错,就是 Geoff Hinton 教授带领的小组。
我知道,很多人都把 ImageNet 挑战赛视为开启深度学习新时代的里程碑式事件。
Topol: 大约四年之前,你走上了 TED 演讲的舞台,谈到我们如何教导计算机理解图片内容。那一期真的很特别,我想至少有几百万人观看过这场演讲。我记得之前曾经问过你,你当时拿出了一张男人骑马的照片,并解释了计算机为什么在对象识别方面一下子就突飞猛进起来。
但如今的计算机视觉在不同情境下的表现仍然差距巨大,而且偶尔还会犯下错误。我曾问你,我们目前的水平就只能达到这样,对吧?那么现在回头看,我们对于训练机器理解图像内容的理论还准确吗?
李飞飞: 是的,虽然图像识别技术一直在稳步发展,但你的观点确实值得深思。图像内容仍存在很多计算机无法判定的细微差别、上下文、背景知识、常识以及推理性元素。这一切,都足以难倒当前最先进的机器智能。单在视觉角度来讲,即使是骑马者雕像这类看似单纯的对象,都同样可能让机器摸不着头脑。
也可以说,尽管我们通过大量训练构建起一套能够识别雕塑的系统,它也仍然无法重现人类智能在识别方面的表现。具体来讲,人类能够体会到雕塑中的艺术气息、了解背景信息、识别出材质,这一切都是现在的机器智能所无法做到的。
Topol: 没错。在医学领域,情况也差不多,带有注释的数据集在体量上仍然无法令人满意。由于没有像 ImageNet 这样包含上千万张经过精心标记的图像,医学从业者只能不断使用相同的数据集训练自己的模型。
那么,我们有必要投入专门的精力构建新的数据集吗?或者说,自我监督或者无监督学习才代表着真正的未来?
李飞飞: 问得好,Eric。相信你也清楚,我认为答案绝不会非此即彼。在大多数情况下,高质量数据集的匮乏确实让医学研究人员与开发人员感到沮丧不已。但在这方面,匮乏也有匮乏的理由。出于患者隐私与安全保护的原因,医疗数据往往需要受到更精心的管理,其中涉及的数据偏见问题也有可能引发更严重的后果。
在识别小猫时,有点偏见可能没啥大问题。但一旦涉及到人类的生活、健康甚至是福祉时,偏见就会惹出大麻烦。正是由于这些问题,再加上法规的严格限制,导致医学数据很难得到大规模汇总。我认为我们确实有必要为此付出努力,而且目前世界各地的研究人员也开始自发联合起来,共同为攻击这道难关而奋斗。
与此同时,技术本身的改进也有望从另一个角度带来新的曙光。如你之前提到,除了需要高质量的数据集以训练有监督学习算法之外,机器学习领域在其他一些非常有趣的方向上也取得了重大进展,包括自我监督、迁移学习、联邦学习以及无监督学习等。
我认为未来这些方法将相互结合。在某些特定场景下,我们仍然需要高质量的大规模数据集。而在另一些场景中,多模与混合数据集可能功效更为显著。
Topol: 既然医学领域已经掀起了第一波 AI 浪潮,那么图像识别肯定是最直接的受益场景吧**。此外,患者与医生也开始与会话式 AI 系统交互,整个过程终于不用通过键盘实现,而且**传统录入方式一直是患者跟医生的共同敌人。在你看来,最终临床医生能不能在 AI 技术的帮助下彻底从枯燥的转录工作中解放出来?
李飞飞: 我百分之百相信这一点。这不只是是因为乐观,也是因为我真心希望能够通过 AI 技术的发展,在医疗保健领域减轻长期以来困扰着临床医生的机械重复负担。
我的父母也已经年迈,在医院里照顾他们的时候,我曾经认真观察过护士和医生们的工作内容。我认为,在 AI 领域当中,像我这样的研究者们真心希望帮助他们拿出更多时间来照料病人,而不是把大量精力浪费在盯着屏幕跟图表上。无论是从患者、临床医生还是经济效益的角度出发,我都真心希望这一领域尽快迎来坚实有效的进步。
Topol: 我对你当时的经历很好奇。你需要照料父母,他们需要在医院里调养身体。那么能不能谈谈切身体会。在现在的一流医疗中心里,作为患者家庭成员,你的实际感受如何?
毕竟归根到底,医疗保健的本质在于由人类照料人类。
李飞飞: 首先,作为患者的家属,人类的焦虑、恐惧以及希望等情绪波动仍然非常重要。如果没有个人体验,那么人类很难对事物表现出充分的信任。我坚信技术能够在这一领域扩大并增强人类的工作能力,但绝对不是要替代人类。我自己的个人研究,以及斯坦福大学 HAI 研究院的相关工作,一直在以此为核心主题。这一点在医学领域也体现得尤其明显。
我听说过不少关于 AI 系统彻底替代医生的讨论,因为机器在某些诊断当中拥有更好的表现。但是在经历了从外科手术到重症监护病房(ICU)的整个医疗体验之后,再加上我在医院里长期看护年迈父母的真实感受,我越来越无法想象没有护士与医生到底会是怎样的情景。
归根到底,医疗保健的本质在于由人类照料人类。我之所以如此坚定,是因为如果技术能够在处理文书工作方面发挥显著的辅助作用,同时通过更快的早期诊断提升归类效率,那么这样一双保障患者安全的关注之眼才是患者与医护人员真正想要的。我目前所从事的正是这方面的工作,我对这一切也抱有极高的热情。
Topol: 你与 Arnold Milstein 在这方面开展了不少合作,你也开始努力尝试在 ICU 当中引入机器视觉方案,能不能跟我们分享一点经验心得?
李飞飞: Arnold Milstein 博士是斯坦福大学的医学教授,同时也是美国医疗领域的意见领袖,一直致力于从研究、政策以及商业实践等不同角度提高医疗质量并削减医疗成本。
大约七、八年前,她和我偶然相遇,两个人马上就碰撞出了火花。作为 AI 教授,我感受到深度学习时代的到来,特别是通过无人驾驶汽车、智能传感器、AI 算法进步以及相关技术成本下降所带来的全新可能性。我相信,与目前主要依赖人类驾驶员的汽车不同,未来的运输技术将呈现出完全不同的面貌。
我和 Arnold 最初的话题就是探讨这项技术,分享心得,进而聊起医疗保健领域的种种问题,包括因系统低效、计时错误、人手不足等问题给患者安全带来的巨大威胁。我们都希望能够让医护工作者将更多时间花在患者身上,并帮助他们在工作中充分享受由智能传感器与 AI 算法等成果带来的全新体验。
我们开始讨论如何在医疗保健交付系统的典型场景中,通过智能传感器原型设计为医护人员提供帮助。我们首先确定的场景就是 ICU——毕竟作为挽救生命的有力武器,ICU 意义重大而且有着极广的社会认知度。患者正在与死神对抗,而我们的临床医生每分每秒都在紧张工作。这个时候,任何小小的失误都有可能改变个人甚至家庭的命运。
接下来,我们与犹他州 Intermountain 医院以及斯坦福医院交流,希望了解能否在 ICU 当中试行患者护理项目,帮助临床医生记录其是否按照规程完成了正确的患者护理(包括口腔护理与复健指导等)。医生们的日常总是忙忙碌碌的,这方面记录工作确实给他们增添了不少负担。
在项目当中,我们安装了成本低廉的深度传感器,能够在不侵犯患者及临床医生隐私的前提下收集行动数据——之所以安全,是因为其中不涉及任何面部或者身份信息。有了这些数据,我们就能 24/7 全天候观察患者是否得到妥善护理,并在医疗交付系统中提交反馈。
我们在斯坦福儿童医院里也做了类似的实验,包括推动手部清洁项目。很多人可能不清楚,由于的手部清洁不当而造成的院内交叉感染,每年在美国造成数千人丧生。同样利用之前提到的低成本传感器以及深度学习算法,我们得以勾勒出临床医生的手部清洁习惯,并发送反馈信息以提醒他们严格按照世界卫生组织提出的标准认真洗手。
Topol: 确实,利用不起眼的传感器,机器视觉技术确实能够显著提高住院患者的安全性以及治疗效果,这项工作绝对意义深远。我注意到在斯坦福大学的医学中心,你们有专门配备 AI 的病床,是真的吗?
李飞飞: 确实是这样。但目前还处于项目发展早期,我们正在与医院合作,希望进一步扩大传感器项目的部署规模。现在我还没办法讨论具体部署效果,但这项工作已经得到临床医生、医院领导以及 AI 研究人员们的大力支持。
尤其让我兴奋的是,我们正在邀请伦理学家、法律学者以及生物伦理学家,共同讨论这项技术可能面临的前沿性挑战。我们希望牢牢把握这方面原则,确保患者、临床医生、病患家属以及其他利益相关者不致因此遭受意外损失。
Topol: 肯定的,对于医学界来说,实施 AI 技术的一大基本前提,就是在保证临床医生能够轻松适应的同时,透彻分析各项问题中的深层细节。
由 Pearse Keane 领导的一支英国研究团队就发表了一篇论文,他们邀请从未编写过代码也毫无计算机科学背景的医生们尝试使用图像数据集。通过这种方式,医生们逐渐见识到了计算机图像识别的本事。你觉得这是个好主意吗?毕竟我们不可能要求医生自己上阵开发算法,对吧?
李飞飞: 我对这个项目不太熟悉。不过,在过去七、八年中,我也一直在进行类似的尝试,研究如何在跨学科小组当中引导医生和计算机科学家共同讨论同一个常规问题。我觉得这段体验让人印象深刻。
我自己也仍然在学习,目前我得出的一大重要结论,就是人们应当学会相处并理解彼此的工作性质、对方的顾虑、他们的价值主张,同时始终保持耐心与开放的胸怀。当然,接纳对方的专业领域不轻松,也绝对不是什么线性过程,其中有不少问题需要克服。
我还记得研究团队刚刚成立时,计算机科学家们是如何跟临床医生相互交流的。即使是在今天,当有新的学生或者成员加入时,我们也会组织多轮会议,引导大家尽快熟悉沟通环境。
作为计算机科学家,我对参加 AI 医疗保健项目的计算机专业学生们只有一项基本要求——在讨论代码与算法之前,先融入医护人员的日常生活。他们需要进入 ICU、病房、手术室甚至是医护人员/患者家中,了解这些人的生活方式并跟他们的家人面对面接触。完成了这一切之后,我们才有资格开始讨论计算机科学问题。
Topol: 你做出的另一项贡献当属 AI4ALL。通过这个项目,你不仅希望引导计算机科学家与临床医生合作,同时也在尝试培养下一代计算机科学家。快给我们讲讲关于 AI4ALL 的故事。
李飞飞: 非常感谢,Eric。AI4ALL 项目诞生至今已经有五年多时间了。当时是 2014 年左右,可以说是深度学习革命的发展初期。整个世界,特别是科技领域,尤其是硅谷,全面充斥着对于深度学习技术的兴奋、争论与担忧。
我很快意识到,大家在面对 AI 技术时都有些精神分裂——一方面,人们担心终结者和天网变成现实,人类沦为机器的奴隶;另一方面,我们生活在一个极度缺乏多样性的世界当中。在 AI 专业领域,像我这样的女性真的非常少见。在大多数技术会议当中,女性参会者的比例不足 15%。更夸张的是,少数族裔始终存在代表性不足的问题,由于相关统计数据太过有限,我们一直无法建立起有效且可靠的统计结果。
大家可能觉得这根本就是两码事,但在我看来这两件事之间有着极为深远的关联。作为人类,如果说我们关注 AI 的理由是关注人类社会的未来,那么我们就必须要关注这样的未来到底由谁所创造。如果 AI 技术的设计与导向权只掌握在一小部分人手里,那么我们恐怕真的只能接受强大但却根本不打算代表全人类的 AI 成果。
我之前带过一名出色的博士生,当时她马上就要博士毕业了。Olga Russakovsky,她现在是普林斯顿大学的 AI 教授。她和我就这方面担忧进行了深入探讨,我们达成了共识,并决定为此做点什么。
在 2015 年到 2016 年期间,我们在斯坦福大学试行一个新项目,邀请高中女生通过夏令营活动在 AI 实验室中与我们一道研究人工智能技术。项目取得了巨大的成功,因此在 2017 年,Melinda Gates(盖茨夫人)与黄仁勋鼓励我们将项目正规化,这就是全国性非营利组织 AI4ALL 的由来。
我们的使命是为各行各业教育并启发下一代 AI 技术专家与意见领袖。AI4ALL 现在已经三岁多了。在 2019 年的夏令营中,我们为北美地区的 11 所大学在校生准备了时期课程,专门面向少数族裔学生以及公共服务严重短缺的社区——包括低收入家庭学生、农村学生以及女生等等。
我们仍在为此不懈努力,我们的目标是在未来 10 到 15 年之内培养出优秀的继任者,让这些学生在告别校园之后投身技术、特别是 AI 领域并做出一番成就。目前,我们已经迎来了不少早期案例,效果相当喜人。
Topol: 在撰写《深度医学(Deep Medicine)》一书的过程中,你的事迹给了我很大的启发。之所以印象深刻,是因为我关注过不少 AI 领域的大牛,从专泼冷水的批判者到炒作大师应有尽有。但你在其中非常独特,你就像是权衡中的标杆。你一直在努力寻求真理,而且丝毫不避讳 AI 技术的种种缺点。
在这里,我想听听你的个人观点。如今的 AI 技术就像是雨后的春笋,每个礼拜都会出现不少重大事件,来自医学、来自纯 AI 技术等等。在这一轮上升期当中,必然充斥着大量关于 AI 技术的炒作之词。那么这一切,特别是与医学相关的消息,到底有多真或者说多假?我们的 AI 到底发展到什么程度了?
李飞飞: 这个话题可就大了。有些人认为如今的 AI 技术全是泡沫,也有人觉得这些都是真实的结果。在我看来,泡沫确实存在,但 AI 技术同时也拥有着坚实可靠的内核。而且我始终坚信,AI 技术拥有在给医疗保健与医学领域带来深远影响的巨大潜力。
但说回泡沫,泡沫确实存在,过度夸张、炒作可以说铺天盖地。作为科学家,我希望这些泡沫都尽快消散。只有关注坚实内核的人们才能推动 AI 进步并带来真正的收益,这一点在医疗保健与医药等领域尤其重要。
另外,我们绝不应该利用技术制造不公、偏见或者扩大原已存在的不平等现象。对于 AI 技术,我希望尽可能降低它的接触门槛、增加公平性并缓解种种相关矛盾。只要处理得当,我们完全有机会利用 AI 技术创造出更美好的未来。当然,前提是我们得认真梳理现有 AI 成果,弄清哪些是捏造的、哪些是真实的。
Topol: 非常感谢你参加这次访谈。跟你聊天非常开心,也很高兴能听到你亲口为我解答关于 AI 技术的种种疑惑。我们将继续关注你和你的团队未来带来的更多成果。
李飞飞: 我也会继续关注你的研究,期待你在医学数字化与公共意见表达方面的新进展。感谢你,Eric。
Topol: 谢谢。
原文链接:
评论