微软CTO：我用GPT-3写科幻小说

如今，由大型语言模型驱动的人工智能系统正在改变人们的工作和创作方式，从为软件开发人员生成代码行，到为图形设计师绘制草图，都有 AI 的参与。

微软首席技术官 Kevin Scott 预计，从帮助应对气候变化和儿童教育等全球挑战，到医疗保健、法律、材料科学和科幻小说等领域的革新，这些人工智能系统将会在复杂度和规模上继续增长。

近日，微软官博发布了 Kevin Scott 关于人工智能如何影响知识工作者以及未来人工智能发展的看法。以下为主要内容。

在人工智能领域，2022 年最重要的进步是什么？

Kevin Scott：当进入 2022 年时，我想，在未来的一年里，几乎每个人工智能领域的人们都会看到一些让人难忘的东西。现在，我们已经度过了这一年，但就算抱着这么高的期待，回首这一年，看看从左到右我们所见的人工智能领域所带来的巨大变革，确实让人有些激动。研究人员和其他人为推进最先进的技术所做的事情，还是远远超出了几年前我们认为可能的事情。几乎所有这一切，都是拜大型人工智能模型令人难以置信的快速发展所赐。

分享下 2022 年我印象最深的三件事：

第一件事是 GitHub Copilot 的发布，这是一个基于语言模型的大型系统，能够将自然语言提示转化为代码，并对开发人员的生产力产生了巨大的积极影响。它使编程面向的人群更为广泛，这是我们从未有过的，这很了不起，因为未来在很大程度上取决于我们编写软件的能力。

第二件事是这些生成式的图像模型，如 DALL·E 2，已经变得非常流行，并且更易于获取。素描和绘画以及掌握平面设计、插图和艺术的所有工具需要相当高的技能。像 DALL·E2 这样的人工智能系统并不能把普通人变成职业艺术家，但是却为人们带来了前所未有的视觉词汇——一种新的超能力，他们从未想过有朝一日会拥有。

第三件事是，人工智能模型正在变得越来越强大，并为它们正在用来解决的问题提供更多实质性的收益。我认为，2022 年在蛋白质折叠方面的工作，在整个技术行业都非常出色，包括我们与华盛顿大学（University of Washington）大卫·贝克（David Baker）实验室的合作，与 RoseTTAFold 的蛋白质设计研究所的合作，以及通过一系列先进的人工智能来帮助它们做转型的事情。

这真是太令人兴奋了。凡是能促进科学与医学的事情，都会造福于整个世界，因为这些正是我们面临的一些最大、最棘手的问题所在。

这是令人印象深刻的一年。我想，2023 年会更好。

人工智能技术在 2023 年及以后，会显著影响哪些领域？

Kevin Scott：我认为，2023 年将会是人工智能界有史以来最激动人心的一年。我是真心认为 2022 年是我们经历过的最激动人心的一年之后说出这番话的。创新的步伐不断加快。

我已经谈过 GitHub Copilot 了，这真是太棒了。但对于大型人工智能模型未来所能做的事情来说，这只是冰山一角——把同样的想法推广到各种不同的场景中，看它们如何协助编码以外的其他类型的智力劳动。整个知识经济将会让我们了解到，人工智能是怎样在工作中解决重复性的问题，让它更快乐，更充实。它可以应用到几乎所有的事情上，比如设计新的分子来制造药物、用 3D 模型制造“配方”，或者只是编写和编辑。

例如，我一直在鼓捣一个实验系统，这个系统是我用 GPT-3 为自己开发的，目的是帮助我写一部科幻小说，这是我从十几岁起就想做的事情。我的笔记本上写满了我为理论书籍创作的概要，描述了这些书的内容和所发生的宇宙。有了这个实验工具，我已经能够打破僵局。当我用传统的方式写一本书时，如果我在一天内写了 2000 字，我就会对自己感到非常满足。有了这个工具，我曾有过一天能写 6000 字的时候，这对我来说感觉很棒。这个过程感觉比我以前做得更有活力。

这就是“万事都有副驾驶”的梦想——无论你从事什么样的认知工作，你身边都会有一位副驾驶，不但能帮你做很多事情，还能以新的、令人兴奋的方式提高你的创造力。

工作效率的提高显然提高了您的满意度，为什么这些工具能给工作带来更多的乐趣？

Kevin Scott：我们所有人都是利用工具来完成工作的。我们当中有些人非常享受使用这些工具，并且弄清楚了怎样用高效的方法来部署它们。我们进行了一次调查，调查结果显示，使用无代码或低代码工具导致用户对工作满意度、整体工作量和士气的积极影响超过 80%。特别是对于那些处于相对早期阶段的工具而言，这是一个巨大的优势。

对于一些员工来说，提高了工作效率，就像有一双更好的跑鞋去参加比赛或马拉松。这正是我们从开发者使用 Copilot 的经历中所看到的。有报告显示，Copilot 可以帮助他们在以往枯燥和重复的任务中保持头脑清醒。而且，如果人工智能工具可以帮助减少工作中的繁重劳动，比如过于重复的、令人厌恶的工作，或者那些妨碍他们去做他们真正喜欢的事情时，那么，满意度就会自然而然地提升。

就个人而言，这些工具让我比以前更长时间地处于流畅状态。创意流的敌人是分心和被卡住。我到了一个这样的境地：不知道如何解决下一个问题，或者下一个问题。比如，“我得去看看这个东西。我得从我正在做的事情中切换出来，去解决这个子问题。”这些工具越来越多地为我解决这些子问题，这样我就能保持流畅的状态。

除了 GitHub Copilot 和 DALL·E 2，人工智能正在以其他方式出现在微软的产品和服务中。下一代人工智能是如何改进目前的产品，如 Teams 和 Word？

Kevin Scott：这是人工智能不为人知的大故事。迄今为止，人工智能的大部分好处都分布在 1000 种不同的东西上，你也许还没有充分认识到，你所得到的产品体验中，有多少是从机器学习系统中得到的。

例如，我们坐在这里，在这个 Teams 的视频会议上，在系统中，所有这些参数是由机器学习算法学习的。语音系统采用了抖动缓冲器，以保证通讯的顺畅。你身后屏幕上的模糊效果，就是机器学习算法在工作。有十几个机器学习系统使这种体验对我们两个人来说更令人愉快。整个微软都是如此。

我们已经从几个地方的机器学习发展到遍布不同产品的 1000 种机器学习，分布在不同的产品中，从你的 Outlook 电子邮件客户端如何工作，你在 Word 中的预测文本，你的 Bing 搜索体验，到 Xbox Cloud Gaming 和 LinkedIn 中的 feed。到处都有人工智能的影子，使这些产品变得更好。

在过去两年中发生的一个重大变化是，以前的每个产品都需要一个专门的模型来处理。现在你有一个单一的模型，可以在很多地方使用，因为它们有广泛的用途。能够投资于这些随着规模扩大而变得更加强大的模型，然后在模型之上构建所有的东西，同时从您正在进行的改进中受益——这是非常了不起的。

微软的人工智能研究和开发通过诸如 AI4Science 和 AI for Good 等计划继续进行。关于人工智能的这个领域，您最感兴趣的是什么？

Kevin Scott：我们现在社会所面临的最具挑战性的问题是在科学领域。比如，你如何治愈这些棘手复杂的疾病？你如何为下一个大流行病做准备？你如何为老龄化人口提供负担得起的高质量医疗保健？你如何帮助大规模教育更多的孩子未来需要的技能？你如何开发能够扭转碳排放到大气中的一些负面影响的技术？我们正在探索如何将人工智能的一些令人兴奋的发展用于这些问题。

这些基础科学应用中的模型具有与大型语言模型相同的扩展特性。你建立一个模型，让它进入某种自监督的模式，它从模拟中学习，或者从自己观察特定领域的能力中学习，然后你得到的模型让你大大改变一个应用的性能——无论你是做计算流体动力学模拟，还是做药物设计的分子动力学。

这其中蕴藏着巨大的机遇。这意味着更好的药物，意味着我们也许可以找到我们还没有的催化剂来解决我们的碳排放问题，意味着全面加快科学家和其他有大想法的人如何努力解决社会的最大挑战。

计算技术和硬件的突破是如何促进人工智能的进步的？

Kevin Scott：我们最近在人工智能领域看到的几乎所有进展的根本原因是，规模的重要性已被证明是多么关键。事实证明，用以更多数据和更多计算能力训练的模型具有更丰富和更通用的功能集。如果我们想继续推动这一进步——需要明确的是，现在我们看不到扩大规模的好处——我们需要尽可能地优化和扩大我们的计算能力。

两年前，我们发布了第一台 Azure 人工智能超级计算机，在 2022 年的 Build 开发者大会上，我分享了我们现在拥有的多个超级计算系统，我们非常确信这些系统是当今世界上最大和最强大的人工智能超级计算机。我们和 OpenAI 使用这些基础设施来训练我们几乎所有最先进的大型模型，无论是微软的 Turing、Z-code 和 Florence 模型，还是 OpenAI 的 GPT、DALL·E 和 Codex 模型。而我们最近刚刚宣布与英伟达合作，建立一个由 Azure 基础设施与英伟达 GPU 相结合的超级计算机。

其中一些进展是通过使用越来越大的 GPU 集群来实现蛮力计算规模。但也许更大的突破是软件层，它优化了模型和数据在这些巨大系统中的分布方式，既可以训练模型，也可以为客户提供服务。如果我们要把这些大型模型作为人们可以创造的平台，它们就不能只被世界上极少数拥有足够资源来建造巨型超级计算机的科技公司所利用。

因此，我们对 DeepSpeed 等软件进行了大量投资，以提高训练效率，并对 ONNX Runtime 进行推理。它们对成本和延迟进行了优化，总体上帮助我们使更大的人工智能模型对人们来说更容易获得，更有价值。我为我们在这些技术上的团队感到非常自豪，因为微软在这方面确实处于行业领先地位，而且我们将所有这些技术开源，以便其他人能够继续改进。

人们一直担心人工智能将影响就业，而这些进展正是在这种担忧的背景下展开的。您是如何看待人工智能和就业问题的？

Kevin Scott：我们所处的时代非常复杂，而且具有历史意义的宏观经济变化，如果我们放眼未来 5 到 10 年，甚至仅仅为了实现整个世界的净中性平衡，我们将需要新的生产力形式，使我们所有人能够继续享受进步。我们希望将这些人工智能工具建设成很多人可以用来建立业务和解决问题的平台。我们相信，这些平台使更多的人能够民主地使用人工智能。有了它们，你将解决更多的问题，你将有一个更加多样化的团队能够参与技术的创造。

在以前的人工智能实例中，你需要大量的专业知识才能开始工作。现在你可以调用 Azure Cognitive Services，可以调用 Azure OpenAI Service，并在这些东西的基础上构建复杂的产品，而不必如此精通人工智能，以至于你必须能够从头开始训练自己的大型模型。

随着所有这些巨大的人工智能系统继续增长和发展，我相信，我们能够预见到，这些进展将从根本上改变工作的性质，在一些地方比其他地方更多，在某些情况下，创造出一大批以前不存在的新工作。你可以回顾一下，看到同样的事情发生在历史上各种著名的技术范式转变的旁边：电话、汽车、互联网。我认为，就像这些例子一样，我们将需要新的方式来思考工作，以新的方式来思考技能，并超级专注于确保我们有足够的人才，并为真正的关键工作提供培训。

与人工智能技术相关的另一个担忧是误用和滥用的可能性。微软正在采取哪些具体措施来确保其人工智能工具和服务的开发和使用是负责任的？

Kevin Scott：我们对这件事非常重视。我们的人工智能系统经历了一个负责任的人工智能过程，我们将会继续改进这一过程。我们与一个多学科的专家团队一起仔细检查我们正在做的事情，试图确保我们了解所有可能发生的潜在有害的事情，并尽可能多地减轻它们。

这方面的例子包括完善用于训练模型的数据集，部署过滤器以限制有害内容的产生，整合敏感话题的查询拦截等技术，这有助于防止不良行为者的滥用；或应用可以返回更有用、更多样化的响应和结果的技术。我们有一个人工智能系统的计划，可以在启动后尽快检测和缓解任何我们没有预料到的危害。

另一个非常重要的保障措施是有意识地迭代部署。我们所做的大部分工作都是关于具有广泛能力的模型。我们将它们托管在我们的云中，并通过 API 或我们的产品使它们可以访问。对于 API，任何开发者都可以获得访问权限，但他们必须遵守服务条款才能使用它，如果他们违反了服务条款，他们的访问权限就会被剥夺。

而对于其他产品，我们可能会从有限的预览开始，选择一些有明确用例的客户。与这些早期客户的合作将帮助我们确保负责任的人工智能保障措施在实践中发挥作用，以便我们能够更广泛地扩大采用。

我们坚信，安全和责任都很重要。希望我们能给整个行业带来一些激励。为此，我们应用于开发一些解决方案的所有资源和专业知识正在通过我们的负责任的人工智能标准和原则与其他更广泛的社区分享。

原文链接：

https://blogs.microsoft.com/ai/a-conversation-with-kevin-scott-whats-next-in-ai/

创作场景

微软 CTO：我用 GPT-3 写科幻小说