编辑 | 栗子、Tina
4 月 18 日,钉钉正式上线 AI 助理市场(AI Agent Store)。
首批上架了 200 多个 AI 助理。Agent Store 的这种创新模式可以显著降低创作门槛并吸引更多用户,各行各业的人都可以拥有自己专属的助理。据钉钉官方数据显示,截至 2024 年 3 月底,钉钉 AI 已超过 220 万家企业使用,月活跃企业超过 170 万家。
今年 1 月,OpenAI 正式上线了 GPT Store,行业认为这意味着 AI 大模型将迎来自己的“App Store”时代,同时催生出新的商业模式。紧跟 OpenAI,国内外众多科技巨头和初创公司纷纷投入,推出了自己的“商店”,这就预示着未来的一两年里会出现大量的 AI 应用商店。
长期以来,技术一直是软件公司的一个差异化因素,虽然不是永远但至少会持续一段时间;但在主张“人人都是开发者”的 AI 时代,有说法认为技术从一开始就基本上没有为企业提供任何保护,技术差异这个护城河在 AI 时代正在急剧缩小。
那么钉钉为什么会推出 Agent Store?它与其他的 GPT Store 差异点在哪里?竞争激烈的 AI 应用商店,其护城河又会是什么?在 QCon 北京 2024 大会现场,InfoQ 就这些问题采访了钉钉 CTO 程操红(花名:巴布)。
采访视频:https://www.infoq.cn/video/ZuRGCDK2yQU0a1gOv243
InfoQ:钉钉的定位:这几年钉钉一直在演进,也不断跟进技术潮流,比如低代码、数字化,发展到现在,您能不能回顾一下您对钉钉这个产品的认知变化和心路历程?
程操红(巴布):大家都知道,钉钉的前身是“来往”。最初,来往的定位较为宽泛,在功能上与微信存在一定的相似性。然而,事实证明,在社交软件“红海”市场中,这种定位很难取得突破。早期,钉钉得益于迅速切入工作场景,通过提供更高效的沟通交流方式,以及满足中国许多人的打卡考勤需求,从而取得了第一波的成功。
在中国,许多职场人士工作在知识密集型或高科技行业,对于高效的办公工具有着迫切的需求。然而,中国也拥有庞大的制造业市场。钉钉早期抓住这一市场机遇,实现了规模上的突破,尤其是在疫情期间,其规模更是取得了爆发式增长。
我加入公司时,正是钉钉规模取得突破之后。当时,我们面临着一个新的课题:如何避免过度依赖类似“三板斧”的策略,钉一下、考勤、音视频电话,同时实现再次突破。
而当时我认为,解决这个问题涉及产品生态的各个方面,需要提升对市场客户群体的理解。因此,后来我们定义了两个关键的定位,一个是协同办公平台,另一个是应用开发平台。协同办公平台旨在解决大家在整个办公场景中如何提高效率的问题。然而,如果你仅仅解决了办公中的问题,实际上还只是表面功夫,很难真正与企业的各种业务场景深度结合。你可能会觉得,你只是在传递文件、发送文档、进行简单的聊天,或者最多就是处理 OA 审批流程吧?差不多就这样结束了。但是,实际上,组织治理、业务运营、人才管理以及物资采购和销售等方面,背后隐藏着大量的工作,就像冰山的下方一样,很多人并没有真正触及到这些。
在定位上,我们将应用开发平台定位为底座,旨在支持生态合作伙伴共同服务于更深入的业务场景。而数字化转型涵盖了办公数字化,可以逐步辐射组织数字化。应用开发平台其实还可以逐步覆盖到业务数字化领域。而且,对于一个完整的组织而言,仅仅局限于办公数字化是肯定不够的。
基于上述思考,钉钉提出 PaaS First 战略,即首先做好开放生态的底座。这意味着我们可能会将更少的精力投入到场景应用产品的研发上,而是更专注于底层能力的构建,解决一些生态系统中可能存在的挑战或难题,一些可能不受欢迎或难以实现的任务,钉钉将其处理得很好。
以终端为例,SaaS 企业需要进行大量的投入。在进入央国企等大型客户时,对方会首先关注信创能力,对安卓、iOS、Pad 等多端系统的支持程度以及产品体验的一致性。此外,随着数据安全要求的不断提升,数据隐私保护也成为企业必须考虑的重要因素,包括安全的能力、连接的能力以及即时通讯(IM)系统的稳定性和扩展性。例如,在 3 万人的大群中,每条消息的已读/未读状态都需要实时更新,这个消息扩散的量是非常惊人的,这对系统的性能提出了巨大的挑战。因此,SaaS 企业需要夯实基础能力,在 IM 系统方面做好安全稳定、多端适配和开放扩展等工作。
其中,像百丽这样的企业,自主开发应用并将其部署至群里,满足了深度定制需求。这意味着将业务协同整合至即时通讯(IM)系统中,为办公协同平台和应用开发平台的融合创造了新的空间。办公协同平台中常见的音视频、IM 以及文档协作功能,正逐渐成为业务数字化的重要载体。以钉钉文档为例,其强调多人协同编辑,你会发现它又成为业务数字化的一个载体,它们并不是完全割裂的。
此外,音视频功能也被广泛应用于面试招聘等场景。生态合作伙伴可以基于音视频能力构建面试招聘应用,并结合人工智能技术实现预面试等功能,进一步提升招聘效率。所以这个事儿就很有意思了,这就是说,在这个过程里产品维度发生的一些演变。
谈及个人心路历程,我认为有时候确实颇为纠结。我们所面对的用户和客户这两个词,就很有意思。我们需要关注真正的使用者,无论是员工还是个人用户,他们的体验都至关重要,而这种体验往往与老板的期望不尽相同。作为商业实体,我们也需要考虑商业化的因素,产品必须满足老板、管理者以及组织发展的需求。因此,我们一直秉持着一种理念,即我们将其称为 3C。第一个 C 是“communication”,也就是钉钉立身之本,必须优化沟通协作。这是我们的关键能力,保证信息高速公路是畅通的。
在此基础上,我们还需解决另外两个 C,其中一个是"control"。实际上,“control”这个术语的话,更贴切的说法应该是治理。管理学中很多人将其称为“control”,即老板如何进行治理,实施一些全局性的管控。因为一个公司之所以能够成为一个公司,很大程度上取决于其在多个方面的管控诉求。这涵盖了从财务预算管理,组织目标管理,到组织文化的基本要求和倡导等各个方面。实际上,许多方面都需要一些控制措施,包括销售里的整个营销活动的关键流程和机制。因此,从一个自上而下的视角来看,如何更好地实施治理下发,传达治理措施,并确保治理最终能够真正落地,这在数字化转型中是需要解决的问题。
另外一个问题是,从员工或个体的角度来看,如何让他们成为一个更加被激活的个体,真正融入到组织中去?他们对责权力的感知,以及对生产力工具的感受,实际上需要与管理层的“control”措施相互匹配。我们的想法是,在建立了越来越高效的“communication”平台之后,如何实现“control”措施和“context”之间的无缝连接,这实际上一直是我们在管理理念层面试图解决的问题。否则,要么只是讨好一下员工,要么只是讨好一下老板,这两者可能都不太行。
我们并不是说我们完全独立自主地拥有这种能力,而是我们和许多客户一起在共同探索创新,是吧?就像我刚才提到的那些深度定制的案例,比如刚才提到的百丽。事实上,随着时间的推移,钉钉的群可能不再是简单的群,而可能成为未来组织结构的一种雏形。当你的群协作频率非常高时,为什么不将这个群转变为一个实际的组织呢?它可能会是一个实际的组织,所以这个想法非常有趣,就是如何逐步让技术影响你的产品?如何让技术,以及这种思考逐步影响整个生态?如何让这些影响你产品背后的管理理念?这些问题可能还在探索之中。
InfoQ:客户和用户之间的平衡,实际上这是一门艺术,最开始可能一些员工谈钉钉色变,那么现在“control”和“context”的连接,这个平衡现在达到了什么程度?
程操红(巴布):实际上我们并不是要削弱老板的管理能力,而是提升它。例如,我们通过数据的普惠和 AI 的加持,使老板能够更准确地掌握经营状态,而不是一味地驱使员工。本质上是要激活员工,同时让老板能够更清晰地基于数据进行治理,这两者实际上是可以相辅相成的。
在员工方面,我们真正以人为本的体验,例如我们提供下班模式和免打扰功能。当然,老板可能会问,为什么不让我打扰员工呢?但本质上,这仍然是为了提升目标效率和生产力。否则,如果只是单方面给员工提供免打扰模式可能也很难。当数据洞察更加清晰,任务协同更加高效时,才能真正实现免打扰。我们的目标更加清晰,我们阶段性重点也更加明确,通过“communication”的基础,再结合 AI 和数据,我刚才提到的消费方式升级也是可以达成一致的。当然,在产品方面,现在大家都在双向奔赴的过程中。
InfoQ:因为现在所有话题都是围绕着 AIGC,钉钉产品层面您也谈到,比如说我们有 80 种场景化的应用,您认为产品的变化过程中,AIGC 给钉钉带来的最大价值或起到的作用是什么,有没有带来什么颠覆性的大变革?还是我们常说的辅助或降本增效的作用?
程操红(巴布):这个话题我认为需要分解来讲。实际上,我刚才也提到了,产品的变化有三个不同的阶段或模式,我们目前只是将这些阶段同时推进。目前,人工智能所带来的第一个影响是,很多人的首要想法是立即将 AI 应用于产品中,就像之前所说的,将发动机立即安装到马车上一样。这种方法确实能够起到一定的普及作用,但它并没有解决根本问题,它只是让大家对 AI 有了一定的了解。
第二种方法,像刚才提到的“copilot”。加上“copilot”可能会更好一些,它能让大家感受到 AI 的价值更大一些。比如说,以前在考勤规则方面,可能需要学习各种排班方式,这些可能会很复杂。如果软件的培训不到位,就可能无法正确使用。现在,通过 copilot 模式,基本上你只需通过自然语言描述你的需求,比如说我是个工厂,需要设置三班倒,它就能帮你完成。我认为这是一种进步。包括我们的宜搭,从专业开发转为使用低代码,可能要么觉得看不上要么觉得还不错,因为这确实降低了难度。但对于完全没有编码经验的纯业务人员来说,要学习一些专业术语,如公式编辑、表头表尾、数据集等,可能涉及少量的 JS,就会有些困难。
现在通过 copilot,你可以说:“我画了这样一个表格,并拍了一张照片,你能帮我生成吗?” 它就帮你完成了,这样的方式确实方便了许多。但我认为这很难说它是颠覆性的。它只是说整个浪潮来了,我确实拥抱了,并做了一些相应的调整。
真正颠覆性的改变我认为一定是在“Agent”的形态中。为什么说它不一样呢?因为在本质上,以前的改造只是局部的,你的软件或者是你加上 copilot 等工具,它依然是工具的属性。但 Agent 真正具备的拟人属性是让 AI 拥有了记忆功能,对你的偏好有了更深入的了解。
比如说,上一次我使用这个 Agent 让它帮我写文档。我对它提出了很多要求,比如:字号要用小四号字体,使用钉钉进步体字体,我希望每一个结尾都不要再总结了,有点啰嗦。我曾经告诉过它一次,那么下次我让它写日志或者帮我写其他东西时,它能够从之前文档的场景引申到日志或周报的场景。它会记住我的偏好,并认为这些偏好在写周报时同样适用。
因此,这是一个非常重要的变化,即 Agent 的这种拟人化形态,它能够了解你的偏好,并具有记忆功能,然后能够跨系统去做行动系统的调度。我认为,尤其是在现在引入工作流之后,这个变化可能并没有颠覆性那么严重,但它确实完全重构了原来的软件开发和产品使用形态。对于这一点,我仍然持有坚定的信念。
InfoQ:那在钉钉的这些基础功能里面,您能举点例子吗?
程操红(巴布):第一个例子就是,比如嵌入式的,你在 IM 中发送一张图片,可以立马点那个小尾巴,这是图片理解的一个例子。当然,类似的例子还有很多,比如在思维导图中,你写下一个组织团建活动的计划,然后请求它为你扩散,给你灵感,这属于嵌入式应用,在原有的软件中,你会感受到不同的使用体验。
比如在考勤软件中,旁边就有 Copilot,它可以帮助你编制考勤规则。如宜搭 Copilot,你遇到什么不会用的,仍然在使用原来的拖拉拽模式,但是因为你不会用,你可以随时向它询问,比如说,“这个地方怎么弄?”、“这个故事怎么写?”、“你能帮我写一下吗?”这就是 Copilot 的辅助功能。现在,Agent 的应用越来越广泛,你可以看到有紫砂壶大师、摄影搭子、相亲红娘等。它会时不时与你聊天,发现一些有趣的新闻热点,越来越了解你。它会在了解你的过程中启发你,当你遇到困难时,会给予你安慰,并记录这个过程。未来,当你寻找对象时,它会知道你对某些事情可能比较敏感,这种感觉就会有所不同。
然后,我们现在有一个比较高频的 Agent,之前我们内部有一个获奖的,叫做“搭子”,它涵盖了从 MBTI 性格测试到相互匹配以及各种信息的链接和分享协作等功能,都可以由它完成。此外,我们还有一个很有趣的项目,就是我们的运维助理。以前,技术同学工作相当辛苦,当云上的机器链路出现问题时,他们经常需要自行分析。但现在,如果我们使用了这个运维助理,我们正在不断打磨它,目前的效果相对来说已经可以看到了。它会自动时刻分析这些异常情况,而且你还可以不断向它灌输新的知识。比如,你可以告诉它将某一类信息合并,或者结合资源负载再进行分析,这是一个不断进化的过程。案例非常多,Agent Store 发布之后,你肯定能找到一些你觉得好玩的。
InfoQ:这里面您觉得自己就是钉钉原创度最高,或者说我们的技术门槛最高,可能成为我们护城河的技术能力是什么?
程操红(巴布):我认为实际上 AI 的护城河门槛应该也不是在纯技术层面,但需要有懂得这项技术的人迅速拥抱这个理念。目前,大型模型本身确实存在一定的壁垒,但我预计再过一两年,这些壁垒也没有那么高。另外,在商业竞争下,又不断有开源项目涌现,因此,再过一两年可能又会成为了基础设施,并且在其之上有很多与 AI 相关,像 AI OS 这些,就技术壁垒而言,我认为也没有太大的问题。
关键在于如何培养具备 AI 思维的人才,以及是否有足够的框架和资源支持。所谓的资源,指的是什么呢?比如说,我们的 Agent 最大的特点就是具有记忆能力。那么,这个记忆是从哪里来的呢?Agent 具有行动能力,但这种行动能力背后的行为又是如何产生的呢?因此,生态系统的构建和持续供给非常重要。我认为,钉钉的核心(壁垒)就在于我们的 Agent。
实际上,从纯粹的 Agent 框架角度来看,我认为大家都差不多,包括外部的一些舰队如扣子、GPTs 也是如此。本质上,它们之间的差异并不大。主要是工程上的时间先后问题,但可能相差也不会超过两个月。
问题是,如果你要想让这些 Agent 具备偏好,那么这些偏好数据又是从哪里来的呢?钉钉拥有大量的用户收藏和聊天,用户在授权后,可以将这些数据提供给他们的助理。在钉钉上,我已经写了大量的日志和文档,这可以作为我的原始记忆和偏好的来源。此外,钉钉还保存了我的好友关系。对于企业而言,钉钉还保存着大量的组织流程、审批流程、业务处理流程以及规章制度和营销政策等信息。至于感知能力,可以通过数据指标了解到各种业务事件从哪来。你有个协作的网络,但你不在这个网络上,那你会有这个感知吗?比如,你知道今天有谁迟到了吗?你知道哪个合同流程超过三天还没有批准吗?钉钉知道。
所以,我认为,AI 的思维比技术本身更重要。而且,背后支撑着大量高质量数据的供给比技术本身更为重要。
InfoQ:所以最终还是要回到数据层面来。
程操红(巴布):如何挖掘场景、提高数据密度、提升数据质量,并使其成为 Agent 不断吸取的养分,这些问题至关重要。数据是核心的生产要素,但为什么以前没有解决这些问题呢?首先是因为数据的质量和密度不够。而质量和密度不足的原因是场景覆盖不够全面。许多情况并未被数字化,导致无法被充分记录。举个例子,今天我们两个进行了一次深入的交流和讨论,你唯一记录下来的可能只是录音和视频。这其中就蕴含了大量的观点、事实、信息和知识,但如果没有被加工处理,这些数据除了被浏览之外没有任何其他用途。就比如说我们这次的视频访谈,如果有别的媒体给我电话,我们实际上可以将这个采访内容交给助理,由助理来回复。
所以说我们的核心竞争优势并不在于 AI 技术本身,而是在于背后的数据,包括协作网络的数据密度。这一点非常重要,也非常有意思。以前很难实现这一点,但是 AI 技术可能已经做到了。
InfoQ:那在我们跟企业的合作过程当中,怎么样去帮助他们把这个数据的密度以及质量提升上去?
程操红(巴布):这是一个非常好的问题。我刚才提到钉钉从协同办公平台逐步延伸到应用开发平台时,实际上我们非常想做这件事。一方面是源自于市场,许多组织和企业都要求进行数字化升级。当然,数字化升级本身旨在实现更好的组织治理、开拓更好的业务模式以及提高组织效率,对吧?这一点是毋庸置疑的。但其中的手段就变得至关重要了。如果都是通过购买专业软件,成本太高;而定制开发又太麻烦,而且很多时候无法完全匹配自身场景。因为我们现在购买的现成软件,比如国外的那些,价格昂贵,而且匹配度并不总是很高,需要大量的定制开发。
然后如今我们所处的市场环境变化速度很快,业务模式经常变化。你刚刚可能还在开设门店,现在却已经开始进入各种后电商时代。业务模型模式变化太快了,你原来那套营销的体系行吗?可能需要进行大规模升级,而且还要强调你的独特性。因此,在这样的情况下,几年前钉钉就开始推出低代码,这项技术确实解决了很多人的问题。我们的低代码应用数量也在迅速增长。
但我认为,低代码虽然解决了一部分问题,但背后的挑战还远未解决。比如,以前可能有 100 个场景,专业软件能解决其中的大约 10 个,而低代码能解决大概 40 到 50 个,但还有约 50 个场景未得到解决。如果我们站在未来的角度来看待,或许三年后再回头看 AI 技术,可能会发现它有更大的潜力。也许在我们现在的视野中,我们仅解决了不到总问题的 10%,还有 90% 的场景未被覆盖,这里面更多维的信息更关键,而这些信息目前尚未被涵盖。低代码是一条路,可以覆盖一部分信息,而如今 AI 则提供了更多的可能性。
我们之前做数字化有个很大的制肘,即要结构化数据。因为原来的信息系统大多只能处理结构化数据,对于非结构化数据,我们只能叫做非结构化数据的“存储”。谁能说自己在非结构化数据处理方面做得非常好呢?事实上,“处理”相对来说是比较困难的。虽然后来在图像识别等方面取得了一定进展,但仍然存在大量信息无法被系统准确捕捉的情况。比如,在人们交流过程中,系统无法理解为什么某人在某个时刻皱眉或微笑,这种情况下系统完全无法感知。因此,早期存在大量细节和数据的损失。
因此,AI 到来之后,由于其多模态性、以及 Agent 的记忆和行动能力、能够像人类一样“操作”系统、能够复用原来的存量系统,还带来了更好的数据连接和协同模式,参与到了协作网络中。我认为,我们无法确定它能填补多少空白,但它的确开启了一轮新的数字化场景覆盖。这个观点是肯定成立的,即它将扩大覆盖范围。因此,这也带来了刚才提到的问题,即数据的密度和质量必定会迅速提升。只有解决场景覆盖问题,才能解决数据质量和密度问题。
然后,一旦我们使用 AI 解决了数据质量和密度问题,再结合 Agent 以及大模型来处理数据,无论是作为预训练素材、记忆还是感知的指标,从另一个角度来看,这将促进场景的价值感进一步增强。因为一旦你认识到数据的价值,你的报销流程可能会变得更加高效,你的财务管理可能会发生重大变化,你的营销策略可能会有很大改变,你销售员的培训、销售策略的制定以及销售资源的部署配置都会动态升级。这将形成一个非常良性的正向循环。实际上,AI 就像是在低代码的飞轮上再添加了一个巨大的飞轮,用于推动整个数据质量密度的不断提升,这就构成了一个正向循环。
InfoQ:您觉得这个关键的转折点大概会发生在什么时间点上?
程操红(巴布):这取决于我们的努力程度了。这个时间也很难预测。如果按照我们现在对产品的规划和预测,我认为今年可能会迎来比较大的变化。因为如今 AI 仍然存在一点不确定性,所以我们正在尝试通过工作流程、人工参与以及 Multi-Agent ,尽量减少每个 Agent 的职责范围来优化效果。
实际上,还有一个问题就是整个社会对 AI 的接受程度。因为 AI 与原来的软件系统是不同的,如果你期望 AI 像以前的软件系统一样百分之百确定,那可能会很困难。所以在组织治理和如何使用 AI 来构建新机制方面,(你可能需要思考得更多)。举个例子,就像我们在编程时,即使有两个专家参与,对于最核心的系统,像我以前在天猫交易时那样,即使一个人完成了工作,也要 double check,尤其是在双十一这样关键的时刻,不是 double check,是三个人 check,否则出了问题后果就会很严重。
因此,在如何使用 AI 方面,我们不能简单地套用以前使用软件系统的思维方式、管理模式或者容忍程度,而是需要思考更为重要的事情。比如,我们要考虑如何合理地配备三个 Agent ,或者人与 Agent 的协作方式。我们可能需要在这方面进行一些深入的思考。所以这一切取决于:一方面是在基础产品层面,我认为今年肯定会非常重大的一些发展;另一方面,是整个市场环境以及大家对 AI 使用方式的认识。就像汽车问世后,人们可能会觉得油价太高,或者噪音有些大,这些都是需要解决的配套问题。
InfoQ:您有提到 AI 思维变化,现在大家也提到未来我们跟计算机或者说移动应用的这种交互模式也许会发生改变。在这种前提下,有一些媒体报道说钉钉的目标是下一代互联网入口,那可不可以介绍下我们的规划或可能的实现路径是什么样的?
程操红(巴布):我们没有提出我们要做互联网的入口,实际上我们是说钉钉是一个超级 AI 助理平台。我们更希望这个平台,实际上我认为它不是一个入口,而更像是一个底座,我们的目标是如何将这个底座输送到千行百业里去,并在他们之间来构建网状的链接。实际上,现在很难做互联网入口的层面了。
以后入口会无处不在,因为像硬件各方面,包括企业自身的许多业务运营,实际上都有自己的入口。他们可能只是利用钉钉这个底座。有些甚至根本就不再称之为钉钉了,比如浙江他们把钉钉称为浙政钉,一些大客户已经对其进行了改进。
因此,我们更关心的是如何使钉钉成为一个底座,将搭载了 AI、数据消费以及产品信息形态等能力的平台,作为底座输送到不同客户的业务和组织治理网络中。这一点非常重要,如果我要表达我的理解的话,我认为这是一个非常重要的使命。特别是我之前提到为什么 AI 技术不是门槛的问题?当你建立了这些能力,并且构建了一个良好的生态系统,一个让所有参与者都能在其中投入和获得回报的生态系统。同时,在这个生态系统中,钉钉可以帮助解决那些对个体和小型组织来说难以实现的任务。然后,构建一个能够在整个产业中实现协作和网络效应的底座,这可能是我们的重要使命之一。
InfoQ:所以其实从这个角度来看的话,钉钉其实是一直在慢慢往后退的。就是把前面的舞台交给我们的客户,然后我们是提供一些底层的能力。
程操红(巴布):有时候,你可能会觉得钉钉在某些方面会做其中的一些工作,比如现在的 AI 助理也参与其中了。但实际上,这只是引发了大家的关注,是一个打样的过程。我们告诉大家,实际上这个事情是我们想要引导的一个方向。其实,生态里的有些客户甚至让我们感到惊讶,他们对这个理解比我们还深。他们可能会在这个基础设施上做出一些让我们都感到惊喜的东西。
我们仍然希望以润物细无声的方式推进,我觉得跟第一波互联网纯入口的感觉还是有蛮大差异的。但是,我们更希望我们的工作能起着无处不在的作用,这并不是说我们想要控制一切,而是当网络效应像滚雪球一样不断扩大时,当数据的密度和质量不断提高时,这样一个高度协同的网络实际上会产生一些非常有趣的事情。它将使 AI 的效果和价值更好和更强大。
InfoQ:这种高度协同,以及我们一直在强调这个生态,其实意味着说我们要去跟更多的合作伙伴,包括把这个能力赋能给企业的时候,他们内部所有的这些系统应用都是需要去打通的。
程操红(巴布):所以我们要降低这个打通的门槛,我们要降低数据消费的门槛,我们要降低产品往 AI 化改造的门槛。这就我们现在现实中不得不面对并且必须要去做的事。
InfoQ:降低这些门槛其实就是基于您刚刚介绍的低代码、AI 的这些能力去实现?
程操红(巴布):对,包括 Agent。刚才讲为什么它的业务集成模式变了?为什么我们想让 Agent 像人一样能学会操作存量应用,这都是降低门槛。否则在当下的产业环境里,人们会考虑投入后是否能立即获得回报,这是一个需要考虑的现实问题。
InfoQ:过去大家讲 UI,现在大模型来了,大家都开始讲 LUI 革命。那钉钉下一个或者说未来的版本交互界面,会有什么样的变化吗?有没有初步的一些想法?
程操红(巴布):这种变化其实我觉得正在发生。为什么呢?我们实际上从两年前就开始开发一种名为酷应用的工具,就像我刚才提到的百丽是做得非常出色的那种,他们将所有协作活动都集中到群组中。另外,我认为目前复杂软件存在一个很大的问题,那就是使用成本很高,而且它不是跟你的场景紧密相关的。举个形象的例子,就像当你口渴时,你希望旁边就有一瓶水,而不是要跑很远去买水,或者跑到冰箱去拿水。对吧?当我感到疲惫时,旁边就应该有一个靠垫,可以立即靠一下。所以,我们应该让更多的应用程序结构打碎,从而能够更灵活地适应各种情境,与情景紧密相关。
比如,我就想调货,你就给我一个调货的按钮,调货就好了;当我需要申请增加库存数量时,你可以给我一个简单的增加库存数量的选项。目前大多数软件可能都过于复杂,我进入后需要费一番功夫才能找到所需的按钮或菜单。这就是为什么我们要回到之前的话题,即数据密度的问题,因为软件的使用成本太高。我们需要让应用功能自动找到我们,而不是让用户费力去找。所以,我们之前引入的酷应用,AI 其实就是这种理念的延续。酷应用会主动为你提供所需功能,我们只是把它输送到了你的手边。那么,AI 是什么感觉呢?就像你说口渴了,水就自动滴到你嘴里一样简单。所以,这种体验又是一个进一步的提升。
实际上,在过去大约两年的时间里,我们一直在努力鼓励我们的生态系统和客户,将那些复杂的软件进行解构、打碎,并将其融入到钉钉的文档、IM 甚至音视频会议中。比如,当我在开会时需要查找一些信息,只需轻轻点击一下就能得到,是不是很方便?我们实际上一直在鼓励大家这样做,因此我们在底座上进行了大量的开放。只要你想使用这个底座,它就是开放的。除百丽公司的例子之外,还有很多其他类似的客户,包括我们自己的生态系统中也有很多这样的应用,但是我们认为还有一步之遥,就是尽管(那个功能)它已经近在眼前,人们有时候仍然会忘记使用它,即使它就在那里摆着。
因此,我们的第一步需要将该功能集成到群组中,也就是所谓的酷应用;第二步则是通过 AI,使其能够直接理解自然语言、语音甚至视频,你是否经常遇到这种情况呢?一个德高望重的人给你发来一段视频,即使他什么都没有说,你也要再稍微理解一下吧?实际上,在这种情境下,AI 可以介入了,AI 可以提出三条建议,让你能够更好地回应。这种感觉不同于传统软件的使用体验,因为它完全融入了你的实际场景之中。
InfoQ:其实可以这么理解,就是把 AI 当个人。
程操红(巴布):在谈及使用界面时,如果我们讨论 GUI 与技术问题,但我认为深层次的变革在于什么呢?那就是你将其视为一个个体,而且这个个体是与你贴身相伴的、时刻为你服务的。以前如果投入了大量的 IT 费用,可能只有领导层能享受到这种待遇,能给他们提供非常好的数据洞察,但也不是给更多的建议。而现在不同了,每个人都能享受到这种贴身化的服务。
因此,我给我的团队设定了一个目标,就是今年上半年每个人至少要创建一个助理,必须得有人使用。第二个目标是至少要使用六个以上的助理,除了默认的助理,还必须学会使用它们,如果你不会使用,那你的思维方式就没有改变。
你刚才很好地总结了交互形式的变化,实际上就是把它当作个人来对待。其实如果你想想,这与软件市场很相似,也非常有趣。比如说真正的公司高层管理者很少使用系统。他们更倾向于让别人为他们完成一些任务,比如要求人事部门导出薪酬分布数据。实际上,这是人的本性。我认为每个人都喜欢这样,就像我也不喜欢费时地在系统里搞一堆操作再提交。当你躺在三亚的海滩上时,你肯定会简单地告诉助手:“明天我想回去了,请帮我订张机票。”这样最方便了。现在我们就希望系统能变得更加贴近这种方式,这是远近形态的最大变化,就是变得更加便捷。
InfoQ:鼓励合作伙伴和生态伙伴将他们的应用程序结构化,并将其置于底层系统之上,是否可以理解为当前所描述的 No App,换句话说,它实际上是将功能解构为一个个的组件?
程操红(巴布):解构为 Agent 了。那么类似于 No App 的概念是什么呢?就是在未来,随着人们对 Agent 接受程度不断提高,那些以核心入口为导向的 App 可能就价值没那么大了。比如,当我真的饿了,想吃饭的时候,我可能主要是告诉我的助理让他帮我订外卖。在这种情况下,我还会自己打开某些 App 自己点吗?不会的。这是为什么这种情况会逐渐成为现实。正如我之前所说,随着 Agent 对你的了解越来越深入,它可能知道你最近感冒了,嗓子不舒服。它会跟你说:“虽然我知道您很喜欢吃香菜,但是我了解到您最近可能嗓子不太好,而且明年还有演讲,我建议给您点一些清淡的食物,您觉得可以吗?清淡的食物中也有一些口味不错的,比如海鲜粥,您觉得如何?”
在这种情况下,你认为手机上装载的大量 App 还有机会吗?因此,这也解释了为什么我刚才对“互联网入口”这种说法不太赞同。本质上我们可能在努力构建最好的 Agent,这可能是我们的核心目标,我们不断提升组织和个体的最佳经验和认知,驱使它发生变化,这可能是更重要的事情。
InfoQ:那未来 App Store 会不会变成 Agent Store?
程操红(巴布):是的,所以当前的竞争格局可能会发生一些变化,不再仅仅是应用厂商之间的竞争,也不再是各种互联网入口之间的争夺。未来,诸如硬件入口、汽车入口等,手机制造商可能都会做 Agent store。
因此,回到我们上面讨论的问题,Agent 背后的核心能力和核心壁垒到底在哪里呢?我认为还是数据和协作的方式,协作的紧密程度和效率可能是至关重要的。
因此,最终的壁垒在于产品形态,你是否能够率先进行升级?你是否能够迅速在你的生态系统中建立起数据消费的方式和良性循环?并且,协作的支撑是否能够充分实现?换句话说,人、硬件存量系统和 Agent ,你是否能够将它们处理得非常出色?这个合作密度的习惯,从习惯到协作本身的方式,以及多模态载体的支持,再到信息加工的效率,这些方面可能是综合起来构成的壁垒。
InfoQ:那您提到的这个钉钉的底层系统,它未来会不会就是一个 Agent Store 的形态?
程操红(巴布):是的,钉钉其实是个底座。在这个底座之上,随着创建的 Agent 越来越多,我认为自然需要一个 Agent Store,让人们从中获取 Agent,并促使行业之间进行一些分享和交流。一种是个人创作的,比如紫砂壶大师、摄影搭子、 AI 红娘之类,这本来就是跨网络的,因为钉钉的网络不仅局限于一个组织内部。钉钉的组织协作有两种方式:一种是纯粹在组织内部的协作,你可以将其边界限制在组织内;另一种是跨组织的产业链协作,甚至可以是全社会范围的,比如我们不在同一个组织,但我们也可以成为好友,然后你的助理也可以加入我们的群聊,从而促进合作效率。
InfoQ:目前 Agent Store 有什么初步的规划吗?
程操红(巴布):4 月 18 日推出的助理市场,涵盖我们生态系统中的一些 Agent,其中包括许多开发者、客户,以及钉钉自己做的。目前大家对此的热情相当高,我们同时还在举办大赛。
这一波推出的更多是让大家体验 Agent 的形态差异以及它所具有的一些特殊特性。当然,我们的产品在过去两个月里一直在持续升级,包括工作流的升级和记忆能力的升级。我认为未来会变得更加有趣,Agent 能够完成的复杂工作将变得更加多样化,我对此非常期待。
InfoQ:在这里面怎么调动生态、开发者以及内部员工的积极性?
程操红(巴布):这三种情况完全不同。对于内部员工来说,特别是那些特别拥抱 AI 的人,他们基本上不需要被推动,他们自发地做得特别多。我也经常自己去做 Agent。然后,第一个 Case 就是我自己做的。我记得去年那个时候,当其他人还在观望的时候,我就已经做了一个。有些人可能想专注于本职工作而持观望态度,所以我们强制要求,如果不行就进行考核,意思是你必须去做。现在我们已经都接受了,大家调动了起来,所以最近两周我们又做了 150 个 Agent。里面有些特别特别好的,人们的创造力是无穷的。对于员工这一侧,我们采取了软硬兼施的方式。
对于客户来说,我觉得探索共同价值是非常重要的,因为钉钉上的客户共创精神一直保持得很好,一旦你发布了一些东西,一些特别活跃的客户立刻就会联系过来。他会根据场景进行结合,因为客户实际上是一个庞大的群体,其中有许多活跃的个体,有些人有很多创意,包括杭州市公安局,他们做了三个作品,非常令人称赞,涉及市民服务等各个方面。还包括农业等领域都有。总之,许多客户都在共同创造。另外,他们本身肯定也关注到这种变化,特别希望在自己的行业或工作环境中找到一些突破点。
至于生态系统,我认为我们需要认真考虑商业化机制的设计,因为每个人在生态系统中,说白了,都是在创业,好多生态都是拿着自己的身家在创业。所以,从本质上来说,我认为你可能不能仅凭个人感觉来要求他们,你还必须从商业健康的角度来看待生态系统。
因此,我们需要逐步引导他们,包括为什么之前要做酷应用,包括现在为什么要做 Agent,我们要一步步地引导他们。我认为他们的做法首先是对产品本身进行升级,这在中长期内对大家都是有益的,但短期内,他们会获得什么好处呢?那我们会加大对这些 Agent 的投放和商机引导。
因此,无论是做酷应用还是做 Agent,其本质目的是让更多钉钉用户和群体了解他们的解决方案,这样他们的思维就会更加清晰,觉得你在同步做非常好的升级。
其次,如果他确实发布了一些高频的 Agent ,针对特定场景,这将会增加客户对他的兴趣,无论是续费还是新增购买。我觉得还是以商业为抓手,我们的开放平台机制将与之配合,我们的 Agent Store 本身也是由开放平台团队和运营团队统一运营。
InfoQ:客户方面,他们首先必须具备业务需求。过去不管是信息化阶段还是数字化阶段,大家明显感受到的是只要效益还可以,就不愿意去做变革。所以现在客户会主动寻求改变的核心驱动力是什么呢?
程操红(巴布):我认为情况可能不完全如此。一方面,你提到的是其中一种情况,另一种情况是已经尝到了甜头。比如,在江浙地区,你会发现政府里很多人都非常有动力,为什么呢?因为他们已经享受到了数字化带来的好处。他们觉得必须采取新的方式来(处理事务),相信这样做一定会取得出色的成绩。这种态度完全受到组织文化的影响。当然,还有很多客户,他们只希望不出错就好,这由一些单位的属性和性质,包括文化所决定,因为很多事情是无法容忍错误的。
浙政钉呢,他们感受到了数字化建设带来的好处,现在每天有超过 160 万人在上面使用。因此,他们鼓励这种氛围,要求你进行创新,开发一些应用程序。有部门有时会工作到凌晨一两点,比我们还要辛苦,这是他们的动力所在。
还有一些公司可能是因为当前的模式已经到了一定阶段,他们觉得确实需要探索一些新的模式。他们也面临着一些痛点,比如在农业种植领域,如果他们在大棚种植方面做得很好,那么如何将这种经验复制到其他基地呢?他们发现这是一个需要解决的问题,传统的管理方法可能难以应对。此外,他们还需要考虑市场需求,如何将市场对蓝莓酸甜度的差异传达到生产基地呢?在这方面,他们会想办法采用数字化或智能化的方式来解决问题。
前期我们也会寻找一些相对确定性较高的点。例如,像问答这样的功能,因为许多企业拥有大量的知识,就像电子类型的客户,由于他们专业知识很强,而且涉及的物料也很多,一般人难以搞清楚。因此,对于员工的内部培训和客户的问答,“智能客服”就可以让人们能够立即感受到好处。所以,他们也愿意投入使用。
InfoQ:过去大家实际上是比较愿意投资于创新的。但是在过去的两年里,经济形势可能面临一些挑战,人们会非常关注投入产出比。根据公开资料,去年钉钉大模型平均单次调用的成本只要五分钱,钉钉之前有表示有 6-7 亿用户,并推出了个人版,这种情况下,如果大规模使用,应用成本和对应的商业价值如何去做平衡?
程操红(巴布):成本肯定是要考量的。但说实话,目前这个阶段我们更加鼓励客户在场景上与我们一起创造一些高价值的引导式样板。实际上,我认为这对整个产业的变革也有着巨大影响。
因为说实话,钉钉一直以来,包括阿里本身,在这方面一直都有投入。我们也希望在 AI 方面能够拥有更多的生态伙伴,我们对生态也提供一些补贴。对于生态中完成了 AI 化重构的话,我们在佣金上也有专门的策略,会提供一些补贴。另一方面,目前我们在人工智能的使用上并没有进行过多收费,这是一个当前的情况,但从中长期来看,这显然不是一个能够持续长久的模式。在中长期内,我们与通义团队合作,同时还有其他的一些第三方模型,我们肯定会在保证模型本身一定性能的情况下考虑这些成本构成。
最初我们是说五分钱,但现在模型的尺寸不断增大,有时甚至超过了五分钱,达到了一毛二。然而,一方面我们没有向客户收紧,另一方面我们会持续优化模型的使用策略,包括在工程层面。举例来说,如果你总是向系统提供相似的图像,就没有必要每次都使用大型模型。此外,在混合模型的使用方面,我们也有一些规划。在某些相对确定的场景中,其实不用那么大尺寸的模型,或者可以使用相对较小尺寸的模型来替代,这实际上将成为未来一个非常重要的成本优化策略。更重要的是,我觉得开源节流是一方面,另一方面是要创造价值。当 AI 的价值能够得到客户的真正认可,能够节省大量人力、物力和资源浪费的时候,它带来的直接体验和付费意愿肯定会比以前更好。我认为这方面比起以前的 SaaS 肯定更好。
InfoQ:目前在应用 AIGC 的过程中,收到的您认为最有价值的客户/用户反馈是什么?
程操红(巴布):我认为一方面是每个人的体验可能不太一样,但从实际数据的客观分析来看,最常使用的功能肯定是消息总结。因为大家的信息有点过载,尤其是对于重度用户来说,他们的消息总结和每日小结目前效果还相当不错。当你在一个群里有很多未读消息时,或者当你需要回顾昨天一些重要任务时,它可以为你提供一些相关日程消息的重要摘要和回顾,这是一个非常重要的功能点。
其次,在 IM 中,快速传递信息也是非常重要的,比如刚才提到的图片小尾巴功能,无论是发送任何文档、日志链接,甚至是长篇文章,它都可以帮助你快速浏览阅读,而这个功能目前的使用量也相当大。
第三个方面是,大家开始尝试一些类似于 AI 助理的创建。因此,你会发现在钉钉上 AI 助理这一类应用特别受欢迎,尽管我们并不完全面向 To C,但大量的 AI 助理应用正在不断涌现。
随着大量 AI 助理的涌现,人们也开始尝试创建各种熟悉的模式。他们会创建许多小助理,比如帮助孩子写作文的助理,每个助理都有自己的风格,因为五年级和六年级以及初中的需求肯定是不同的。他们可以制定一些适合自己的规则。比如,我自己创建了一个数据参谋,可以查找各种热点信息,还可以查找内部的一些关键信息。这样的助理包括一些关键词的自动探测功能。实际上,在助理的探索过程中,其数量也在逐渐增加,使其越来越受欢迎,并且发展速度会变得非常快。
另外还有许多内置的功能,其实你可能无形中在用了 AI,比如文档处理。文档编辑器内置了大量的智能功能,如帮助你润色、生成思维导图,甚至一键生成 PPT 等。这些功能在大量使用,特别是对于那些知识型工作者来说,他们现在能够很好地利用文档智能化功能。另外,在音视频会议中,我们还有一个叫做“闪记”的功能,它可以在会议结束后快速为你生成摘要,包括文字摘要和一些带有图片的 PDF 文件,使得对会议内容的理解更加迅速。这些功能的使用情况逐渐增多,针对不同的需求也各有偏好。
InfoQ:我们一直在顺应大模型的发展,这对技术人员包括业务人员的能力要求是不是不一样了,对钉钉团队或人才结构是否有造成影响?
程操红(巴布):团队我觉得确实要发生变化,但是团队的变化也没有那么快。去年我们深刻地感受到了这一点。
我认为这是因为整个软件开发范式正在发生变化。所以如何更好地理解、了解和探索当前大型模型的最佳能力特征,这是许多研发团队需要掌握的技能。你需要了解的是:大型模型现在具备了一定的 planning 能力了,大模型开始能够处理声音了,大模型对说话语调的识别有了新的进展了......大家对模型本身的这种能力一定要有充分的了解。
这就好比我们上一代程序员对操作系统的了解。你必须了解操作系统的许多特性,因为实际上操作系统的特性非常丰富。如果你不了解这些特性,那就很难操作。而且现在,这种了解已经开始演变,人们说以后不再是专业语言,而是文字语言,所以可能要把语文学好,在这个基础上 prompt、微调。
当然,并不是每个人都必须掌握这些技能,但是我们确实有一个专门的团队负责进行这种微调的工作。这需要具备算法背景,但更多的人需要理解大模型的工作原理。另外一个方面是,在大模型之上,需要进行软件工程或者应用工程,对于这方面的工程化工作,我们需要结合多方面的知识。换句话说,我们需要重新审视我们手头的资产,比如说在钉钉上,我们有宜搭,有大量的低代码应用,有开放的 API,有大量的 OA 审批流程,还有大量的数据资产。在工程的角度上,我们需要思考如何将最新的 Agent 形态与这些资产有效地结合起来,需要考虑如何将数据资产转化为 Agent 的记忆,另外,也需要思考如何将低代码的应用转化为 Agent 可以使用的动作。
在这个层面上,我们需要有新的思维方式,而不是每天都在纠结如何创建低代码应用或者将应用发布到工作台,因为这显然跟不上发展的步伐。我认为这并不是要换人,而是我们团队内部在不断地引导和学习。
为了实现这一目标,去年我们技术委员会持续在运营。去年我们曾经连续两个月举办 AI 专场活动,每周都做全员的分享,学习 Prompt、了解模型特性、熟悉基于大模型的编程体系和框架,以及如何结合钉钉的核心数据应用接口等,了解这些实践经验。在我们的千人技术大群里,我们首先鼓励大家将一些常规操作,如答题和发勋章等,转变为 AI 化的新形式,并不断影响他人。
我非常认同一个观点,即我们应该转变对 AI 理念的认识。例如,当面对新的运维和容量规划痛点时,仍然有很多人想着如何构建应用、建立流程或进行流程审批。我认为这样不行。我们应该用 AI 的方式来思考容量规划应该如何进行。我们应该把现有的算力资源,比如说阿里巴巴达摩院通信实验室提供的资源,以及一些我们自己应用层的云上资源,引入一个“资源管理专家”的助理,让它来做更好的新型规划?
原本运维可能会考虑开发一个系统,然后雇人在上面填补缺漏,但这样做是不对的。现在这位“资源管理专家”不仅可以进行容量规划,还能解答各种资源容量管理规则的问题。这样一来,原本需要一个团队成员每天回答各种问题,如“你为什么把我限流在 500 了?”,现在这个情况就不复存在了。现在他可以从前期咨询容量管理原则开始,一直到实际容量管理的先行规划,再到提出容量方面的建议。比如,他可能会在中午突然发消息给你,说他认为你的业务做得不错,你应该再申请 500。这种情况下的感觉就完全不同了,是吧?因此,这实际上是一种思维和理念的升级。
我们持续不断地进行这样的改变,会让一些人脱颖而出。在我们现在招聘人员时,我们也首先会考察几个关键点。我们会给你一个场景,并询问你用 AI 怎么解决,我们会考核你对于当前大型模型的主要进展、大型模型能力的理解以及一些 prompt 观念的理解,看看你是否有自己的心得。这肯定会改变人力模型。
InfoQ:所以是从这个文化、组织、流程、对制度等所有的方面去不断的去提升和影响,
程操红(巴布):需要进行大量的工作,这涉及到我们内部的工作、技术运营以及各种场景。大家也在自行创建 Agent,比如强制要求你去做,创业公司一定要吃自己的狗粮。总之,我们在推动这种变革时采取了软硬兼施的方法。
InfoQ:最后一个问题,您对于 AI 未来还有什么样的预测吗?包括在这个 AI Agent 的这种趋势之下,未来软件的世界会发生什么样的改变?
程操红(巴布):我主要感觉就是关于“No App”的预测,因为我认为这种趋势会越来越明显。我认为未来肯定会有更多非常个性化的助理出现,甚至只需对手表说句话就可以了。
另外,我认为对于个体和组织的变化来说,未来会有更多的小型组织出现。对于大型组织来说,可能会从资本层面或者控股层面,或者是从市场层面找一个维度。比如过去我们一直尝试着做的,类似于阿米巴那种模式的感觉,以前不是因为太复杂而难以实施吗?但在 AI 的支持下,我认为未来会变得更加灵活,也更容易获得充分的授权。
这种小型的组织会出现,为什么呢?因为它能够更好地享受大的平台和大集团带来的便利,它在独立运作方面的空间会更大。有了整个 AI 助理的支持,有了更高效的数据流通,有了更好的协作,小型组织将成为一种趋势。
未来 AI 助理将会完全拓宽其服务组织和个人的载体,其服务模式会变得更加丰富。就像现在为什么一个人似乎能够成为网红一样,有了视频或直播载体,就能够营造很多大咖。我觉得 AI 助理会使这件事更加多样化,可能不会达到那么大的规模,但是每个人都有机会,可能一个普通人也有机会,因为他懂得一些东西,比如知道如何养蚂蚁、怎么种蓝莓、怎么腌制最好的咸菜。那么他可以把这种技能作为助理,将这种多样化的服务传播到协作网络中。所以我认为未来会出现更多这种小型组织,甚至一个人就可以是一个组织,这是一个很有趣的发展。
然后再深入地讲,我当然有一个更长远的想法。我认为,当你的数字化程度足够高,当你更多地参与了这个协作网络的 AI 助理时,实际上未来的资源配置、项目管理,以及许多现在我们需要人力的地方,可能相对来说实际上并不需要那么多人力。但即使如此,人类应该更好地去探索艺术、资源以及人类情感等更有意义的事情。现在很多事务性的工作,有人做得很出色,有人做的不好,这种工作分配以前取决于 leader。我认为这种情况 AI 可以在其中提供服务,就像 Transformer 算法一样,他可以分析你的工作表现为什么这么出色,然后在下次安排工作时,优先选择你。AI 能够更好地进行资源的配置和人员组织安排,这当然是一个更长远、也很有意思的想法。
评论