本文最初发布于 T.Ferguson 的个人博客。
混合智能是一种让人工智能和人类一起工作以实现预期结果并相互学习的方法。
图片来源:https://www.piqsels.com/en/public-domain-photo-zwfob/download
人工智能(AI)正迅速成为全球数据生态系统的主导趋势。而且,在经过十年的发展后,它预计还会继续增长。
数据社区对人工智能及其所能完成的任务了解得越多,IT 系统和结构就能获得越多的赋能。
这就是为什么 IDC 预计到 2024 年市场规模将达到5000亿美元,它会渗透到几乎所有行业和数量庞大的应用程序和服务中,目的是提高工作效率。事实上,根据 CB Insights Research 的数据,在 2021 年第三季度末,人工智能公司的融资已经超过了2020年约 55%,连续四个季度创造了全球纪录。
根据人工智能在复杂认知任务(如自然语言解释)方面的进展,我们预计,2022 年,它在解决妨碍非结构化语言数据驱动的操作(NLU)方面将变得更加强大。同时,对人工智能的如何和为何的审查将越来越多。例如,美国国家标准与技术研究院(NIST)将继续采取措施,使人工智能更容易理解。这需要在不降低性能或增加成本的情况下,让人工智能的计算功能更加开放。
语言理解的挑战
理解语言是人工智能必须面对的最困难的问题之一。
虽然大多数人工智能系统可以在眨眼间处理大量的原始数值或结构化数据,但语言中有大量含义和细微差别,上下文不同,描述的故事可能就不同。
对人类思维来说简单而自然的事情,对软件来说却不那么简单。这就是为什么创建能够持续正确地理解语言的软件已经成为人工智能全面发展的一个重要方面。让人工智能可以获取和吸收几乎任何类型的知识,实现这种水平的计算能力将真正打开人工智能发展的闸门。
受限于挖掘大量语言数据的能力,NLU 是这个难题的一个关键部分。由于语言遍及商业活动的各个方面,如果不能从这类数据中收集尽可能多的有价值的信息,人工智能战略就不完整。
基于知识或符号的人工智能方法利用了一个开放式的知识图谱。它的结构是人类设计用来模仿现实世界的,其中定义了概念,而概念之间通过语义关系相互关联。借助于知识图谱和 NLU算法,你可以阅读和学习任何现成的资料,真正理解数据分析过程以及从那个解释形成的推论。这可以与我们人类获得特定领域知识的方式相媲美,让人工智能项目将算法输出与明确的知识表示联系起来。
我们应该看到,这种结合两种方法的人工智能战略是一种明显的趋势。混合人工智能采用了各种策略来提高整体性能,更好地解决高难度的认知问题。对于 NLU 和自然语言处理,混合人工智能正变得越来越流行(NLP)。针对如今企业提出的准确、快速、大规模解锁非结构化语言数据价值的需求,最有效的方法是将基于人工智能的知识或符号人工智能与学习模型(机器学习,ML)相结合。
知识、符号推理和语义理解不仅会产生更准确的结果和更高效、更有效的人工智能环境,而且还会减少在昂贵的高速数据基础设施上进行耗时的资源密集型训练所产生的浪费。主题专家和/或机器学习算法可以通过分析微小的定题训练数据集来增加特定领域的知识,从而快速有效地提供准确、可行的答案。
混合人工智能的世界
为什么现在会发生这种变化?为什么人工智能以前没有能够利用基于语言的知识?学习方法让我们相信,它们可以解决我们的任何困难。但也只是在某些情况下可以,因为 ML 在某些情况和上下文中表现良好,并不意味着它总是最佳选择。当涉及掌握和吸收语言的能力时,我们经常看到这种情况。只是在过去几年里,我们看到了基于混合(或复合)人工智能的 NLU 取得了重大进展。
我们现在不是使用单一类型的人工智能和一套有限的工具来解决一个问题,而是可以使用许多方式。每一种都可以从不同的角度来处理问题,在多上下文中,采用多个模型来评估和解决一个问题。而且,由于这些策略中的每一个都可以独立于其他策略进行检查,所以很容易弄清楚哪些策略生成的结果最好。
2022 年,这种混合战略有望成为一项战略性努力,企业已经尝到了人工智能所带来的好处。它节省了时间和金钱,同时加快了分析和操作程序的速度,提高了准确性和效率。举例来说,考虑到训练的复杂性和成本,现在的标注过程是由少数专业人员进行的。通过整合适当的信息库和图,训练过程可能被大大简化,使其在整个知识工作队伍中实现民主化。
未来展望
当然,各种人工智能的发展是一个持续的过程。然而,由于企业一直面临着快速、低成本地使用大量数据的压力,我们将看到人们会对构建知识图谱和自动化 ML 和其他技术特别关注。
随着时间的推移,我们将看到企业利用这些混合模式在一些最关键的活动方面逐渐取得进展。电子邮件管理和搜索已经成为业务自动化的案例。例如,目前基于关键词的搜索方法本质上还无法吸收和理解整个文档,这就是为什么它只能检索到基本的、本质上没有语境的数据。同样地,自动化电子邮件管理系统也很少能够解释产品名称等数据点之外的意义。最终,用户不得不对大量的结果进行筛选,才能获得最重要的信息。流程被拖慢,决策被推迟,生产力和收入因此而受到影响。
所有以知识为基础的公司都将能够通过在混合架构中结合 NLU 工具和符号理解,在其智能、自动化流程中模仿人类理解整个文档的能力。
查看英文原文:
评论