近日在谷歌云计算大会(Google Cloud Next Conference)上,谷歌推出了一项测试版的机器学习服务:文档理解AI。该服务主要面向企业内容管理(Enterprise Content Management,ECM),使客户可以使用人工智能(Artificial Intelligence,AI)和机器学习(MachineLearning,ML)对非结构化的文档内容进行组织、分类和提取键值对。
Gartner 和福布斯估计,80%的企业数据是非结构化的,而 70%的企业数据是自由格式的文本,如电子邮件、书面文档和评论等。随着企业组织中数据量的日益增加,谷歌意识到这是一个利用人工智能和机器学习来解决企业内容挑战的绝佳机会。谷歌企业产品经理Levent Besik这样解释到:
许多企业看到了将人工智能和机器学习应用于业务挑战的价值,但并非所有企业都拥有必要的资源来实现这一点。从一开始,我们就把让尽可能多的企业能够使用人工智能作为目标。让人非常兴奋地是,我们也为此实现了一些新的解决方案,这些方案可以让企业用户非常容易地使用人工智能来解决常见的商业挑战。
包括能源、金融和医疗看护在内的很多企业,都在内部文档数据管理上受到了制约。通常,对文档的分类和组织需要大量的人工干预。谷歌云产品经理Suderra Vanguri解释了如何通过文档理解 AI 来提高企业内容管理的效率:
文档理解 AI 是这样一个解决方案,它能够自动化一些关键的文档处理流程,并从文档数据中提取出有价值的知识。文档理解 AI 是如何做到这一点的呢?这要归功于我们背后强大的人工智能技术储备,如自然语言处理能力、认知能力和视觉 OCR 能力等。
文档理解 AI 允许企业用户分析表单、文档和合同等数据,随后从这些资料中提取出键值对和实体。此外,通过谷歌提供的认知服务(一项仍处于 alpha 阶段的认知能力),企业可以添加自定义模式。
谷歌已经与Iron Mountain、Box、Egnyte、UiPath、Accenture以及Taulia等多家公司建立了合作伙伴关系,极大地扩展了文档理解 AI 的生态系统。以 Taulia 为例,他们将谷歌的文档理解 AI 服务应用到自己的全球发票平台,通过 AI 智能读取和解释非结构化的供应商发票数据。
发票识别充分利用了光学字符识别(Optical Character Recognition,OCR)技术。通过发票识别,Taulia 认为他们可以将发票处理的成本从美元降到美分。Taulia 首席技术官Brady Cale这样评价发票识别:
使用人工智能,我们终于解决了很多企业所面临的、也是非常棘手的发票处理问题。现在我们能够充分实现我们的愿景,那就是让买方和供应商能够自由地交换信息。发票处理的速度越快,它也就能越早在营运资金战略中发挥作用,从而也能让公司资金更快的周转。对于金融企业来说,这无疑是一个彻底的游戏改变者。
更多关于文档理解 AI 以及测试版注册的信息,请访问谷歌产品页面。
英语原文地址:Bringing Intelligence to Enterprise Content Management, Google Releases Document Understanding AI
评论