人工智能技术成熟度逐渐提升,但由于业务场景千差万别,单一的技术很难解决所有问题。感知智能只能实现对语音、图像和人脸的识别,而 认知智能可以更好地理解语言的含义,实现和人类的交互,以及各种洞察和决策分析。
当前业务的实际需求正在推动大数据、人工智能等多种技术走向融合。一方面,大数据与人工智能是相辅相成、互相融合与衔接的,这两者融合的趋势非常明显。另一方面,人工智能三个流派——符号主义、连接主义和行为主义也在走向融合。
其中,符号主义的代表是知识图谱和专家系统,连接主义的代表是深度学习和人工神经网络,行为主义的代表是强化学习和机器人。各流派各具优势,但也存在不足。比如,连接主义中的深度学习虽然预测精度高,但可解释性弱,而且需要大量的标注样本。符号主义拥有良好的解释性,行为主义不需要标注样本。因此,需要将三个流派融合,相互弥补缺陷,实现机器向人一样决策。
作为率先发展大数据+认知智能技术的先驱,百分点构建了以数据治理为核心的大数据全栈技术产品,和以自然语言处理、动态知识图谱为核心的认知智能技术产品,通过多技术融合的方式,来解决非结构化数据处理问题,构建复杂事物间的联系,最终提升机器决策能力。
尤其在认知智能技术突破中,百分点积极探索三个流派的融合。比如将深度学习和迁移学习融合,实现在标注量小的情况下依然能达到较高的准确率;将深度学习和知识图谱融合,实现对自然语言更好地理解。目前已在情感分类、智能校对、智能问答、小语种翻译中取得了不错的效果。
在赛道的选择上,百分点立足于自身技术能力和客户业务需求,选择应用场景丰富且数据量大的行业重点服务,如公共安全、数字政府、媒体出版和零售快消等,为客户提供从咨询到技术服务到业务决策再到运营的全流程服务。与此同时,跟随国家“一带一路”倡议,百分点作为首家出海服务海外国家数字化建设的企业,已帮助亚非拉多个国家搭建了国家级大数据和人工智能平台。
在零售快消领域,百分点通过将深度学习和知识图谱融合,对网络用户评论进行分析,解构产品细节的优缺点,指导产品研发方向。
在公共安全领域,百分点构建知识图谱建立公安五要素人、事、地、物、组织的关系,快速识别异常线索,并对线索进行不同维度的分析,提升公安执法效率。
随着认知智能技术的不断发展,技术在行业中的落地应用不断加深,政企的业务将迎来全新的变革。
近期,爱分析对百分点首席运营官刘钰、首席算法科学家苏海波、首席架构师黄伟进行深度访谈,就百分点的技术和产品进展情况、对客户需求的理解、技术的发展方向等方面进行了深度的探讨,现将访谈内容进行分享。
图片从左至右依次为:首席运营官刘钰、首席算法科学家苏海波、首席架构师黄伟
01 重点探索 认知智能三个流派融合**
爱分析:百分点的认知智能技术有哪些新进展?
苏海波:主要是推进认知智能三个流派的融合。
我们首先是在深度学习和迁移学习的融合上做了比较多的探索,目前深度迁移学习模型已经应用到了认知智能的许多具体任务上,包括命名实体识别、情感分类、内容校对以及智能问答等都取得了不错的效果。
其次,通过知识图谱和深度学习的融合,实现对自然语言更好地理解。在深度学习融合知识图谱方面,我们在研发如何将深度学习与快消零售、公安的知识图谱相结合,提高这两个领域的语言认知水平。
在连接主义和符号主义流派的融合方面,还有目前特别热门的图神经网络,也就是 GNN 技术,它为深度学习模型赋予了一定的因果推理能力,弥补了深度学习模型的软肋。
最后,在深度学习融合强化学习方面,我们实验室自主研发的智能对话机器人产品正在研发该项技术。通过用户模拟器和机器人对话,给出对话的反馈信号,通过深度学习模块进行意图识别和任务中的槽位信息提取,再通过强化学习模块对模拟器产生的大量样本进行模型训练。
爱分析:三个流派的融合能解决哪些问题?
苏海波:在深度学习和迁移学习的融合中,由于深度学习需要依赖大量的标注样本,而在实际中标注数据往往是不足的,而且标注工作的代价高。通过深度学习和迁移学习的融合,解决小样本问题,即在标注数据比较少的情况下,解决实体、关系和属性的抽取问题。
其次是解决小语种问题,现在小语种国家的客户需求很大,但这些国家的标注数据通常比中国要稀缺得多,如何提升小语种标注的效果是非常大的挑战。
爱分析:深度迁移学习技术在迭代优化过程中主要面临的挑战有哪些?
苏海波:举例来说,BERT 模型是典型的深度迁移学习技术的代表,其面临的问题主要有以下几点。
第一,模型对于长文本处理做的不够好。第二,模型的训练对硬件资源要求较高,普通开发者很难负担得起。第三,因为模型大,预测时间长,无法满足客户实时服务的需求,需要进行预测性能的优化。第四,如何将深度迁移学习和知识图谱这两个流派进行融合,也是未来技术上要突破的方向。
爱分析:认知智能三个流派的融合在产品实践上有哪些新进展?
苏海波:比如百分点认知智能实验室研发的舆情情感分析系统,对比采用传统的深度学习模型,需要标注 10,000 个样本,才能达到 80%左右的分类效果,但百分点采用了深度迁移学习,只需要 1,000 个样本,就能达到 80%左右的分类效果。
对于深度学习和知识图谱的融合,已经在探索实践如何将自然语言处理与快消零售、公安的知识图谱相结合,提高这两个领域的语言认知水平。
还有增强分析,通过自然语言与系统进行可视化互动,结合智能推荐、智能问答、智能挖掘等增强分析能力给用户推荐针对性的报告,这是我们后续重点要提升和商业化的技术。
爱分析:对于技术发展方向的考虑是结合客户的需求还是百分点内部的技术规划?
苏海波:是几个方面的综合考虑,我们结合企业客户的需求,以及自身技术积累的优势,来决定技术的发展方向。首先是和我们聚焦的行业有关,比如公共安全、媒体出版,这些行业中的一些场景需求驱动了对于认知智能的需求。同时,这些需求跟我们自己的技术积累相匹配。
02 认知智能工具和 决策类产品齐头并进**
爱分析:2019 年百分点在产品方面有哪些新进展?
苏海波:这半年的时间,公司的产品进展主要是在认知智能产品线上进行丰富和升级,一共包括三条产品线:认知智能工具产品线、企业市场决策产品线和公共安全决策产品线。
关于认知智能工具产品线,我们重点对智能媒体审校系统、智能翻译系统和智能商业分析系统进行了升级。智能媒体审校系统主要针对新闻中的文字、图片和视频进行多媒体的审核,因为随着 5G 时代的到来,未来新闻中视频的内容会越来越丰富。智能翻译系统主要服务于我们的海外业务,包括中文、英语、俄语、阿拉伯语、法语等 12 种语言两两之间的互译,翻译的效果和谷歌翻译持平。智能商业分析系统就是我们去年发布的产品 Clever BI,最新的 2.2 版本在智能推荐、智能问答、智能挖掘等增强分析的效果上进行了进一步的优化。
关于企业市场决策产品线,我们持续研发迭代新版本的智能舆情分析系统,智能消费者洞察分析系统,这个系统也就是我们去年发布的产品 DeepQuest,目前已经服务了欧莱雅、星巴克、华为等众多客户。
关于公共安全决策产品线,我们发布了 DeepFinder3.0,这个版本中增加了比对碰撞(Cross Check)分析、数据挖掘框架等功能,目前已经在客户中落地,取得了非常好的使用效果。同时,我们还在封闭开发新的公共安全决策产品,服务于我们的海外客户。
爱分析:对于企业市场决策如舆情和商情分析,今年相比过去的传统做法有哪些提升和改进?
苏海波: 过去对于这种海量的非结构性文本,需要对内容进行抽取,依靠人力去打标签,后来技术发展由机器学习、深度学习等自动化技术完成打标签的过程。这个过程中面临的瓶颈是数据量不足,从而发展出了深度迁移学习技术,实现对标注信息少的数据进行精准打标签的效果。
爱分析:企业市场决策和公共安全决策两类产品线的业务场景诉求和底层技术能力是否有差别?
苏海波:技术上是有共通的地方,通常的逻辑是对采集到的结构化、非结构化数据进行处理,然后进行整合分析。尽管处理的数据类型不同,但所使用的技术如实体识别、关系抽取、知识图谱技术等都是有共通之处的。只是上层的应用场景有差别,中间层和底层的技术都是通用的。
爱分析:目前,认知智能的产品是以什么形式交付给客户的?
苏海波: 百分点认知智能的产品分为本地化部署和 SaaS 两种交付方式。
对于政府决策类产品,如公共安全类产品 DeepFinder,采用的是本地化部署的方式交付,会给客户布一套独立的系统;对于企业市场决策类产品,如智能舆情分析系统,以 SaaS 平台的形式交付,给客户提供 SaaS 账号。
03 全栈大数据辅助 政企业务决策
爱分析:在产品落地过程中,主要解决了企业的哪些需求?
刘钰:以两个典型的服务案例来说:一是中国免税品集团,百分点帮助它搭建了数据中台和业务中台,拉通了商品流转所涉及的多个系统,优化了业务全流程,实现数字化和智能化升级,并最终提升了利润和毛利率。
我们与中免一起制定了三期的计划,不仅针对营销环节,而是面向业务全生命周期,包括采购、物流、库存等环节。中免的会员、交易、商品、营销、店铺、GIS 等多维度数据被拉通,进而顺畅地流转,经营分析、供应商议价、门店协同采购、进销存优化等能力得到了大幅提升。百分点还帮助中免搭建了一套智能营销体系和商业模型,建立了与顾客多触点的及时互动,实现无感的营销,进一步提升了利润。
第二个案例是一家制造企业,需求是利用数字化的方法优化生产,提高生产效率。在小批量多订单的生产过程中,基于 AI 智能模型算法,综合考虑款式、设备、工序、员工能力等因素,对产线进行实时的动态规划,也可以保持工序间节拍平衡,让员工与操作任务之间始终处于最佳匹配状态,减少瓶颈,提高整体生产效率。
爱分析:对于大量细颗粒度信息的分析可以怎样帮助客户优化业务?
苏海波:首先是新产品的研发,对于产品改进方向的指引。比如一款手机,需要改进摄像头、充电性能还是外观?这里面涉及很多的细节。以前只能通过调研问卷的方式收集反馈意见,样本量小、很难覆盖大量用户的意见。通过互联网电商平台收集的用户反馈评论,细节更丰富,可以多维度了解用户对产品的使用感受。通过文本分析,可以了解产品的优势和缺点,从而指导产品研发升级的方向。
第二,可以实现对竞品的分析。通过与竞品进行比较分析,明确自身产品的优势和缺点,并有针对性地改进。
另外,可以对产品未来趋势卖点进行分析。通过对网络用户讨论的内容进行分析,提前分析出产品未来可能的新卖点,以便企业提早布局。
爱分析:为了解决业务问题需要做大量非数据类的工作,这是否偏离了最初做数据业务的初衷?
刘钰:没有偏离。百分点在三年前就提出了智能进化三部曲:从感知、认知到决策,最后的决策一定是业务决策而不是技术决策。技术、产品都是服务于业务决策的手段,最终目的是为了解决业务问题。
04 知识图谱深度 挖掘解构线索 提升公安办案效率
爱分析:公安部门具体有什么需求需要采用新的引擎或产品来解决?
黄伟:公安的业务模式大概会分为三个阶段。第一阶段是找线索,在线索中找异常的人、车或物。第二阶段是对线索进行分析,通过线索的各个维度去扩展,由一个线索扩展出更多的线索,由业务人员去分析线索里是否有异常的情况。最后一阶段是生成结论性的报告。
百分点的产品解决方案覆盖了这三个阶段,比如在找线索阶段,通过提供基于知识图谱的模型引擎,定时挖掘线索。其中既包括基于公安业务积累的战法,也有直接基于知识图谱的算法内置在公安系统中,辅助公安实时地寻找线索。
在分析阶段,查数据是最基本的需求。由于公安的数据非常多,又都存储在不同的系统,以前需要花费很多时间来查,现在我们把数据汇聚在一起,输出成知识图谱后,可以由统一的入口查询,获得信息的全貌。查询之后,还可以对关系进行分析,比如亲属关系、打电话建立的关系等,可以在时间、空间关系维度去扩展分析,构建更全貌的信息。
最后输出报告,可以辅助警方的实际执法行动。大数据和认知智能技术的引入,极大地提升了公安执法的效率。无论是大量数据或小量数据的应用场景,效率都得到了提升。
爱分析:认知智能技术在协助警方办案过程中的深层逻辑链条是怎样的?
黄伟:第一,对于在数据中找异常点的情况,比如通过判别在正常入住酒店时间之外的时间入住酒店的行为为异常点,发送报告给警方。
第二,是在数据中找相似点,比如警方提供了一批数据,要我们帮助他在其中寻找毒贩。我们的做法是在数据中找相似点,进行排序,列出前 10 位嫌疑最大的人去分析关系,进一步缩小范围。
第三,是时空相关分析,比如对于套牌车的识别,如果出现了时空的悖论,我们会把分析结果报告给警方,可以帮助警方解决浅层认知的问题。对于深层决策判断谁是嫌疑人或恐怖分子,则需要警方自己下结论。
05 全程领航政企业务升级
爱分析:百分点认知智能实验室明年规划重点是什么?
苏海波:实验室明年的重点规划包括技术的规划以及产品的规划。
关于技术的规划:第一个方向是深度迁移学习,我们今年已经积累了很多实践的成果,但是仍然还有一系列的技术问题要解决,包括如何融合领域的知识提升预训练模型的效果,如何采用轻量级的预训练模型提供实时的线上服务等;第二个方向是知识图谱,重点是解决在小标注样本下,实体和关系的抽取问题。第三个方向是小语种的语义识别,包括英语、俄语、阿拉伯语、法语等,我们服务的海外客户有非常多的小语种 NLP 需求。
关于产品的规划:前面提到过认知智能包括 3 条产品线:在工具产品线上,我们的智能媒体审校系统、智能翻译系统及智能商业分析系统,算法效果类指标需要持续优化,我们明年的目标是要朝着细分行业的第一去努力,同时会孵化新产品;在企业市场决策和公共安全决策产品线上,一方面我们会加快已有产品的商业化落地,另外会孵化出几款新的产品。
爱分析:企业数字化转型走向深入,部分领先的甲方企业已经开始积累和对外输出自主 AI 能力,百分点作为技术服务商如何看待这个趋势?
刘钰:任何企业都有自己的核心竞争力,对于甲方企业来说,如果要专心做主营业务,那么在技术输出上理应不会投入最优质的资源。对照国外目前第三方技术企业和甲方公司的关系,分工是非常明确的,由专业的人做专业的事情,我认为这也会是中国企业 10 年之后的竞合状态。
国内还处于数字化转型的初级阶段,行业数据尚未拉通。数字化进程推进中,在共享数据源方面会出现更多合作机会,企业跨界合作和行业竞合关系都会发生很大变化。目前,百分点正在和多个政府和企业客户探索联合运营的新模式和新业务。
百分点其中一个定位是做企业数字化转型的技术合伙人,在企业运营环节与客户深度合作,给客户带来可量化价值。依然以中免集团为例,我们基于数据中台和运营中台,定制化地为客户构建了运营指标体系,改善了整个集团的管理能力。除此之外,百分点还创新了合作模式,与人民出版社战略签约,共同运营“党员小书包”APP 项目。
评论