北京时间 8 月 14 日,北京百分点信息科技有限公司举办了十周年的媒体沟通活动。活动上,百分点 CEO 苏萌、CTO 刘译璟、首席算法科学家苏海波分别对百分点近期的发展情况进行了分享,InfoQ 作为受邀媒体之一参加并报道了本次活动。
百分点 CTO 刘译璟对公司在国内外的业务分别进行了讲解。
在国内,百分点专注智慧城市、数字公安等领域,利用感知智能、认知智能等技术,尤其是 NLP 与知识图谱的结合,实现了特殊人员监控、道路交通管理等等功能;在国外,百分点协助非洲、中亚、东南亚等国家建立人口信息平台,并打造智能身份证,助力城市及国家数字化转型。
他特别提到:认知智能是百分点一直在专注的技术领域,同时该领域是人工智能发展的重要方向,去年成立了百分点认知智能实验室,主要聚焦在自然语言、知识图谱,自然交互等。
随后,百分点首席算法科学家苏海波对该实验室及其技术进展进行了详细介绍。
人工智能分为感情智能、认知智能、语音智能三个阶段,目前大部分研究都重点关注在认知智能的阶段。到底什么是认知智能,目前没有特别标准化的定义,苏海波表示,在百分点看来认知是对信息的认知,智能是指智能分析和决策。现在感应智能,人脸识别、人工识别技术已经很多了,但是在认知智能领域还有很多挑战,百分点成立的认知智能实验室,也是希望以后把握机遇为各行各业的客户提供认知智能技术和服务。但是,苏海波坦言:认知智能的研究目前仍然存在着不小的阻碍。
首先怎么衡量一个机器的认知语言智能化水平是非常难的。人类在说一句话的时候会结合从小到大的常识和经验来理解这句话是什么意思,同样一句话,人类可以通过学习到的经验分析其中的含义,但是机器读到这句话只是接受了一系列符号,而其中具体的含义它并不清楚。
其次,目前在认知智能里没有一系列标准化的任务证明这个机器的感知化自动化的水平已经超越了人类。这两个问题加在一起,导致现在只能通过一系列的自然语言任务刻划机器认知语言智能化水平,比如有舆情分析、口碑分析等等。
另外,阅读理解问答对机器来说仍是不小的挑战。就算把这些问题都解决了,仍然不能证明机器认知水平超过人类,认知很难有量化的定义。
为了更好的理解认知智能,目前有三个学派希望通过解释人类的认知是怎么产生的,从而更好地研发认知系统。
首先是符号主义,来源于数理逻辑,要实现对人的思维和知识进行解释,它的核心思想是希望把人的思维用符号进行描述,而且进行计算,像知识图谱,专家系统。
第二是连接主义,来源于仿生学,本质是实现人脑的活动,用人脑智能化的活动,经过大量简单的单元,通过活动产生智能,像深度学习神经网络就是核心技术。
第三是行为主义,来源于控制论,核心是人类智能,后天通过人类和环境的交互习得的智能。
深度学习目前已经遇到了天花板,虽然它的预测效果很好,但是需要大量的标本进行研究。深度学习方法背后缺少可解释的解释,让大家对这种智能非常担忧,让机器化智能达到人类的水平目前来看非常难的,现在最可能实现的路线,是这三个流派技术的融合,目前学术界和工业界在做的技术研究都是朝着这个大方向在发展。
1.深度学习+迁移学习
深度学习依赖于大量的标注,苏海波表示,在实际工作中遇到最大的问题是标准样本不足。做标准的代价是很大的,如果把领域里学到的知识迁移到新的领域,就可以大大降低需要的样本量。对于一个新的品类,比如金融或者新的消费品类,用传统方法做一个新的品类增量模型,至少需要上万个数据才能达到 80%的结果,通过深度学习和机器学习结合,只需要一千个数据就能 80%的效果,这是两者结合的最大的优势。
2.深度学习+知识图谱
深度学习是连接主义,知识图谱是符号主义,这两种结合是连接主义和符号主义典型的融合方式。知识图谱里有知识表示,知识表示通常用向量表示,如果和深度学习融合起来,融入到深度学习模型中,就能学习到更好的自然语言理解模型,再把这个模型反馈到知识图谱的工作中,两者一起发展,目前业界已经有了相关的研究工作,也是未来人工智能技术发展非常重要的方向,这是两者之间的融合。据介绍,目前百分点认知实验室也在做这方面的工作,在构建行业知识图谱以及自然语言处理模型方面的结合,进一步的提高效率。
3.深度学习+强化学习
强化学习是行为主义里最典型的,二者融合也是连接主义和行为主义相融合的代表性。深度学习是 2013 年被麻省理工学院评为十大综合性技术,强化学习是 2017 年被麻省理工学院评为十大综合性技术,这两个技术融合对未来人工智能技术发展非常有影响。
怎么让机器人更智能,其核心技术就是深度学习和强化学习的融合。通过用户模拟器和机器不断的交互,生成大量的反馈样本,再结合深度学习机器训练出模型,这个方式的优势是不需要大量的样本,大大的减少了工作量。
在此基础之上,百分点推出了一系列工具,在具体业务上有两个方向:提高企业市场化决策效率,以及提高政府公安公共安全和决策效率,DeepFinder 和 DeepQuest 工具就是这些技术的集中体现。
评论