10 月 12 日,由国双协办的第八届信永中和论坛在北京召开,此次论坛以“数字经济与服务创新”为主。国双董事长兼 CEO 祁国晟先生受邀发表了题为“产业人工智能驱动数字经济”的演讲,分享国双推动产业人工智能发展、赋能实体经济转型升级、促进经济增长动能接续转换的思考与实践。
演讲实录
非常感谢所有嘉宾今天下午来听我做这个演讲,由衷地感谢信永中和集团以及张克董事长给我们这个机会协办这么庞大、这么有影响力的论坛,也给我这么一个黄金时间去讲一讲我比较熟悉的主题,我们今天的主题叫做“产业人工智能驱动数字经济”。
数字经济也是我们今天论坛的主题,我相信大多数人在过去几年听“大数据”和“人工智能”这两个词都听得挺多的,那么什么是产业人工智能?我今天的内容会先从人工智能开始讲,我相信会让很多人觉得有意思,而且我保证大家都能听得明白。
关于人工智能
我们是中国第一家赴美上市的大数据及云计算企业级软件公司。过去连续两年获得中关村专利十强,我们总计有 2300 多件专利,大数据有 580 多件,人工智能有 200 多件。这两个数字在中国大部分做企业服务的企业中都是领先的。
人工智能为什么在过去这么多年不火?五十年了,为什么最近才活了过来?因为它在大数据时代重生了,因为我们的基础设施提升了,我们的连接速度提升了。今天,我们的手机连接云的速度和二十年前显示器连接主机的速度是一样。我们的分布式计算,用多台计算机一起通过摩尔定律的限定。当年我们说 18 个月计算机性能翻一番,也就是说,如果我有一个问题,我这个问题的场景,我的数据的复杂度,18 个月翻两番,我这个问题永远不可能用计算机解决,因为我每天都更新计算机也赶不上问题复杂度的变化。但是现在没有这个问题了,因为现在可以用多台计算机来做,做不过来就再加一台计算机。
人工智能在今天成为非常有现实意义的应用是因为:(1)最简单的算法是最好的,但是这个最简单的算法力不够的话不能用。(2)有海量的互联网数据,不需要业务专家的行业知识。举一个最简单的例子,最近有很多翻译工具翻译得很好,以前的翻译需要计算机科学家和专家一起工作,比如说要想中文翻译英文,这个人要懂语法、单词,然后和计算机去说,这个单词首先要导入字典,跟计算机讲什么是语法。现在不需要了,因为互联网上有海量的中英文对照、多语对照的文字,只要用传统的搜索方法匹配,就可以把正确的翻译语句拿过来。所以,今天的计算机翻译已经不需要人工语言专家来参与了。
关于深度学习
AI 能发现牛顿运动定律么?牛顿坐在一棵苹果树下,苹果掉下来,牛顿创造并发现了万有引力定律,因为地球和苹果之间是有引力的。但是如果是我们深度学习去做这件事情会怎么样?结论是:深度学习看到几十个苹果掉下来以后,它会预测下一个苹果还会掉下来,下一个梨子会不会掉下来?它不一定清楚,它更不可能创造万有引力定律,它绝对不可能创造万有引力定律。
那么,人类智能和深度学习的区别是什么?人类有几样东西是计算机目前绝对做不到的,即想象、推理、抽象、假设。牛顿是怎么做到把万有引力定律发现的?不是看到苹果掉下来就出来定律了,他先有一个假说:是不是所有的东西之间都有引力?假说搞一个公式出来,引力应该跟质量有关系,所以他创造了这个公式,它就去做了很多实验,通过实验证明万有引力是存在的。所以,想象、推理、抽象、假设的这个过程,是我们人类科学进步的过程,是科学创造的过程,这个过程是深度学习做不到的,它没有办法从我们人类的角度去理解我们的世界。它非常善于什么?非常善于学习和识别过去已经重复的模式,对类似的情况进行预测。但是预测的范畴无法超越历史经验集,历史发生了什么,它不可以超越,它只能适应和过去经验极为相像的情况,它不能创造新的知识。举一个例子,深度学习可能学习数万张图片才能训练人工智能识别出一只猫,但是我们人类一次也不用死去就可以学会穿越马路。如果让计算机来学习怎么安全地在北京过马路,它的要被撞死一千次,撞死一千次之后把它拉到旧金山去过马路,它又要被撞死一千次才能好好地过好马路。
如果深度学习是有局限性的,我们怎么样才能让机器让人一样具有理解和思维的能力呢?有几个基础是可以做到的,我们还要回归自顶向下,我们人类有很多经验和知识,要用新的方式传授给计算机。那么,就是这几个技术:自然语言技术、知识图谱技术可以赋予计算机认知的能力。机器可以模拟人的思维过程和能力,解决各行各业复杂的问题。
首先,自然语言提供了文本分析能力,帮助机器像人一样理解。比如说这是我们在司法领域做的事儿,首先分词和断句,“无过错方”是一个词,计算机知道这是一个词、专业术语,对它进行提取和分类,提取的要素叫“双方共同财产”,这是在离婚纠纷的判决中很重要的一个要素,首先要有人去告诉它,人不去告诉它,计算机永远不会自己学习到,最后机器可以理解它,在这一个案件中有一个很重要的争议焦点,这些争议焦点是哪些双方共同财产。
专家标注+算法模型提升自然语言处理的准确度。人之所以能够成为人,人为什么成为一个智慧群体,和动物不一样?因为我们具备了自然语言理解能力,我们的沟通、我们的思考都是语言。我们可以和很多专家去对,如果没有专家,计算机可能认为“所付债务”是三个词,但是有了专家,我们知道这是一个术语。所以,经过专家的标注,把专家的经验和知识赋予计算机,计算机就能够把准确率从 40%多提升到 90%。
其次,知识图谱帮助机器像人一样思维、判断、推理。现实世界中的知识很复杂,实体和概念、逻辑。比如说在司法领域中一个法条是约束什么的?是约束法人的。是约束什么类型法人的?怎么约束的?和什么样的事情之间有关系?关系程度有多大?它是一个巨大无比的复杂的图。如果能够对这个图建立和构建,我们就可以做到计算机自动地去也一份司法判决,这个事情已经实现了,现在在中国的很多法院已经可以由计算机对简单案件自动撰写一份判决,而且准确率非常高,它能够保证法官在办案的时候不出错,也能够做到司法公正、类案同判。
在 2018 年,我们公司在清华大学、北京大学、中科院软件所一起做了一个比赛“2018 年中国法研杯法律智能挑战赛”,这个挑战赛中计算机去预测罪名,把这个案件情况放进去,计算机去预测,应该给它定什么罪、法律条款推荐、刑期预测,在这件事情上我们公司取得了总分第一,而且两项单项都是第一,参加比赛的都是全世界著名的企业,比如谷歌、BAT 等等,我们拿了第一的成绩。所以,当我们把这几件事情做好了以后,机器就可以像人一样具有理解和思维能力。第三,及其认知需要自顶向下的规划也需要自底向上的学习。
我们刚刚说的智能问答,我们做了一个系统,一个非专业人士可以去问一个法律机器人很多司法问题,通过人类专家+机器自己发现规律,既有人类专家的参与,又有机器自己发现的规律,进行归类,最后达到意图世界。意图世界很难,我问你这个问题的时候,你知道我的意图是什么,而不简简单单是这个问题本身是什么,最后这个才会准确。
产业人工智能如何驱动数字经济
什么是产业智能?产业智能就应该是一个混合式的,不简简单单是一个深度学习的人工智能。这个混合式不能忘掉专家,要结合数据科学家、行业专家,我们用自然语言的能力、知识图谱的能力把行业的专业性的信息、专业性的能力代码化,同时用计算机处理海量数据,发现规律,结合在一起就会非常强大。这也是我们国双和信永中和合作的重要原因,我们公司虽然在技术领域、在大数据领域、在人工智能技术领域有一定的涉列和时间积累,但是最缺乏的就是各个行业和领域的专家。我们说“产业人工智能要驱动数字经济”,驱动经济就像解决问题,解决问题就需要专家,没有专家,没有很充分的行业经验,你做得再好的大数据人工智能的平台系统都是空中楼阁,都不能解决问题,都不能促进生产力发展。如何促进生产力的发展?有了专家帮忙以后怎么就促进了生产力的发展?
研发生产案例 1:我们和中国的一个很大的汽车厂合作,在新能源汽车尤其是混合动力的新能源汽车厂,大家如果开过会有感触,开一个燃油车会跟你说这个车还能跑多少公里会比较准确,但是你如果开一个新能源车和你说还能跑一百公里,你跑二十公里的时候说还能再跑二十公里,这不准确。为什么?因为一个混合动力的新能源车的里程数不只和驾驶习惯、多少油、多少电有关,还和当时的天气下不下雨、气温是什么样的情况,是不是在一个上坡下坡很多的城市,是不是在一个红绿灯很多的路段行驶,有非常大的关系。这些因素,燃油车的关系要比混合动力车要小。所以,光靠一个油量传感器解决不了问题,必须要为每一台车的每一条路线与当天的天气做一个预测模型,这个预测模型要通过过去收集的海量数据来做。我们把这个预测模型做完以后,非常准确,在现在的测试车上,比如说我今天要从这个酒店开车到天安门,它不但可以像传统的 GPS 一样告诉你多长时间能过去,还可以准确地跟你讲要耗几点几升油,这个油耗的准确度已经达到 96%。所以,它大幅地改善用户的体验。
研发生产案例 2:在中国的一个大型的油田,以前我们采油都有磕头机,磕头机很多都是在荒郊野外,维护起来很麻烦,坏了以后就停产。坏了以后,把机器修好,花费的时间很长。现在通过过去数据的收集和人工的标注、专家的深度学习结合在一起,我们可以预测:两个星期以后百分之九十几的概率会坏;一个月以后有百分之多少的概率会坏。这就是预测性的维护,不要等到坏了以后再去换,在换之前我不但告诉你它什么时候可能会坏,我还可以告诉你它会因为什么而坏,这省了很多钱,而且不用停产。
研发生产案例 3:我们为一些银行建知识库,比如有一家银行想卖理财产品,想创造独特的理财产品。它通过市场调研看看其他的银行都在卖什么理财产品,这就人去看。而现在都是用计算机去看,看完以后说你的这个理财产品跟哪些是类似的,怎么定制、怎么去做会在这个市场上有百分之多少的不一样,甚至你的销售人员在卖理财产品的时候可以给他一些支持,可以告诉他在应对客户问竞品理财产品问题的时候应该如何回答。
企业管理案例:这是一个公司储油的优化,以前这个公司是给飞行器加油的,每次都要把大量的油拉到地方存储起来。现在用过去的数据做预测,它可以按需地去运油,不需要每次运那么多到每一个存储点,因为运费是很贵的,准确率提升,运输费用降低了很多。
政府管理案例 1:中华人民共和国官网改版左面是中华人民共和国中央人民政府网站以前的样子,我们总理特别想把这个网站改版,因为觉得它比较难看,这是很多年前的事儿,某供应商改了 115 次版都没有通过。没有办法,我们给它做了大范围的数据采集,每一个人点击哪里点得多,为什么点这里,我们都做了一个详细的数据分析这个数据分析拿出来的结果,计算机辅助做了一个推荐改版,最后一次成功,改成了现在的样子。如果你现在上中华人民共和国中央人民政府网站,它还是长这样,这个网站就是因为我们的数据分析,帮它去做完。
政府管理案例 2:我们的国网中有一个重要的栏目叫《我向总理说句话》,这个栏目中每年有十几亿的声音在向总理说话,但是看不过来,我们自己语言的能力、自然语言理解的机器人去帮助看看,每两个星期去看有哪些人说了什么,进行归类,反馈给总理。这些都是产业人工智能促进数字经济的发展。
营销领域案例:我们很多企业要做营销,花很多钱做广告,每一个广告在什么媒体花多少钱去投、投多长时间?这件事情,我们做了十几年时间,用大数据通过历史数据分析来帮助企业做优化。我们帮助它做完优化之后,比如这个车企以前需要打 305 个电话卖 1 部车,现在是打 69 个电话就可以卖 1 部车,因为我们把销售机会的线索排序,重新用大数据和人工智能的方法做了排序,最后使得获客成本下降很多,增收得很厉害。
企业 IT 基础架构进入产业级人工智能时代
我们现在进入数字化时代,企业进入了数字化转型、人工智能转型时代。这有什么区别?上一代我们的 IT 企业以 Oracle 和 SAP 这样的外国公司为代表的 IT 企业,它基于流程,它改变了很多流程,它是流程的信息化和自动化。但是现在我们讲,什么是数字化转型?什么是智能化转型?就是通过大数据和人工智能驱动, 可以让人工作时间更少,可以替代人,可以替代人做一些简单的工作,创造性的工作还是由人来做,效率会非常高,把人从复杂的工作中解放出来,而且减少犯错的机率。
我们认为,在新的机会下,中国市场在企业的数字化、经济化转型中,中国是更有机会的。第一,中美关系现在是关键阶段,做企业数字化和智能化转型必须要和供应商一起共享大量核心企业运行的经营数据,这样的数据你敢不敢共享给外国公司?我看到越来越的客户对此有顾虑。第二,在美国因为过去几十年的信息化非常发达,它创造了很强的竞争环境,美国的大数据、人工智能企业有几百家,每一家都在一个细分的领域中做自己的事情。这个情况首先说明市场很成熟,同时对客户也提出了很高的要求,作为甲方,你要想买美国人的这些新科技的东西,你需要一支非常强大的队伍,你可能需要和五到十家公司同时打交道,你才能把整个大数据、人工智能的这套东西搭起来。但是在中国,大部分企业的内部队伍没有达到这样的水平,这给我们中国企业非常大的一个机会。第三,中文自然语言处理太独特了。人工智能,从一个简简单单的感知(看一个图片,听一个声音)到认知和语言分不开,我们中文中间是没有空格的,英文每个单词之间有空格。所以,英文自然语言识别技术比中文要简单很多。
所以,我们认为中国有可能在新的企业数字化和智能化转型的时代,无论是像国双这样的服务型企业,还是我们的客户,都有可能在这个时代实现腾飞,因为我们的机会比他们更好,我们不需要那么多碎片化的东西,我们比较容易实现集中化的数据管理,并且集中部署。
谢谢大家。
本文转载自公众号国双 Gridsum(ID:gridsumtech)。
原文链接:
https://mp.weixin.qq.com/s/tSpCxAEUlzwtwHN6wAKK-A
评论