8 月 20日,“第八代微软小冰”年度发布会在北京召开。今年的发布会与往年有些不同,因为小冰团队已经正式从微软独立出来,此次发布会,是这支团队独立运营后的第一次公开亮相。会上,小冰团队发布了一系列面向个人用户的产品,并首次公开了小冰背后的部分技术细节。此外,由沈向洋博士带领的小冰团队还与我们分享了人工智能时代,他们对未来的判断和想法。
AI Beings 需求巨大
会上,沈向洋博士与团队共同展望了小冰的未来和人工智能的未来。 沈向洋称,“人工智能非常早期的时候,大家都在激烈地辩论 AI 是不是应该先做商业的应用,是不是应该先去做 To B,人工智能到底需要多少?是不是有几个人工智能助理就够了?对于这些问题,我们当然有自己的看法,对于小冰来讲,小冰团队一起在思考这些事情,我们相信未来绝对不会只有几个人工智能助理,甚至不仅仅是每一个人有自己的人工智能助理,未来我们身边会围绕着非常多的人工智能,甚至可以叫这些人工智能的主体是 AI beings,我们可以大胆预测一下,未来这些人工智能主体的数量会远远超过人类的数量,因为每个人身边都会围绕着很多人工智能。”
事实上,如今市场上已经有多个人工智能主体,因为会有很多具体、巨大的需求出现,只有这些现有的 AI beings,远远不能填补这样巨大的需求。沈向洋博士也向我们阐述了巨大的需求在哪里。
他认为,如今 AI 最大的需求,甚至引发以后巨大的变革的最重要的一个关键词是交互。过去这些年,随着 PC 和互联网的普及,交互变成一个 非常大的瓶颈,每天有海量、碎片化的信息扑面而来,在这样一个情况下该怎么去处理交互的问题。实际上交互到现在为止只有两种: 1、人和人之间的交互(人人交互)。 2、人和计算机,比如跟手机的交互叫做人机交互。 我们相信未来交互正确的做法是把人人交互的人性化和人机交互的高并发结合起来,我们相信这是未来人和 AI 之间最好的交互形态,事实上这个会给我们带来非常有意义的机会。事实上在今天这样一个情况下,每天人和机器、人和人之间交互就已经是千亿级了,你可以设想一下,未来人和 AI 交互以后,至少是万亿级的交互量, 实际上这样的一个交互量给我们带来了巨大的商机。
所以,我们相信如下几件事是一定会发生的:
第一,高度拟人的交互将会无处不在,不管你是做什么的,未来的东西都会有高度拟人的交互,这种新形式的交互,会无处不在。
第二,我们相信未来人工智能的竞争一定会对整个框架的完整性、技术的先进性有巨大的要求,因为这个时候已经不是你有一个技术就行了,比如计算机技术,人脸识别足够好就行了,不是这样的,因为这是一个交互的问题,是人和 AI 之间长时间交互的问题。
第三,如果你相信我前面讲的这两点的话,第三点更加激动人心,因为到最后产生了一个这样的新的商业模式,未来新的交互无处不在,以后需要有一个这样的框架,上万亿级的交互量,最后这样一个商业模式将会是基于未来 AI 的人口数,这件事来讲,我们觉得有非常大的机会。
首次公开小冰部分技术细节
对于外界一直关注的小冰背后的技术细节问题,此次发布会上,小冰团队技术负责人周力和曾敏给出了解答。
曾敏称,“提到小冰,首先要提到我们的开放域对话引擎,因为这是小冰的看家本领,同时也是新形式人人交互的核心。下图是我们第一次公开披露开放域对话引擎的核心模块,依靠于这个引擎,我们目前支撑着全球人工智能超过 60%以上的交互总量,在这里其实有大家非常熟悉的人工智能少女小冰,也有许多第三方人工智能产品,它们各自的性格非常不同,但是又在各自的领域完成自己的任务,它们整个都是基于小冰框架的。 ”
为什么系统化是人工智能产品的一个关键因素呢?这是因为在真实的产品中,人工智能往往要承担着一个非常复杂的、综合的交互感官,而人工智能价值也不仅仅是被动的去等待回答用户的问题。
在新形式人人交互的概念中,要想去实现更高的转化率,去实现人和机器之间关系的纽带,人工智能就必须有主动的意识,它能积极去预测、保持以及诱导对话进行的方向。 在对话引擎的设计中,小冰是第一个提出预测、保持、诱导技术的,过去数年小冰团队通过生成模型、共感模型还有主导对话模型等技术,在不断地迭代和升级对话引领, 而今年的 2 月,又将全新的分层话题图谱运用到了小冰线上的系统,而且也得到了很好的效果。 当小冰决定应用一套策略去引导对话的时候,这个对话最终能达到小冰目的的平均完成率是 42.7%,该团队目前尚未研究过人类的平均完成率,但是他们相信这个水平已经相当于非常懂得“套路”的人类了。
在本次发布会上,小冰团队首次宣布了分层话题图谱技术,该项技术和以前全双工语音还有人工智能创造类似,相信这样的技术很快会被同行业者研发以及应用到各种各样的产品之中。
在完成了分层话题图谱技术后,下面一个问题是个性与风格,事实上只有去构架一个人人交互的完整体系的时候才会去涉及到这样的技术,因为它不仅是去支撑某一个特定的人工智能主体,而是要去创造很多不同风格、不同知识的人工智能主体。
小冰拥有一个非常庞大的数据原型,大家可以理解为各种人的一个合集,而每一个人是她的一个子集,我们现在的主要问题是如何能够精确的去提炼这一个子集。 今年团队最新的成果是通过样本的学习,可以锁定这个子集,以前打造一个风格原型时,必须基于至少 5 亿句的语料库进行过滤和筛选,现在也可以使用 3000 句具有鲜明风格的语料,去精细地训练风格模型。有了这样的技术,小冰框架才能迅速的生产非常大量的虚拟人类。
我们知道一个人的训练绝对不是一次性就完成的,对于人工智能也应当如此。我们应当允许通过与人的不断交流,不断地去提升自我,我们也应当允许人类主动地影响观点的倾向、兴趣爱好、知识体系,这在过去是一件非常难的事情。为此,小冰框架引入了一个全新的技术。
小冰团队技术负责人曾敏表示,“团队把这个技术叫做篇章内容主动学习技术,简单来讲就是一个用户可以随时把他看到的任何一篇文章主动一键转发给他所需要训练的人工智能,这个时候人工智能立马开始进行主动学习,并把它学习到的内容应用到它的知识体系以及兴趣爱好等各个方面。 与此同时,如果它发现自己的知识面还不够,会主动利用搜索引擎相关的技术,全网抓取 更多内容作为补充,并且把学到的内容应用到接下来还在持续不断进行的对话里面,整个持续过程大概只需要几秒钟的时间。因为 AI 是主动学习的方式,会更容易建立起与人类信任的纽带。”
发布“X 套件”:面向个人用户且内容产物所有权归属用户
发布会上,小冰团队产品总监徐翔还发布了面向个人用户的“X 套件”系列应用软件,他指出:“X 套件包括基于文本协同的 X Writer,面向声音协同的 X Studio 和面向虚拟人类 3D 演示文档驱动的 X Presenter。在使用 X 套件的过程中,用户可以选择平台提供的虚拟人类,或自己创造的虚拟人类完成相关任务。”
在“X 套件”系列产品中,X Writer 具备沉浸式体验,可实现在用户进行文字编辑或文本创作时的人工智能协同,随云端更新不断扩充各类文体。产品具备沉浸式体验。
X Studio 包括面向各类公众号文章、演讲、电台节目等的 X Studio 主播,以及面向人工智能歌声合成的 X Studio 歌手正式版软件。其中,主播应用已在商业化领域覆盖中国及日本超过 50 家主流电台电视台,累计制作超过 8000 小时高质量音频节目内容,此次推出的为其个人版本;歌手软件技术在全球范围内居于领先位置,并且是目前唯一一个完整产品化的同类软件。
X Studio 1.0 正式版软件下载地址:
https://studiovoice.msxiaobing.com/
X Presenter 则为驱动用户选择或创造的人工智能实体 3D 模型,可配合 X 套件其他应用,从而实现人工智能对演示文档的演讲及交互。商业版为日本 LAWSON 驱动的自主舞蹈人工智能,现已上线。
此外,针对人工智能创作内容可能涉及到的版权问题,徐翔宣布:“对于 X 套件的所有个人用户,小冰框架放弃人工智能生成内容的所有版权,这也就意味着大家可以随心所欲地使用小冰 X 套件里面的人工智能来帮助你,而你自己可以独享最后内容产物的全部权利。”
评论