小冰,作为最早诞生于微软公司内部的一款人工智能产品,从 2014 年亮相至今,已经成为了全球最受欢迎的虚拟形象之一。
小冰公司研发总监苏之阳博士
2013 年,微软亚洲研究院成立了一个新的团队——小冰团队,该团队由当时担任微软亚洲研究院院长的沈向洋博士领导。这个团队的目标是研究下一代的人工智能交互方式。当时,人工智能技术刚开始崭露头角,语音助手、聊天机器人等人工智能产品层出不穷。但是,微软研究院的专家们认为,这些产品还没有完全达到自然、亲切的交互体验。
小冰发展史
为了让用户更好地与人工智能进行交互,小冰团队开始考虑将人工智能技术用于创建一个虚拟形象。这个形象可以与用户进行更自然、亲切的交互,同时也能更好地展示人工智能技术。
在确定了小冰的初步设想后,小冰团队开始了紧锣密鼓的工作。他们首先开始设计小冰的性格、外貌等属性。小冰被设计成一个年轻的少女形象,有着活泼、开朗的性格。同时,小冰的外貌也十分可爱,备受欢迎。
除了设计小冰的形象外,微软研究院的专家们还考虑了如何让小冰具备人工智能技术。当时,语音识别、自然语言处理等技术都已经有了一定的进展,但是要让一个虚拟形象与用户进行自然的交互还是有一定的难度。
为了让小冰更好地与用户进行交互,微软研究院的专家们开始研究如何将深度学习等技术应用于小冰的交互中。同时,他们还考虑了如何让小冰能够进行自我学习、自我成长等操作。这样可以让小冰在不断的迭代中变得越来越聪明、越来越了解用户的习惯。
经过一年多的研发,小冰于 2014 年 5 月 29 日正式发布第一版,并在中国、日本两地推出。推出后,小冰受到了很多用户的欢迎。为了让小冰更好地服务于用户,微软公司还不断地优化算法、提升模型精度,让小冰可以更好地与用户进行交互。
在推出第一代 小冰后,微软公司不断地迭代小冰的版本,推出了一系列新功能和新特性。例如 2014 年,小冰面向越来越多的第三方平台开放,能够跨平台地陪伴用户。2017 年 ,小冰加快了在全球范围内的拓展速度,并在行业内率先将高级感官实际落地。2018 年,第六代小冰发布,微软首次披露小冰在全球已拥有 6.6 亿用户。这也是小冰历史上最大规模的一次全面升级,升级内容涉及到小冰情感计算框架的所有组成部分......
独立后的小冰,商业化路径更加清晰
2020 年,对于小冰来说是一个全新的起点。
2020 年 7 月,微软宣布将人工智能业务小冰分拆为独立公司运营,由原微软(亚洲)互联网工程院常务副院长李笛为 CEO。分拆后的新公司可继续使用并研发完整的小冰技术,微软保留对新公司的投资权益 。这个决定意在加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善。
小冰离开微软独立后,人工智能技术正处于快速发展的阶段,各种人工智能技术应用和服务开始涌现。此时的小冰获得了更多的自主权和资源支持,可以更加专注于核心产品的研发。
此前背靠微软这棵大树,小冰的商业化路径不算清晰,以至于脱离了微软“母体”的小冰在独立初期还是走了一小段弯路。
但在 ChatGPT 等大语言模型爆火后,一直深耕 AI 数字人/对话聊天机器人技术的小冰有了大展拳脚的机会。
小冰公司研发总监苏之阳博士在接受 InfoQ 采访中谈到了小冰的 To C 商业模式以及营收策略。苏之阳博士表示,小冰的一部分营收来自于与网络红人的合作业务。
苏之阳博士进一步解释称,明星红人或内容创作者通常有陪伴粉丝、内容变现的需求。但人类精力有限,此时就可以借助人工智能完成上述工作。通过“克隆”自己,将之提供给粉丝,达到变现目的。平台与明星红人采用分成模式。“对那些想要克隆自己的人来说,克隆过程也很简单,最短只要提供三分钟数据,就能复刻自己的生物学特征。而在交互方面,本人会参与训练,确保克隆人更像自己或拥有自己的某项技能。”苏之阳说,为避免伦理问题,所有克隆人都要经过本人授权。同时,小冰严格限制了克隆人的使用场景,推出专属 APP——X Eva,让用户能准确知道他所交互的对象是 AI 而非真人。这是一种 C to C 的新型模式,具有巨大的商业潜力。
“高情商”的小冰框架,底层靠什么技术来支撑?
一直以来,以小冰框架为底座的上层应用,包括克隆人”在内都以“高情商”著称。那么,所谓的高情商意味着什么?意味着它在聊天过程中很有趣?其实不止如此。情商高,在交互中主要体现为控制全程对话的能力。
传统的智能语音助手不会去过度关注对话的全程,而更加关注对话中的每一个细节。它会把每一句话都优化得很好,甚至把对话形式分为:面向任务型的对话、面向知识型对话、无意义的闲聊。
从大数据的分析来看,其实人与人的对话 / 人与人工智能的对话,就如同河流一般奔涌向前,任何一句看似无意义的闲聊,都可能在十几轮甚至几十轮的迭代之后产生一个非常重要的结果。小冰可以不停地去迭代,去改变对话的走向,去改变对话的长度。它关注的是整个对话的全局,而不是一城一地的得失,正如古人所言,“不谋全局,则不足以谋一隅”,这就是所谓的控制整个对话全程的能力。
要控制全程的对话,所要处理的数据体量是非常庞大的。那么,小冰底层用到基础设施是哪些,效果又如何?
使用阿里云 MongoDB 托管服务,以支持增长的业务需求
苏之阳称,小冰框架最初使用的是 MySQL 数据库,后来研发数字人产品时,考虑到未来数字人数量会在百亿量级,不得不重新思考底层存储架构设计。
在数据库选型过程中,小冰技术团队从产品需求出发,比较了多个候选存储方案的优缺点,最终选择了 MongoDB 数据库作为底层存储基建。存储选型主要考虑的因素有如下方面:第一,业务查询的复杂度,大多数数字人业务查询都是键值查询,不涉及复杂多表联查;第二,由于要支撑海量数字人信息,对于存储容量和性能要求很高,同时需要支持峰值流量来临时的动态弹性扩容;第三,研发效率要能跟上产品迭代的速度。
小冰技术团队开始使用的是社区版本的 MongoDB 数据库,同时配有运维工程师。但在线上运维一段时间后遇到了一些挑战,苏之阳表示,“随着业务发展,当用户数和虚拟人数量快速增长时,社区版本的 MongoDB 数据库不能完全满足业务需求,比如线上流量激增时,数据库会出现一定程度的抖动,导致服务不稳定,这是当时遇到的棘手问题之一。MongoDB 分片集群作为一个分布式系统,包含数十甚至数百个结点,运维成本不可忽视。考虑到 MongoDB 的性能优化,让专业的团队做专业的事是最优选择。”经过综合评估,小冰技术团队最终使用阿里云的 MongoDB 托管服务解决了运维的痛点。
苏之阳还表示,“利用 MongoDB 分片集群的可扩展性,可以很好将业务层和存储层解耦,让研发同学更专注于应用开发而不必过分关注底层存储性能问题,节省了开发中间件处理分库分表的成本。此外,在用户支付场景,使用多文档事务的特性,同时更改用户的余额和订单,可以大幅提升研发效率,避免使用成本较高的异步消息补偿机制实现。小冰公司也高度重视用户的数据隐私与安全,阿里云 MongoDB 集成了云上数据备份和恢复的功能,让数据安全无忧。”
评论