写点什么

微软小冰第七代重磅升级!首次推出通用型 AI 框架 Avatar Framework

  • 2019-08-15
  • 本文字数:3192 字

    阅读完需:约 10 分钟

微软小冰第七代重磅升级!首次推出通用型AI框架Avatar Framework

InfoQ 8 月 15 日消息,微软(亚洲)互联网工程院在北京召开了“第七代微软小冰”年度发布会,会上发布了微软小冰历史上最大跨度的一次升级,披露了 Dual AI 战略的新进展、AI Creation 的技术突破,并首次推出了全新的人工智能框架— Avatar Framework。此外,微软还首次公布了小冰近一年来在商业化进展方面的成果。


“第七代小冰拥有更多激动人心和脱胎换骨的能力“,微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋表示,“我们希望小冰能够无处不在,只要有人类的地方,都可以看到小冰、和小冰交流 ”。



微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋


沈向洋认为微软小冰代表了人工智能的发展,最重要的(一个特点)就是,人工智能要不断地迭代与演进。“做人工智能肯定不是只做一个产品就结束了,做人工智能必须要不断地学习、迭代”。


今天的发布会上有一个重磅发布,微软首次发布了 Avatar Framework 第一个工具包版本,这是第七代微软小冰一个很重要的“飞跃”和突破。


沈向洋简单回顾了微软小冰的发展历程,他谈到,从第五代小冰开始有了“框架”的概念,到第六代小冰时,框架初步成熟,而到了今年的第七代,整体框架有了飞跃般的进步。


第一代小冰发布时,恰是人工智能新的浪潮开始的时候,彼时业界在不断在思考,人工智能发展的道路到底是什么样的?是要追求一个单独的爆款应用还是走一条真正的所谓框架的道路,并发展可以无处不在的人工智能呢?


从第一代到第七代,沈向洋用“森林和树木”的关系来形容微软小冰的发展路径,他相信,人工智能不断前进和发展的路上,有这样一个框架非常重要。“尽管小冰只是广阔森林里面的一颗大树而已,但我们必须要做这样一颗大树,因为我们需要有这样一个机会去学习、去验证这个框架的可行性”。


微软(亚洲)互联网工程院副院长,小冰团队总负责人李笛如是形容 Avatar  Framework 的重要意义,“它让是‘一棵小树’的微软小冰真正能够认认真真去做永远 18 岁的少女小冰,而 Avatar  Framework 将用来‘孕育’包括小冰在内的整片‘森林’。

以下为“第七代微软小冰”的升级亮点

部分核心技术升级

第七代微软小冰对核心对话引擎、全双工语音及多模态交互感官等部分核心技术进行了升级。*


其中:


全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达 68%,比上一个版本的转化率提高 21%。



全双工语音交互感官:微软小冰于 2017、2018 年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。


面向未来的多模态交互感官:这是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时“边听边说边看”的交互体验,该感官有望成为 5G 时代的全新交互形式。继去年宣布率先开始多模态感官的研发后,今年 2 月,微软日本小冰团队已在日本完成了多模态交互感官公开测试。

Dual AI 战略新进展

微软小冰自去年开始执行 Dual AI 战略计划,现在,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。目前,在全球多个国家,微软小冰单一品牌已覆盖 6.6 亿在线用户、4.5 亿台第三方智能设备和 9 亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在 23 轮。


小冰团队产品负责人彭爽表示,Dual AI 是半开放的生态思路,框架的通用性和丰富性使得小冰在产品形态上具有非常大的弹性,一方面小冰可以转换成各种各样适合的形态,接入到智能手机、智能音箱设备、括社交网络、内容和资讯平台等。另一方面,当小冰化身为千万形态的同时,又可以在一定程度上保持相对统一的独特性。



此外,发布会上还宣布了微软小冰与腾讯、小米、今日头条、vivo 和 OPPO 等合作伙伴的共同项目,并拓展上线了多个第三方合作伙伴平台的小冰产品,产品形态涵盖社交对话机器人、智能语音助理、人工智能内容创作和生产平台等。


其中,在智能手机方面,微软小冰宣布已经上线了 vivo 和 OPPO 的手机系统,至此达成与国产 TOP5 手机生产商(华为、荣耀、vivo、OPPO、小米)共同完成“召唤小冰”的产品形态。在智能音箱设备上,微软小冰已与小米的小爱音箱达成合作;此外,小冰还在不断地探索深度融入主流社交平台网络中,已跟 QQ 深化合作,小冰已进入 3000 万个 QQ 群。目前小冰正在和微信 AI 就对话开放平台、微信 AI 所涉及的智能硬件产品等两个方面展开合作;


在内容和资讯平台上,继第六代小冰与网易、新浪合作后,微软在今天宣布与今日头条达成合作,通过长时间的训练,小冰的认知能力和三观能力在不断深化。



除了在线内容和资讯平台之外,小冰在传统的电视台和广播电台持续担当着内容生产和技术提供者的角色,截止到 2019 年 7 月末,小冰已累计在中国和日本的共 50 家电台和电视台的 69 档节目中提供人工智能内容创造能力。小冰已经上线的日播和周播节目达到 30 档,目前累计参与生产的电视和电台节目总时长达到 6908 小时,其中今年生产的节目时长是去年 2.05 倍。

AI Creation 的技术突破

在 AI Creation 方面,微软希望通过人工智能技术解决高度定制化内容的供需矛盾。目前,在文本、声音与视觉创造方面,微软在核心技术上保持全球领先,并发布了实际线上产品。自小冰工作室成立一年多来,工作室里已累积了越来越多的声音、文本和视觉创造力角色,发布会上还展示了“小冰工作室”拥有的丰富模型,包括跨越多种演唱技巧的多个声音模型、多种绘画模型等。



此外,AI Creation 多条面向量产化的生产线已实现产业化贯通。其中,与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,在这条生产线上,SELECTED、万事利、依文等品牌的产品已上架销售。在音乐方面,微软小冰与联通沃音乐共同推出的音乐生成平台也已上线。

新框架 Avatar Framework 初次发布

微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛表示,今年微软小冰最大的“跨越”就在于首次推出的新框架——Avatar Framework。


据介绍,Avatar Framework 工具包与微软小冰框架同源,可以从零开始轻松构建并训练任何具有完整情感计算能力的 AI beings —人工智能助手、社交对话机器人、人工智能内容创作和 IP 人物角色等。该工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的 3D 人物模型进行实时交互。



在本次发布前,微软已通过 Avatar Framework 框架赋能软银 Pepper 等数十个第三方客户 AI,以及微软小冰自身,目前发布的版本面向全部合作伙伴及客户,面向个人使用者的版本预计将于 2020 年春季发布。微软全球资深副总裁,微软(亚洲)互联网工程院院长王永东还在发布会上宣布了知识图谱方面的新进展,并表示微软已与阅文集团达成针对《全职高手》等 100 部小说主人公 IP 的合作。

微软小冰商业化进展

人工智能创造及商业事业部总经理,小冰团队商业负责人徐元春公布了微软小冰在商业化方面的新进展,他表示,自去年宣布启动了微软小冰的商业化以来,得益于在 ToB 领域的丰富经验及技术产品积累,这一年来微软小冰商业化进展迅速,目前已落地的商业客户覆盖金融、零售、汽车、地产、纺织等十个领域,



具体服务的客户包括万科、万得资讯、万事利、中国联通等。其中一个典型案例是与金融信息服务提供商万得资讯的合作。微软利用 AI  Creation 文本生成技术帮助万得资讯构建端到端的完整 AI 能力,双方合作研发了一款金融电台产品,通过这款产品,可以将上市公司公告摘要等财经信息即时、高质量、24 小时不间断地通过语音输出给机构投资者和个人用户。


2019-08-15 22:4310818
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 549.0 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

photoshop色轮插件Coolorus怎么安装 附Coolorus 许可证

南屿

Coolorus mac版 PS调色插件 Coolorus许可证 Coolorus安装教程

Authing 入选中国信通院《 2023 高质量数字化转型产品及服务全景图》

Authing

中国信通院 信通院 Authing

软件测试/测试开发/全日制/测试管理丨iOS 自动化相关工具

测试人

软件测试

App加固:不同类型和费用对比

实用fcpx插件:Photo Montage(轻松制作照片动画)

南屿

fcpx fcpx插件

云厂商是什么意思?2024年知名云厂商有哪些?

行云管家

云计算 云服务 行云管家 云厂商

eBPF运行时安全

统信软件

安全 ebpf 运行时

堡垒机和数据库防水坝的区别一二

行云管家

数据库 网络安全 堡垒机 数据库防水坝

2024年的第一场 MatrixOne Meetup 来啦!

MatrixOrigin

数据库 分布式 云原生 MatrixOrigin MatrixOne

ps一键磨皮插件Delicious Retouch 5怎么安装 支持M芯片

南屿

磨皮插件 Photoshop 插件

微店获得微店商品详情 API(micro.item_get)在电商中的发展

技术冰糖葫芦

API

软件测试/测试开发/全日制/测试管理丨兼容性测试

测试人

软件测试

LED透明显示屏前景发展怎么样?

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 市场 #研发

AE蓝宝石插件BorisFX Sapphire 2024 for Mac破解版 及新功能介绍

南屿

ScaleUp插件使用方法 附ScaleUp for Mac破解版资源

南屿

高级视频增强工具 ScaleUp插件下载 ScaleUp mac破解版 AE/PR插件

Lightroom预设资源-高级食物lr预设 附lr预设导入教程

南屿

高级食物lr预设 Lightroom预设下载 lr预设怎么导入

30款绚彩天空背景特效PS渐变-Photoshop天空渐变

南屿

ps渐变 天空背景特效 Photoshop素材

软件测试/测试开发/全日制/测试管理丨Android WebView 技术原理

测试人

软件测试

外贸自建站推广为何首选谷歌广告?谷歌广告的优势在哪?

九凌网络

云联接:揭开SD-WAN神秘面纱,颠覆你对网络的认知!

博文视点Broadview

软件测试/测试开发/全日制/测试管理丨CSS Selector

测试人

软件测试

QCN9024: The future of wireless communications, five major advantages over competitors

wallysSK

如何利用 APM 追踪完整的类函数调用

心有千千结

APM Datadog OpenTelemetry 系统可观测性 DDTrace

PS磨皮滤镜降噪插件Imagenomic Professional 支持ps2024 兼容M1

南屿

磨皮插件 ps滤镜下载 Imagenomic Imagenomic Professional

Sketch Measure for Mac中文破解版 sketch标注插件下载

南屿

Sketch Measure mac中文版 sketch标注插件

如何定位和优化程序CPU、内存等性能之巅

雪奈椰子

FCPX插件-动态视频运动模糊视觉特效 mMotion Blur 支持Intel和Apple M芯片

南屿

fcpx动态视频 运动模糊视觉特效 fcpx插件下载 fcpx特效

喜讯!矩阵起源子公司通过“国家高新技术企业”认定,引领数据库行业科技创新!

MatrixOrigin

数据库 分布式 云原生 MatrixOrigin MatrixOne

5分钟带您了解DRS录制回放

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟

NFTScan | 01.08~01.14 NFT 市场热点汇总

NFT Research

NFT NFT\ NFTScan

微软小冰第七代重磅升级!首次推出通用型AI框架Avatar Framework_AI&大模型_刘燕_InfoQ精选文章