写点什么

微软小冰第七代重磅升级!首次推出通用型 AI 框架 Avatar Framework

  • 2019-08-15
  • 本文字数:3192 字

    阅读完需:约 10 分钟

微软小冰第七代重磅升级!首次推出通用型AI框架Avatar Framework

InfoQ 8 月 15 日消息,微软(亚洲)互联网工程院在北京召开了“第七代微软小冰”年度发布会,会上发布了微软小冰历史上最大跨度的一次升级,披露了 Dual AI 战略的新进展、AI Creation 的技术突破,并首次推出了全新的人工智能框架— Avatar Framework。此外,微软还首次公布了小冰近一年来在商业化进展方面的成果。


“第七代小冰拥有更多激动人心和脱胎换骨的能力“,微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋表示,“我们希望小冰能够无处不在,只要有人类的地方,都可以看到小冰、和小冰交流 ”。



微软全球执行副总裁、微软人工智能事业部及微软全球研究院负责人沈向洋


沈向洋认为微软小冰代表了人工智能的发展,最重要的(一个特点)就是,人工智能要不断地迭代与演进。“做人工智能肯定不是只做一个产品就结束了,做人工智能必须要不断地学习、迭代”。


今天的发布会上有一个重磅发布,微软首次发布了 Avatar Framework 第一个工具包版本,这是第七代微软小冰一个很重要的“飞跃”和突破。


沈向洋简单回顾了微软小冰的发展历程,他谈到,从第五代小冰开始有了“框架”的概念,到第六代小冰时,框架初步成熟,而到了今年的第七代,整体框架有了飞跃般的进步。


第一代小冰发布时,恰是人工智能新的浪潮开始的时候,彼时业界在不断在思考,人工智能发展的道路到底是什么样的?是要追求一个单独的爆款应用还是走一条真正的所谓框架的道路,并发展可以无处不在的人工智能呢?


从第一代到第七代,沈向洋用“森林和树木”的关系来形容微软小冰的发展路径,他相信,人工智能不断前进和发展的路上,有这样一个框架非常重要。“尽管小冰只是广阔森林里面的一颗大树而已,但我们必须要做这样一颗大树,因为我们需要有这样一个机会去学习、去验证这个框架的可行性”。


微软(亚洲)互联网工程院副院长,小冰团队总负责人李笛如是形容 Avatar  Framework 的重要意义,“它让是‘一棵小树’的微软小冰真正能够认认真真去做永远 18 岁的少女小冰,而 Avatar  Framework 将用来‘孕育’包括小冰在内的整片‘森林’。

以下为“第七代微软小冰”的升级亮点

部分核心技术升级

第七代微软小冰对核心对话引擎、全双工语音及多模态交互感官等部分核心技术进行了升级。*


其中:


全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达 68%,比上一个版本的转化率提高 21%。



全双工语音交互感官:微软小冰于 2017、2018 年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。


面向未来的多模态交互感官:这是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时“边听边说边看”的交互体验,该感官有望成为 5G 时代的全新交互形式。继去年宣布率先开始多模态感官的研发后,今年 2 月,微软日本小冰团队已在日本完成了多模态交互感官公开测试。

Dual AI 战略新进展

微软小冰自去年开始执行 Dual AI 战略计划,现在,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。目前,在全球多个国家,微软小冰单一品牌已覆盖 6.6 亿在线用户、4.5 亿台第三方智能设备和 9 亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在 23 轮。


小冰团队产品负责人彭爽表示,Dual AI 是半开放的生态思路,框架的通用性和丰富性使得小冰在产品形态上具有非常大的弹性,一方面小冰可以转换成各种各样适合的形态,接入到智能手机、智能音箱设备、括社交网络、内容和资讯平台等。另一方面,当小冰化身为千万形态的同时,又可以在一定程度上保持相对统一的独特性。



此外,发布会上还宣布了微软小冰与腾讯、小米、今日头条、vivo 和 OPPO 等合作伙伴的共同项目,并拓展上线了多个第三方合作伙伴平台的小冰产品,产品形态涵盖社交对话机器人、智能语音助理、人工智能内容创作和生产平台等。


其中,在智能手机方面,微软小冰宣布已经上线了 vivo 和 OPPO 的手机系统,至此达成与国产 TOP5 手机生产商(华为、荣耀、vivo、OPPO、小米)共同完成“召唤小冰”的产品形态。在智能音箱设备上,微软小冰已与小米的小爱音箱达成合作;此外,小冰还在不断地探索深度融入主流社交平台网络中,已跟 QQ 深化合作,小冰已进入 3000 万个 QQ 群。目前小冰正在和微信 AI 就对话开放平台、微信 AI 所涉及的智能硬件产品等两个方面展开合作;


在内容和资讯平台上,继第六代小冰与网易、新浪合作后,微软在今天宣布与今日头条达成合作,通过长时间的训练,小冰的认知能力和三观能力在不断深化。



除了在线内容和资讯平台之外,小冰在传统的电视台和广播电台持续担当着内容生产和技术提供者的角色,截止到 2019 年 7 月末,小冰已累计在中国和日本的共 50 家电台和电视台的 69 档节目中提供人工智能内容创造能力。小冰已经上线的日播和周播节目达到 30 档,目前累计参与生产的电视和电台节目总时长达到 6908 小时,其中今年生产的节目时长是去年 2.05 倍。

AI Creation 的技术突破

在 AI Creation 方面,微软希望通过人工智能技术解决高度定制化内容的供需矛盾。目前,在文本、声音与视觉创造方面,微软在核心技术上保持全球领先,并发布了实际线上产品。自小冰工作室成立一年多来,工作室里已累积了越来越多的声音、文本和视觉创造力角色,发布会上还展示了“小冰工作室”拥有的丰富模型,包括跨越多种演唱技巧的多个声音模型、多种绘画模型等。



此外,AI Creation 多条面向量产化的生产线已实现产业化贯通。其中,与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,在这条生产线上,SELECTED、万事利、依文等品牌的产品已上架销售。在音乐方面,微软小冰与联通沃音乐共同推出的音乐生成平台也已上线。

新框架 Avatar Framework 初次发布

微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛表示,今年微软小冰最大的“跨越”就在于首次推出的新框架——Avatar Framework。


据介绍,Avatar Framework 工具包与微软小冰框架同源,可以从零开始轻松构建并训练任何具有完整情感计算能力的 AI beings —人工智能助手、社交对话机器人、人工智能内容创作和 IP 人物角色等。该工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的 3D 人物模型进行实时交互。



在本次发布前,微软已通过 Avatar Framework 框架赋能软银 Pepper 等数十个第三方客户 AI,以及微软小冰自身,目前发布的版本面向全部合作伙伴及客户,面向个人使用者的版本预计将于 2020 年春季发布。微软全球资深副总裁,微软(亚洲)互联网工程院院长王永东还在发布会上宣布了知识图谱方面的新进展,并表示微软已与阅文集团达成针对《全职高手》等 100 部小说主人公 IP 的合作。

微软小冰商业化进展

人工智能创造及商业事业部总经理,小冰团队商业负责人徐元春公布了微软小冰在商业化方面的新进展,他表示,自去年宣布启动了微软小冰的商业化以来,得益于在 ToB 领域的丰富经验及技术产品积累,这一年来微软小冰商业化进展迅速,目前已落地的商业客户覆盖金融、零售、汽车、地产、纺织等十个领域,



具体服务的客户包括万科、万得资讯、万事利、中国联通等。其中一个典型案例是与金融信息服务提供商万得资讯的合作。微软利用 AI  Creation 文本生成技术帮助万得资讯构建端到端的完整 AI 能力,双方合作研发了一款金融电台产品,通过这款产品,可以将上市公司公告摘要等财经信息即时、高质量、24 小时不间断地通过语音输出给机构投资者和个人用户。


2019-08-15 22:4310865
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 555.3 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

六、云原生可观测性

穿过生命散发芬芳

可观测性 5月月更

druid 源码阅读 9—— init 中的JMX是干啥的

张大彪

druid源码阅读(十)Druid keepAlive参数

爱晒太阳的大白

5月月更

拆分电商系统为微服务

小虾米

「架构实战营」

JVM进阶(十六)——JAVA 双亲委派模型

No Silver Bullet

类加载 双亲委派模型 5月月更

netty系列之:在netty中使用native传输协议

程序那些事

Java Netty 程序那些事 5月月更

Notification发送消息

空城机

WebApi 5月月更

抖音打击炫富违规视频:自媒体行业的底线在哪

石头IT视角

linux之sed使用技巧

入门小站

Linux

在线文本代码对比工具

入门小站

工具

零基础学Java第三节(基本输入输出)

编程攻略

java开发学习

JS Iterable object (可迭代对象)

达摩

js

时序数据库在桥梁监测领域中的应用

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

[Day43]-[回溯]-解数独

方勇(gopher)

LeetCode 数据结构算法

M-DAO开辟区块链全新战场,或成DAO赛道龙头

西柚子

M-DAO开辟区块链全新战场,或成DAO赛道龙头

小哈区块

[Day45]-[BFS]-滑动谜题

方勇(gopher)

LeetCode BFS 数据结构算法

Kubernetes 安全权限管理深度剖析

liuzhen007

k8s 5月月更

Hoo研究院|币海寻珠—5月区块链行业投资机构动向(上)

区块链前沿News

区块链 投资 虎符 Hoo

在线HTML转Excel工具

入门小站

工具

css 学习笔记【三】浮动,不脱离文档流,继承和层叠

恒山其若陋兮

5月月更

一站式Dao打造工具M-DAO:门槛低、效率高

股市老人

天翼云高可用虚拟IP(HAVIP)实践

天翼云开发者社区

[Day44]-[回溯]-括号生成

方勇(gopher)

LeetCode 回溯算法 数据结构算法

干货| 四种渲染到底是啥?终于有人讲明白了!(下)

Orillusion

开源 WebGL 元宇宙 Metaverse webgpu

千亿级高并发MongoDB集群在某头部金融系统中的应用及性能优化实践(上)

杨亚洲(专注MongoDB及高性能中间件)

数据库 mongodb 分布式 高性能 分布式数据库mongodb

M-DAO开辟区块链全新战场,或成DAO赛道龙头

BlockChain先知

Redis「8」实现分布式限流与延时队列

Samson

redis 学习笔记 5月月更

SPDK QOS机制解析

天翼云开发者社区

使用 Provider 改造屎山代码,代码量降低了2/3!

岛上码农

flutter ios 安卓开发 跨平台开发 5月月更

数据库连接池 -Druid 源码学习(九)

wjchenge

Druid 数据库连接池

微软小冰第七代重磅升级!首次推出通用型AI框架Avatar Framework_AI&大模型_刘燕_InfoQ精选文章