写点什么

阿里小蜜中的情绪回复能力

  • 2019-06-02
  • 本文字数:3872 字

    阅读完需:约 13 分钟

阿里小蜜中的情绪回复能力

本次分享内容提纲:


  • 阿里小蜜介绍

  • 情绪回复能力介绍

  • 客户情绪安抚

  • 客服质量检测

  • 情绪生成式语聊

一、阿里小蜜介绍

传统的客服模式始于电话客服,会有专业的咨询顾问帮客户解答问题。之后有了在线客服和线上申请,在线客服类似于文字聊天,线上申请是非实时的通讯方式,可以理解为类似留言或者邮件的形式。



1. 智能服务模式

在阿里场景下我们对问题进行了区分,将其分成问题咨询和交易纠纷,分别有专门的顾问进行解答。在智能服务模式下,在问题咨询端建立了小蜜这样的产品,如果问题比较复杂,小蜜解决不了,还是会把问题转到人工顾问这一端,为用户提供更全面的服务。即便这样,在人工客服一端,也有对应的智能辅助产品,帮助提高人工客服的服务效率,比如检索是否有历史相似答案提供给人工客服,帮助他们快速完成解答。


2. 模式的升级与生态圈拓展

智能客服能力建立之前,人工服务的能力来自于自营客服、外包客服和云客服。模式升级之后,利用智能服务的能力,形成了平台能力、三方能力、智能人机交互这三种服务模式。服务的对象可以理解为三个层次,其中,阿里是包括指淘宝、天猫、咸鱼、淘票票等阿里巴巴内部产品平台的范围;商家是指依托于阿里巴巴淘宝和天猫等平台之上的外部商家;企业则是指纯粹外部的企业。



如图,最下面这层其实是为小二进行服务的,小二是阿里客服的简称。在上面机器人配置平台这一层是为机器人服务提供一些能力。再往上一层是按照产品进行划分,分成阿里小蜜、店小蜜和企业小蜜。阿里小蜜主要服务阿里内部的淘宝天猫这样平台,店小蜜服务阿里平台上的商家,企业小蜜服务于外部企业。


二、阿里小蜜情绪回复能力

我们今天介绍阿里的小蜜产品在情绪回复能力上的技术发展。情感机器人的两个主要发展方向:


  • 类人:就是情感越像人越好。

  • 多模态:就是情绪的表达其实可以有多少手段,对人而言,可以是语言、表情神态、肢体语言等。


从情感处理能力上来说,可以把机器人分成三类:


第一类是机器人没有情感处理能力,阿里小蜜最开始的版本确实是没有情感处理能力的,只是对高频场景中的问题进行解答,比如用户说我要退货、如何退货、赶紧给我退货,得到的答复都是阿里平台上如何退货的文字描述,但其实第三句是有强烈情绪表达的,但是初期的阿里小蜜没有这样的理解能力;


第二类机器人是有完整的情绪识别能力的,目前体现最多的是在一些闲聊场景下,比如小冰,比如在对骂场景下,如果客户骂机器人,机器人虽然没有直接的对骂,机器人也会有婉转的方式,比如 " 180 度反弹 " ,虽然没有直接对骂,但是也表达了对自己辱骂的情绪,这是一种情绪比较完整的机器人;


第三类机器人产品,客服机器人,客户可以骂人,但是人工客服和客服机器人是绝对不能有这种情绪的,辱骂、讽刺、挖苦是机器人绝对不能有的情绪。但是有一些,比如高兴、委屈是机器人可以有的,所以小蜜的定位是部分情绪能力缺失的客服机器人。


从多模态角度来说,阿里小蜜目前只考虑了文本,和少量语音。


情绪回复,今天会讲两个方面,一个是理解情绪,另外一个是表达情绪。

三、客户情绪安抚


从三个方面进行介绍:服务质量检测,客户情绪安抚和情绪回复生成。


先看客户情绪安抚,针对常见场景,我们不仅仅只是告诉客户一些流程,比如退货流程,还是有一些安抚在里面。然后看右面的情绪回复能力,这个情绪回复能力,和情绪安抚的主要区别是,情绪安抚是业务专家之前预设好的各种答复,但是情绪回复采用纯生成式的模型,用在闲聊场景,内容不是提前配置好的;最左边的服务质量监测,如果从小蜜转到人工客服,小蜜也是继续服务的,针对服务质量不好的时候,会对人工客服做一些警示,就是提示他,注意自己的服务态度。下面针对这三块进行更为详细的介绍。


针对客户情绪安抚,我们分成离线端和在线端。



离线端,从下往上是如下几个离线处理,首先是情绪分类模型,这是整个流程最基本的东西,我们要去识别客户交流过程中体现的情绪;然后是主题分类模型,也就是说我们不仅要识别出情绪,还要知道聊的是哪方面的内容;第三步是知识构建,这里的知识构建应该就是一个问答对,做这一步的原因是,因为情绪分类和主题分类都比较粗,针对一些高频的问题,希望给用户更具体的回复方式。


在线端,其实是一个相反的过程,首先识别用户所说的是不是和之前总结的知识点比较接近,如果有就拿出来进行回答,如果没有就看是否可以归结到某种主题这样的情况上,如果再没有的话,我们就监测,它是不是仅仅是属于一种情绪表达,然后给更出更宽泛的情绪安抚。


其中的情绪分类模型:


通过数据分析以及参与常用的情绪字典,我们将情绪划分为 38 类 ( 感激、惊奇、失望、抱歉、期待、疑惑、尴尬、高兴、着急、怨恨、喜欢、抑郁、委屈、轻视、害怕、孤独、愤怒、悲伤、满意、无聊、同情、平静、烦恼、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) ,但是其实我们针对最常用的 7 类 ( 委屈、恐惧、着急、失望、愤怒、辱骂、感谢 ) 模型训练出单独的分类模型,这样对这 7 中情绪分类的更准确。



上面是模型图,最左边的两个 poolling 是在做句子级别的语义特征抽取,这个实际上用的是 swem 算法;中间是 n-gram 多元的特征抽取,用的是 cnn 的模型,我们提取了两元、三元、四元这样的信息形成特征;最右侧的一块是 emotion embedding,用到了 18 年发表一篇文章的思路。在我们的场景下,label 就是 emotion,所以这一块叫 emotion embedding,这里将 word embedding 和 emotion embedding 结合起来其实是算某个词在某个 emotion 下面的 attention score,attention 可以理解为权重。这样更直接的体现了词级别的语义特征,整个句子从左到右,就是将词级别的、n-gram 级别的和词语级别的语义信息结合起来,才能获得比较好的语义分类。因为在线端用户打的句子都比较短,用这种方式才能实现比较好的语义识别的结果。


第二部分就是主题分类,我们定义的时候称呼为 " 情绪主题类别 " 。比如阿里小蜜有查天气的功能,并且被高频使用,这部分有没有必要放到这个模块呢?其实是没有必要的,一般是通过点击按钮引导操作,只是想看看天气,几乎没有情绪表达的。而这里提到的模型是用于识别情绪主题类别,从情绪的角度,归结常见的主题,而其它不带情绪的主题是没有归到里面。下面是针对 7 类情绪,做了 35 种情绪主题分类,主题分类架构和刚才的情绪分类的架构一致。



最后,基于知识的安抚,就是看用户说的话是不是和某个知识点很相近,这时候我们就用到匹配回复这样的模型能力,在文本匹配这一块儿可以分成两个功能能力。首先是分成两部分,最左边两块是一部分,最右侧是一部分,最左边的两块是两句话,他们分别在提取特征,最后把特征合并到一起做分类,最右边的部分是把两个句子从一开始就进行交互,把交互的结果,一层层做特征抽取,这相当于一个交互时间点的不同,一个是最后交互,另一个是一开始交互,我们把两种交互抽取特征的结果结合到一起,做一个准确率更高的文本匹配模型,来实现在线匹配问答。

四、客服质量检测

我们只探讨两种服务问题,一种是消极,一种是态度差,消极是指爱搭不理的态度,态度差是指客服虽然给了客服充分的回复,但是态度不好,比如可能有反怼客户,讽刺客户的现象发生。这套服务提供给平台端和商家端,平台端就是比如淘宝,天猫这样阿里自家平台,商家端是商家自己的店铺的客服检测,这是两个不同的模型,因为两种场景在服务质量的要求上存在不同的衡量标准。


在机器人端典型的对话方式是一问一答,而在人工客服端往往出现多问多答的情况,比如客户连着说几句,客服是连着回答几句。这时候我们对客服服务质量进行评价就需要非常关注上下文,并且上下文每句话是谁说的,等等这些信息。


模型如下图,考虑了句子长度、说话人角色,以及内容的语义信息等等特征。


五、情绪生成式语聊

下图是比较通用的语义生成模型,这种传统的生成模型存在的一个问题就是 ’ safe response ’ 的产生,就是很泛泛的一个回复,很少有情感传达在里面,比如好,哦哦,可以这样的回复。



我们的目的是让机器人产生带情绪的回复,另外希望回复更具有针对性一些,而不是全部都是通用的 ’ safe response ',在下面的模型里,除了情绪,我们还可以添加 topic 相关的信息,分析出聊天的主题。下面的例子里,客户说今天心情很好,聊的是生活化的主题,表达的是高兴的情绪,这时候我们生成 ’ 好开心啊 ',回复用户。



针对上述的用户和机器人的情感对应关系,可以进行预设。比如客户在表达高兴的时候,我们也要表达出高兴,用户在辱骂我们的时候,我们要表达出委屈。

六、未来工作

未来,我们要做一个 session 满意度预估,这里的 session 就是一个完整的对话,目前是通过人工用研分析,是设计一个调查问卷的形式,随机抽取每天的用户,然后让用户打分,最后的分数就是满意用户的占比。


存在的问题就是:一个是耗费人工;二是每天的统计量是不足的,因此会产生每天统计结果比较大的自然震动。


联系我们:


欢迎对智能问答机器人、自然语言处理、机器学习等领域感兴趣的业内优秀同学、老师、专家关注我们的算法专家、高级算法专家、资深算法专家等岗位,感兴趣可以发送您的简历至:


shuangyong.ssy@alibaba-inc.com


进行内推,或者邮件咨询岗位细节,感谢您的关注!

嘉宾介绍:

宋双永,阿里巴巴小蜜情感语聊算法负责人,智能服务事业部算法专家。致力于智能对话中的情绪回复能力以及开放域语聊能力的算法研究和业务场景落地,在机器学习和自然语言处理领域积累了多年的实战经验,发表了多篇学术文章和专利。


本文来自 DataFun 社区


原文链接


https://mp.weixin.qq.com/s/q2fJefssYZ0BMxzIVy_SMw


2019-06-02 08:0011296

评论

发布
暂无评论
发现更多内容

AI大模型时代下运维开发探索第二篇:基于大模型(LLM)的数据仓库

阿里云大数据AI技术

GLTF 编辑器实现逼真3D动物毛发效果

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

GLTF编辑器-位移贴图实现破碎的路面

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

家页观察丨万华生态绿色化、工业化、数字化助力城市更新

Geek_2d6073

Linux操作系统中软件安装:用RPM包管理器安装软件步骤

小魏写代码

KaiwuDB 受邀亮相“ACDU 中国行”数据库技术沙龙(西安站)

KaiwuDB

KaiwuDB ACDB 中国行

语音数据集:智能语音技术的燃料与推动力

来自四九城儿

GLTF编辑器实现逼真的石门模型

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

LLM评估:通过7大指标监测并评估大语言模型的表现

Baihai IDP

程序员 AI ChatGPT LLM 白海科技

重庆中烟:事项会计驱动业财深度融合

用友BIP

业财融合

有了向量数据库,我们还需要 SQL 数据库吗?

Zilliz

sql 向量数据库 zillizcloud rag

好用的英语学习工具:Eudic欧路词典增强激活版中文

mac大玩家j

翻译软件 Mac软件 翻译工具

语音数据集:开启智能语音技术的新篇章

来自四九城儿

强大的磁盘分析:Disk Xray最新激活版

胖墩儿不胖y

Mac软件 磁盘分析软件 磁盘工具

百度CTO王海峰:文心一言用户规模破1亿

飞桨PaddlePaddle

人工智能 深度学习 WAVE SUMMIT

避坑指南之财务共享服务中心的质量管理

用友BIP

财务共享

语音数据集:推动人工智能语音技术的关键要素

来自四九城儿

taobao.trade.memo.update( 修改交易备注 )丨淘宝店铺订单接口

tbapi

淘宝店铺订单接口 天猫店铺订单接口 淘宝店铺订单交易接口 淘宝店铺订单备注接口 天猫订单备注接口

赴一场AI星河之约:他们改变了什么?

脑极体

AI

来聊聊程序员的职业发展路线

伤感汤姆布利柏

“边缘计算:从概念到实践的探索与思考“

future

IM通讯协议专题学习(十):初识 Thrift 序列化协议

JackJiang

网络编程 即时通讯 IM

基于大数据、大模型的应用总结与技术心得

joe

爆红的PLM!

用友BIP

PLM

西部市场的无限潜力与成都的崛起“2024成都电子信息展会”

AIOTE智博会

电子展 电子信息展 成都电子展

写实风格3D模型材质贴图

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

苹果Mac图像修图软件Photomator和Pixelmator Pro 有什么区别?

Rose

Pixelmator Pro Mac修图软件 Photomator

坚果的2023年终总结-激流勇进的一年

坚果

年终总结 坚果派

云原生与持续交付:加速软件交付与部署的革命

范艺笙冉

3D 渲染如何帮助电商促进销售?

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

江铃晶马 X 袋鼠云:搭建企业级数据资产中心,推进打造“智数晶马”

袋鼠云数栈

大数据 数据中台 数字化转型 案例 大数据平台

阿里小蜜中的情绪回复能力_软件工程_DataFunTalk_InfoQ精选文章