QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Ocado 客户服务中运用了 TensorFlow 和 Google 云平台

  • 2016-10-26
  • 本文字数:1174 字

    阅读完需:约 4 分钟

通过建立与 Google 及 Google 云平台( GCP )的合作伙伴关系, Ocado Techonology 公司发布了一种新的方法,用在对Ocado 的50 多万用户及来自这些用户的海量电子邮件请求的处理中。该方法使用了 TensorFlow 及宿主于 GCP 上的 TensorFlow Python API,重点在于解决电子邮件的自动分类问题。

Ocado 认为对于电子邮件分类问题,非常适合于使用工业规模的机器学习和自动化,更具体的说就是自然语言处理(NLP)。很多的企业支持中心为让工作一致和可靠,采用了依靠工作人员手工处理电子邮件队列的工作流程。在企业的业务迅速成长时,或是整体客户支持量所需的支持人员日益增长时。这种方法并不能很好地扩展,这会导致邮件响应的延迟,客户不满意度也随之增加。

Ocado 的做法是将所有的电子邮件汇集到同一处,然后通过分析邮件内容为邮件打标签,例如标记为客户投诉的则需要立刻反馈,标记为一般性反馈的则具有稍低的优先级可稍迟反馈。此外,邮件标签还包括:重发货请求、退款请求、支付问题或网站问题、新商品查询等。

Ocado 想要在分配标签类别时,尽可能地减少需用户及支持人员手工输入的域和标签的数量。因为这种手工输入不仅容易产生偏差并生成噪声数据,而且也占用了支持人员的宝贵时间,这些时间是本可用于根据客户请求的优先度服务于客户的。

Ocado 科技的高级软件工程师 Marcin Druzkowski 今年八月在 Datasciencefest 大会上的演讲上,给出了Ocado 训练神经网络所用的各种模型的一些细节。其中的方法包括:使用词袋逻辑回归、使用嵌入(embedding)的卷积神经网络( CNN )、使用嵌入的长短期记忆模型( LSTM )。

Druzkowski 指出深度学习并非一定要使用 GPU,考虑到 CPU 芯片的相对低成本、云计算的可扩展性和并行计算模型训练,没有必要再采用特定的 GPU 写入和训练模型。他也指出通过以软件工程为中心的数据科学方法,他们的 TensorFlow 图以数据矩阵和图定义的方式部署,这不同于数据科学软件所使用的一般方法,那些方法已被证明在部署和易于集成到生产环节的实现上存在着挑战。Druzkowski 在演讲中提到的特性还包括:可移植性和依赖性管理、代码质量、测试覆盖度、版本管理和持续集成。

围绕着测试模型,还出现了其它的一些新挑战。这些测试模式需给出随机性、可接受结果值范围和良好模型性能的组成目标。此外,挑战也存在于如何在后台数据集发生改变时,重新训练和测试模型。在确定一个模型是否有价值时,需额外考虑的变量是数据集改变的比例和速度。当前测试的运行使用了 pyTest 和 TensorFlow,但是 Ocado 拒绝了提供示例代码的请求。

查看英文原文: Ocado Uses TensorFlow and Google Cloud Platform for Novel Customer Service Approach


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-10-26 19:001402
用户头像

发布了 227 篇内容, 共 75.9 次阅读, 收获喜欢 28 次。

关注

评论

发布
暂无评论
发现更多内容

Java开发从二面被拒到收割阿里架构offer,我花了一年时间,复盘成功经历!

Java架构追梦

Java 阿里巴巴 架构 offer 成长笔记

涨薪50%,从小厂逆袭,坐上美团L8技术专家(面经+心得)

Java 编程 程序员 面试

聊聊数据仓库中维度表设计的二三事

云祁

数据仓库 维度建模 7月日更

不愧是阿里内部“SpringCloudAlibaba学习笔记”竟然在GitHub霸榜月余

Java 编程 架构 微服务

Flink 的底层API

五分钟学大数据

flink 7月日更

阿里技术分享:闲鱼IM基于Flutter的移动端跨端改造实践

JackJiang

flutter 即时通讯 IM

Nacos配置中心交互模型是 push 还是 pull ?你应该这么回答

程序员小富

Java 编程 程序员 分布式 nacos

云图说 | 华为云医疗智能体智联大健康:AI医学影像

华为云开发者联盟

AI 医学影像 医疗智能体 华为云医疗智能体 大健康

Serverless 崛起背后的五大挑战

Serverless Devs

Serverless

并发王者课-铂金6:青出于蓝-Condition如何把等待与通知玩出新花样

MetaThoughts

Java 多线程 并发

NumPy_2021.07.05

Flychen

DDD笔记

topsion

并发王者课-铂金8:峡谷幽会-看CyclicBarrier如何跨越重峦叠嶂

MetaThoughts

Java 并发 多线

CloudQuery 使用教程 No.4 数据查询(下)

BinTools图尔兹

dba 数据库管理工具 国产数据库 运维开发

论文解读丨文档结构分析

华为云开发者联盟

模型 文档 文档结构分析 分割 文档结构

系统故障防不胜防?不存在的,让大佬来给你上一课!

TakinTalks稳定性社区

高可用 测试 全链路压测 测试工具 生产环境全链路压测

《持之以恒的从事运动》二

Changing Lin

数字化转型提升太平洋保险风险治理能力

数据湖洞见

大数据

并发王者课-铂金7:整齐划一-CountDownLatch如何协调多线程的开始和结束

MetaThoughts

Java 多线程 并发

Rust从0到1-Cargo-安装来自Crates.io的程序

rust cargo install

2022秋招vue面试题+答案

buchila11

Vue Vue 3

今天,「浪潮云说」直播间开讲啦!

云计算

合肥智慧社区平台建设解决方案,平安小区建设

iOS不行?还是个人能力有限?

ios 程序员 IT 编程之路

iOS开发 · iOS音视频开发 - ARKit 教学:如何搭配SceneKit来建立一个简单的ARKit Demo

iOSer

ios ios开发 ARKit iOSAR.

一文讲懂Hive高可用、HiveServer2高可用及Metastore高可用

白贺BaiHe

数据仓库 7月日更 HiveServer2高可用 Metastore高可用 Hive高可用

国家网信办:“滴滴出行” 下架整改!

学神来啦

从结构体、内存池初始化到申请释放,详细解读鸿蒙轻内核的动态内存管理

华为云开发者联盟

鸿蒙

从零实现一个 k-v 存储引擎

roseduan

存储 Go 语言 KV存储引擎 存储系统

阿里P8耗时半年总结的Java核心面试知识,助我轻松拿下蚂蚁offer

Java 程序员 面试 java编程 java技术宅

免费分享学习Java框架Netty的优秀图书

Java入门到架构

Java 书籍推荐

Ocado客户服务中运用了TensorFlow和Google云平台_AI&大模型_Dylan Raithel_InfoQ精选文章