多任务学习在推荐算法中的应用（一）_文化 & 方法_Alex-zhai_InfoQ精选文章

多任务学习在推荐算法中的应用（一）

导读：我们在优化推荐效果的时候，很多时候不仅仅需要关注 CTR 指标，同时还需要优化例如 CVR ( 转化率 )、视频播放时长、用户停留时长、用户翻页深度、关注率、点赞率这些指标。那么一种做法是对每个任务单独使用一个模型来优化，但是这样做的缺点显而易见，需要花费很多人力。其实很多任务之间都是存在关联性的，比如 CTR 和 CVR。那么能不能使用一个模型来同时优化两个或多个任务呢？其实这就是 Multi-task 多任务的定义。本文主要总结了近两年工业界关于 Multi-task 模型在推荐场景的一些应用和工作。

1. 阿里 ESMM

Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate

CVR 是指从点击到购买的转化，传统的 CVR 预估会存在两个问题：样本选择偏差和稀疏数据。

样本选择偏差是指模型用用户点击的样本来训练，但是预测却是用的整个样本空间。数据稀疏问题是指用户点击到购买的样本太少。因此阿里提出了 ESMM 模型来解决上述两个问题：主要借鉴多任务学习的思路，引入两个辅助的学习任务，分别用来拟合 pCTR 和 pCTCVR。

ESMM 模型由两个子网络组成，左边的子网络用来拟合 pCVR，右边的子网络用来拟合 pCTR，同时，两个子网络的输出相乘之后可以得到 pCTCVR。因此，该网络结构共有三个子任务，分别用于输出 pCTR、pCVR 和 pCTCVR。假设用 x 表示 feature ( 即 impression )，y 表示点击，z 表示转化，那么根据 pCTCVR = pCTR * pCVR，可以得到：

则 pCVR 的计算为：

由上面的式子可知，pCVR 可通过 pCTR 和 pCTCVR 推导出来，那么我们只需要关注 pCTR 和 pCTCVR 两个任务即可，并且 pCTR 和 pCTCVR 都可以从整个样本空间进行训练？为什么呢，因为对于 pCTR 来说可将有点击行为的曝光事件作为正样本，没有点击行为的曝光事件作为负样本，对于 PCTCVR 来说，将同时有点击行为和购买行为的曝光事件作为正样本，其他作为负样本。模型的 loss 函数：

另外两个子网络的 embedding 层是共享的，由于 CTR 任务的训练样本量要远超过 CVR 任务的训练样本量，ESMM 模型中 embedding 层共享的机制能够使得 CVR 子任务也能够从只有展现没有点击的样本中学习，从而能够极缓解训练数据稀疏性问题。

本文转载自 DataFunTalk 公众号。

**原文链接：https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247496333&idx=1&sn=da03f8db68e5276cffe73e090ac271ec&chksm=fbd740e1cca0c9f76da90a713311bac81e9890c1f9fd69976705e167dd30e4135db6ea297d6b&scene=27#wechat_redirect

评论

发布

暂无评论

Windows Server 2016 中文版、英文版下载 (2025 年 2 月更新)

YashanDB事务管理

数据库 yashandb

YashanDB SQL语言

数据库 yashandb

《文明 7》局域网联机教程，贝锐蒲公英轻松实现组网

联机游戏联机

《央国企数智化转型发展报告2025》调研正式启动，诚邀参与线上调研！

信通院IOMM数字化转型团队

数字化转型数智化转型央国企数智化转型央国企数字化转型

低代码重新定义场景，如何拿到数字化转型的“新船票”？

YashanDB PL语言

数据库 yashandb

Windows Server 2025 中文版、英文版下载 (2025 年 2 月更新)

Flink基于Paimon的实时湖仓解决方案的演进

大数据 flink 实时计算

IoTDB 如何破解交通运输时序数据管理难题？

Windows 10 version 22H2 中文版、英文版下载 (2025 年 2 月更新)

Windows Server 2022 中文版、英文版下载 (2025 年 2 月更新)

40个JS常用使用技巧案例

威哥爱编程

Studio 3T 2025.3 (macOS, Linux, Windows) - MongoDB 的终极 GUI、IDE 和客户端

Windows 7 & Windows Server 2008 R2 简体中文版下载 (2025 年 2 月更新)

Windows Server 2019 中文版、英文版下载 (2025 年 2 月更新)

DeepSeek 重构 AI 基础设施焱融科技引领 AI 存储新范式

人工智能焱融科技 AI存储 AI 基础设施 DeepSeek

TEN 现已接入智谱 GLM-Realtime丨社区来稿

AI Agent实战：打造京东广告主的超级助手 | 京东零售技术实践

京东零售技术

Windows 11 24H2 中文版、英文版 (x64、ARM64) 下载 (2025 年 2 月更新)

YashanDB主备复制及切换

数据库 yashandb

DeepSeek 即将发布 5 个开源项目；Cartesia Voice Changer：声音转换、克隆和实时语音翻译丨日报

低代码开发与人工智能协同创新：解码智慧养老产业数字化转型的技术路径与实践启示

不在线第一只蜗牛

Cisco Expressway Release X15.2.2 - 统一通信网关

焱融存储联合神州鲲泰发布“训推一体”解决方案

AI存储 DeepSeek 大模型训推一体机

Nexpose 7.7.0 for Linux & Windows - 漏洞扫描

YashanDB备份恢复

数据库 yashandb