写点什么

多任务学习在推荐算法中的应用(一)

  • 2020-01-07
  • 本文字数:1023 字

    阅读完需:约 3 分钟

多任务学习在推荐算法中的应用(一)


导读:我们在优化推荐效果的时候,很多时候不仅仅需要关注 CTR 指标,同时还需要优化例如 CVR ( 转化率 )、视频播放时长、用户停留时长、用户翻页深度、关注率、点赞率这些指标。那么一种做法是对每个任务单独使用一个模型来优化,但是这样做的缺点显而易见,需要花费很多人力。其实很多任务之间都是存在关联性的,比如 CTR 和 CVR。那么能不能使用一个模型来同时优化两个或多个任务呢?其实这就是 Multi-task 多任务的定义。本文主要总结了近两年工业界关于 Multi-task 模型在推荐场景的一些应用和工作。

1. 阿里 ESMM

Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate


CVR 是指从点击到购买的转化,传统的 CVR 预估会存在两个问题:样本选择偏差和稀疏数据。



样本选择偏差是指模型用用户点击的样本来训练,但是预测却是用的整个样本空间。数据稀疏问题是指用户点击到购买的样本太少。因此阿里提出了 ESMM 模型来解决上述两个问题:主要借鉴多任务学习的思路,引入两个辅助的学习任务,分别用来拟合 pCTR 和 pCTCVR。



ESMM 模型由两个子网络组成,左边的子网络用来拟合 pCVR,右边的子网络用来拟合 pCTR,同时,两个子网络的输出相乘之后可以得到 pCTCVR。因此,该网络结构共有三个子任务,分别用于输出 pCTR、pCVR 和 pCTCVR。假设用 x 表示 feature ( 即 impression ),y 表示点击,z 表示转化,那么根据 pCTCVR = pCTR * pCVR,可以得到:



则 pCVR 的计算为:



由上面的式子可知,pCVR 可通过 pCTR 和 pCTCVR 推导出来,那么我们只需要关注 pCTR 和 pCTCVR 两个任务即可,并且 pCTR 和 pCTCVR 都可以从整个样本空间进行训练?为什么呢,因为对于 pCTR 来说可将有点击行为的曝光事件作为正样本,没有点击行为的曝光事件作为负样本,对于 PCTCVR 来说,将同时有点击行为和购买行为的曝光事件作为正样本,其他作为负样本。模型的 loss 函数:



另外两个子网络的 embedding 层是共享的,由于 CTR 任务的训练样本量要远超过 CVR 任务的训练样本量,ESMM 模型中 embedding 层共享的机制能够使得 CVR 子任务也能够从只有展现没有点击的样本中学习,从而能够极缓解训练数据稀疏性问题。


本文转载自 DataFunTalk 公众号。


**原文链接:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247496333&idx=1&sn=da03f8db68e5276cffe73e090ac271ec&chksm=fbd740e1cca0c9f76da90a713311bac81e9890c1f9fd69976705e167dd30e4135db6ea297d6b&scene=27#wechat_redirect


2020-01-07 09:491128

评论

发布
暂无评论
发现更多内容

Windows Server 2016 中文版、英文版下载 (2025 年 2 月更新)

sysin

Windows Server

YashanDB事务管理

YashanDB

数据库 yashandb

YashanDB SQL语言

YashanDB

数据库 yashandb

《文明 7》局域网联机教程,贝锐蒲公英轻松实现组网

贝锐

联机游戏 联机

《央国企数智化转型发展报告2025》调研正式启动,诚邀参与线上调研!

信通院IOMM数字化转型团队

数字化转型 数智化转型 央国企数智化转型 央国企数字化转型

低代码重新定义场景,如何拿到数字化转型的“新船票”?

秃头小帅oi

YashanDB PL语言

YashanDB

数据库 yashandb

Windows Server 2025 中文版、英文版下载 (2025 年 2 月更新)

sysin

Windows Server

Flink基于Paimon的实时湖仓解决方案的演进

Apache Flink

大数据 flink 实时计算

IoTDB 如何破解交通运输时序数据管理难题?

Apache IoTDB

Windows 10 version 22H2 中文版、英文版下载 (2025 年 2 月更新)

sysin

Windows 10

Windows Server 2022 中文版、英文版下载 (2025 年 2 月更新)

sysin

Windows Server

40个JS常用使用技巧案例

威哥爱编程

JavaScript js

Studio 3T 2025.3 (macOS, Linux, Windows) - MongoDB 的终极 GUI、IDE 和 客户端

sysin

Windows 7 & Windows Server 2008 R2 简体中文版下载 (2025 年 2 月更新)

sysin

windows

Windows Server 2019 中文版、英文版下载 (2025 年 2 月更新)

sysin

Windows Server

DeepSeek 重构 AI 基础设施 焱融科技引领 AI 存储新范式

焱融科技

人工智能 焱融科技 AI存储 AI 基础设施 DeepSeek

TEN 现已接入智谱 GLM-Realtime丨社区来稿

声网

AI Agent实战:打造京东广告主的超级助手 | 京东零售技术实践

京东零售技术

Windows 11 24H2 中文版、英文版 (x64、ARM64) 下载 (2025 年 2 月更新)

sysin

windows

YashanDB主备复制及切换

YashanDB

数据库 yashandb

DeepSeek 即将发布 5 个开源项目;Cartesia Voice Changer:声音转换、克隆和实时语音翻译丨日报

声网

低代码开发与人工智能协同创新:解码智慧养老产业数字化转型的技术路径与实践启示

不在线第一只蜗牛

Cisco Expressway Release X15.2.2 - 统一通信网关

sysin

Expressway

焱融存储联合神州鲲泰发布“训推一体”解决方案

焱融科技

AI存储 DeepSeek 大模型训推一体机

Nexpose 7.7.0 for Linux & Windows - 漏洞扫描

sysin

Nexpose

YashanDB备份恢复

YashanDB

数据库 yashandb

多任务学习在推荐算法中的应用(一)_文化 & 方法_Alex-zhai_InfoQ精选文章