写点什么

多任务学习在推荐算法中的应用(一)

  • 2020-01-07
  • 本文字数:1023 字

    阅读完需:约 3 分钟

多任务学习在推荐算法中的应用(一)


导读:我们在优化推荐效果的时候,很多时候不仅仅需要关注 CTR 指标,同时还需要优化例如 CVR ( 转化率 )、视频播放时长、用户停留时长、用户翻页深度、关注率、点赞率这些指标。那么一种做法是对每个任务单独使用一个模型来优化,但是这样做的缺点显而易见,需要花费很多人力。其实很多任务之间都是存在关联性的,比如 CTR 和 CVR。那么能不能使用一个模型来同时优化两个或多个任务呢?其实这就是 Multi-task 多任务的定义。本文主要总结了近两年工业界关于 Multi-task 模型在推荐场景的一些应用和工作。

1. 阿里 ESMM

Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate


CVR 是指从点击到购买的转化,传统的 CVR 预估会存在两个问题:样本选择偏差和稀疏数据。



样本选择偏差是指模型用用户点击的样本来训练,但是预测却是用的整个样本空间。数据稀疏问题是指用户点击到购买的样本太少。因此阿里提出了 ESMM 模型来解决上述两个问题:主要借鉴多任务学习的思路,引入两个辅助的学习任务,分别用来拟合 pCTR 和 pCTCVR。



ESMM 模型由两个子网络组成,左边的子网络用来拟合 pCVR,右边的子网络用来拟合 pCTR,同时,两个子网络的输出相乘之后可以得到 pCTCVR。因此,该网络结构共有三个子任务,分别用于输出 pCTR、pCVR 和 pCTCVR。假设用 x 表示 feature ( 即 impression ),y 表示点击,z 表示转化,那么根据 pCTCVR = pCTR * pCVR,可以得到:



则 pCVR 的计算为:



由上面的式子可知,pCVR 可通过 pCTR 和 pCTCVR 推导出来,那么我们只需要关注 pCTR 和 pCTCVR 两个任务即可,并且 pCTR 和 pCTCVR 都可以从整个样本空间进行训练?为什么呢,因为对于 pCTR 来说可将有点击行为的曝光事件作为正样本,没有点击行为的曝光事件作为负样本,对于 PCTCVR 来说,将同时有点击行为和购买行为的曝光事件作为正样本,其他作为负样本。模型的 loss 函数:



另外两个子网络的 embedding 层是共享的,由于 CTR 任务的训练样本量要远超过 CVR 任务的训练样本量,ESMM 模型中 embedding 层共享的机制能够使得 CVR 子任务也能够从只有展现没有点击的样本中学习,从而能够极缓解训练数据稀疏性问题。


本文转载自 DataFunTalk 公众号。


**原文链接:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247496333&idx=1&sn=da03f8db68e5276cffe73e090ac271ec&chksm=fbd740e1cca0c9f76da90a713311bac81e9890c1f9fd69976705e167dd30e4135db6ea297d6b&scene=27#wechat_redirect


2020-01-07 09:491560

评论

发布
暂无评论
发现更多内容

安利一个求职刷题小妙招、变身 offer 收割机 | 《趣玩》第 2 期

阿里巴巴云原生

阿里云 云原生

SvelteKit 最新中文文档教程(10)—— 部署 Cloudflare Pages 和 Cloudflare Workers

冴羽

vue.js 前端 React Svelte SvelteKit

PIRF 428 :Time Travel – Impossible to Explain

Echo!!!

English

《Operating System Concepts》阅读笔记:p481-p482

codists

操作系统

鸿蒙特效教程01-哔哩哔哩点赞与一键三连

苏杰豪

鸿蒙 交互设计 HarmonyOS ArkTS HarmonyOS NEXT

鸿蒙特效教程02-微信语音录制动画效果实现教程

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

时序数据库和关系型数据库的区别是?

Apache IoTDB

如何理解 Apache Iceberg 与湖仓一体(Lakehouse)?

镜舟科技

hive 分析型数据库 LakeHouse StarRocks Apache Iceberg

什么是「Agentic 工作流程」?丨社区来稿

声网

如何在线制作甘特图?3个常用绘图工具盘点!

职场工具箱

甘特图 绘图软件 甘特图软件 在线甘特图软件

鸿蒙特效教程03-水波纹动画效果实现教程

苏杰豪

鸿蒙 HarmonyOS HarmonyOS NEXT

鸿蒙特效教程06-可拖拽网格实现教程

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

鸿蒙特效教程07-九宫格幸运抽奖

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

达芬奇DaVinci Fusion Studio 19.1.4中文激活版

Rose

免费好用的HEU KMS Activator(Win/Office全自动激活工具)

Rose

YashanDB字面量

YashanDB

鸿蒙特效教程05-鸿蒙很开门

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

YashanDB伪列

YashanDB

数据库 yashandb

重构智能设备管理范式:火山引擎端智能解决方案上新,多重 AI 服务即刻享用!

火山引擎边缘云

端智能 智能终端 #大模型

AV-Comparatives推出开创性EDR检测验证测试

财见

鸿蒙特效教程10-卡片展开/收起效果

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

HarmonyOS 之 @Require 装饰器自学指南

李游Leo

HarmonyOS NEXT

Netty源码—Pipeline和Handler(二)

不在线第一只蜗牛

Netty

YashanDB标识符

YashanDB

数据库 yashandb

鸿蒙特效教程08-幸运大转盘抽奖

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

Boris FX Silhouette 2024 (影视跟踪抠像合成软件) v2024.5.6 直装版

Rose

安利一个求职刷题小妙招、变身 offer 收割机 | 《趣玩》第 2 期

阿里云云效

阿里云 云原生 通义灵码

Dify+Agora 快速打造语音智能体;ISSEN:个性化 AI 语言老师,可语音交互丨日报

声网

鸿蒙特效教程04-直播点赞动画效果实现教程

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

YashanDB双引号

YashanDB

数据库 yashandb

鸿蒙特效教程09-深入学习animateTo动画

苏杰豪

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT

多任务学习在推荐算法中的应用(一)_文化 & 方法_Alex-zhai_InfoQ精选文章