写点什么

多任务学习在推荐算法中的应用(一)

  • 2020-01-07
  • 本文字数:1023 字

    阅读完需:约 3 分钟

多任务学习在推荐算法中的应用(一)


导读:我们在优化推荐效果的时候,很多时候不仅仅需要关注 CTR 指标,同时还需要优化例如 CVR ( 转化率 )、视频播放时长、用户停留时长、用户翻页深度、关注率、点赞率这些指标。那么一种做法是对每个任务单独使用一个模型来优化,但是这样做的缺点显而易见,需要花费很多人力。其实很多任务之间都是存在关联性的,比如 CTR 和 CVR。那么能不能使用一个模型来同时优化两个或多个任务呢?其实这就是 Multi-task 多任务的定义。本文主要总结了近两年工业界关于 Multi-task 模型在推荐场景的一些应用和工作。

1. 阿里 ESMM

Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate


CVR 是指从点击到购买的转化,传统的 CVR 预估会存在两个问题:样本选择偏差和稀疏数据。



样本选择偏差是指模型用用户点击的样本来训练,但是预测却是用的整个样本空间。数据稀疏问题是指用户点击到购买的样本太少。因此阿里提出了 ESMM 模型来解决上述两个问题:主要借鉴多任务学习的思路,引入两个辅助的学习任务,分别用来拟合 pCTR 和 pCTCVR。



ESMM 模型由两个子网络组成,左边的子网络用来拟合 pCVR,右边的子网络用来拟合 pCTR,同时,两个子网络的输出相乘之后可以得到 pCTCVR。因此,该网络结构共有三个子任务,分别用于输出 pCTR、pCVR 和 pCTCVR。假设用 x 表示 feature ( 即 impression ),y 表示点击,z 表示转化,那么根据 pCTCVR = pCTR * pCVR,可以得到:



则 pCVR 的计算为:



由上面的式子可知,pCVR 可通过 pCTR 和 pCTCVR 推导出来,那么我们只需要关注 pCTR 和 pCTCVR 两个任务即可,并且 pCTR 和 pCTCVR 都可以从整个样本空间进行训练?为什么呢,因为对于 pCTR 来说可将有点击行为的曝光事件作为正样本,没有点击行为的曝光事件作为负样本,对于 PCTCVR 来说,将同时有点击行为和购买行为的曝光事件作为正样本,其他作为负样本。模型的 loss 函数:



另外两个子网络的 embedding 层是共享的,由于 CTR 任务的训练样本量要远超过 CVR 任务的训练样本量,ESMM 模型中 embedding 层共享的机制能够使得 CVR 子任务也能够从只有展现没有点击的样本中学习,从而能够极缓解训练数据稀疏性问题。


本文转载自 DataFunTalk 公众号。


**原文链接:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247496333&idx=1&sn=da03f8db68e5276cffe73e090ac271ec&chksm=fbd740e1cca0c9f76da90a713311bac81e9890c1f9fd69976705e167dd30e4135db6ea297d6b&scene=27#wechat_redirect


2020-01-07 09:491043

评论

发布
暂无评论
发现更多内容

解读 Sobit  v2:铭文资产跨链更注重安全、易用性

大瞿科技

CPU 高负载故障演练

腾讯云混沌演练平台

混沌工程 cpu飙满

内容分发策略与 SEO 优化指南

小万哥

程序人生 软件工程 后端开发 内容分发 技术写作

文心一言 VS 讯飞星火 VS chatgpt (175)-- 算法导论13.3 4题

福大大架构师每日一题

福大大架构师每日一题

自带恒压恒流环路的降压型单片车充专用芯片

芯动大师

融云 CEO 董晗荣获 51CTO 「2023 年度科技影响力人物奖」

融云 RongCloud

IT 社交 科技 融云 wicc

2023 年度合辑 | 出海大年的全球化产品洞察和服务动向

融云 RongCloud

产品 全球化 IT 服务 融云

ChatGPT以“人”的身份被《自然》杂志社选为2023十大故事

B Impact

8.5亿美元年收入,Anthropic能搞定Notion、Quora,真行

B Impact

【新手入门】软件工程师必备技能-代码review调试定位问题

极客罗杰

融云 CEO 董晗荣获 51CTO 「2023 年度科技影响力人物奖」

融云 RongCloud

IT 企业 科技 融云 人物

张瑞敏新书《永恒的活火》:没有完美产品,只有向完美迭代的场景

B Impact

极狐GitLab x 智众医疗 | 成为3.5亿慢病患者的健康管家

极狐GitLab

2023 IoTDB Summit:天谋科技高级开发工程师田原《尽其用:如何用 IoTDB 发掘数据的无限潜能》

Apache IoTDB

解读 Sobit v2:铭文资产跨链更注重安全、易用性

石头财经

软件测试/测试开发/全日制|Pytest测试用例调度与运行

霍格沃兹测试开发学社

解读 Sobit  v2:铭文资产跨链更注重安全、易用性

股市老人

Google Adsense探索系列_第一弹

fkys

Google adsense ads.txt not found 未找到

解读 Sobit v2:铭文资产跨链更注重安全、易用性

加密眼界

解读 Sobit v2:铭文资产跨链更注重安全、易用性

BlockChain先知

强大的蓝光播放器 Aiseesoft Blu-ray Player激活最新

mac大玩家j

Mac软件推荐 蓝光播放器 视频播放器软件

概念回顾:MQTT?

NGINX开源社区

nginx 物联网 HTTP TCP/IP mqtt

位列云数据库领导者象限!天翼云以科技赋能千行百业数字化转型!

编程猫

系统存储架构升级分享

京东科技开发者

基于Hologres+Flink的曹操出行实时数仓建设

阿里云大数据AI技术

面朝欧洲,迈上“云桥”,走一条无忧丝路

脑极体

出海

左耳听风 - 中年危机「读书打卡 day 03」

Java 工程师蔡姬

读书笔记 程序员 读书 中年危机 左耳朵耗子

强大的iOS系统恢复:Fix My iPhone最新激活

胖墩儿不胖y

Mac软件 修复软件 iOS修复工具

多任务学习在推荐算法中的应用(一)_文化 & 方法_Alex-zhai_InfoQ精选文章