写点什么

多任务学习在推荐算法中的应用(一)

  • 2020-01-07
  • 本文字数:1023 字

    阅读完需:约 3 分钟

多任务学习在推荐算法中的应用(一)


导读:我们在优化推荐效果的时候,很多时候不仅仅需要关注 CTR 指标,同时还需要优化例如 CVR ( 转化率 )、视频播放时长、用户停留时长、用户翻页深度、关注率、点赞率这些指标。那么一种做法是对每个任务单独使用一个模型来优化,但是这样做的缺点显而易见,需要花费很多人力。其实很多任务之间都是存在关联性的,比如 CTR 和 CVR。那么能不能使用一个模型来同时优化两个或多个任务呢?其实这就是 Multi-task 多任务的定义。本文主要总结了近两年工业界关于 Multi-task 模型在推荐场景的一些应用和工作。

1. 阿里 ESMM

Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate


CVR 是指从点击到购买的转化,传统的 CVR 预估会存在两个问题:样本选择偏差和稀疏数据。



样本选择偏差是指模型用用户点击的样本来训练,但是预测却是用的整个样本空间。数据稀疏问题是指用户点击到购买的样本太少。因此阿里提出了 ESMM 模型来解决上述两个问题:主要借鉴多任务学习的思路,引入两个辅助的学习任务,分别用来拟合 pCTR 和 pCTCVR。



ESMM 模型由两个子网络组成,左边的子网络用来拟合 pCVR,右边的子网络用来拟合 pCTR,同时,两个子网络的输出相乘之后可以得到 pCTCVR。因此,该网络结构共有三个子任务,分别用于输出 pCTR、pCVR 和 pCTCVR。假设用 x 表示 feature ( 即 impression ),y 表示点击,z 表示转化,那么根据 pCTCVR = pCTR * pCVR,可以得到:



则 pCVR 的计算为:



由上面的式子可知,pCVR 可通过 pCTR 和 pCTCVR 推导出来,那么我们只需要关注 pCTR 和 pCTCVR 两个任务即可,并且 pCTR 和 pCTCVR 都可以从整个样本空间进行训练?为什么呢,因为对于 pCTR 来说可将有点击行为的曝光事件作为正样本,没有点击行为的曝光事件作为负样本,对于 PCTCVR 来说,将同时有点击行为和购买行为的曝光事件作为正样本,其他作为负样本。模型的 loss 函数:



另外两个子网络的 embedding 层是共享的,由于 CTR 任务的训练样本量要远超过 CVR 任务的训练样本量,ESMM 模型中 embedding 层共享的机制能够使得 CVR 子任务也能够从只有展现没有点击的样本中学习,从而能够极缓解训练数据稀疏性问题。


本文转载自 DataFunTalk 公众号。


**原文链接:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247496333&idx=1&sn=da03f8db68e5276cffe73e090ac271ec&chksm=fbd740e1cca0c9f76da90a713311bac81e9890c1f9fd69976705e167dd30e4135db6ea297d6b&scene=27#wechat_redirect


2020-01-07 09:491276

评论

发布
暂无评论
发现更多内容

VMware 用户如何应对订阅制涨价?超融合能否成为最优替代方案?

智驱前线

MyEMS:用开源智能破解能源管理难题,从车间到园区的全场景实践

开源能源管理系统

开源 能源管理系统

利用BERT模型提升语音识别重排序效果

qife122

深度学习 语音识别

Altair HyperWorks教程:线性屈曲分析

智造软件

仿真 CAE软件 hyperworks 汽车行业 航空

CST如何在仿真之后添加场监视器继续计算

思茂信息

cst电磁仿真 CST软件 CST Studio Suite

Sentieon 项目文章 | 一例中国男童及139例Pearson综合征患者的临床和遗传特征

INSVAST

基因数据分析 生信分析 Sentieon 精准医疗 线粒体DNA

MyEMS:开源驱动,重塑智能能源管理新范式

开源能源管理系统

开源 能源管理系统

InQL Scanner:GraphQL安全测试利器

qife122

graphql Burp Suite

解码芯安全,天翼云红盾实验室筑牢“芯”防线!

天翼云开发者社区

安全 天翼云

Nexa SDK 支持本地运行 Kokoro 等语音模型;AI 猎头智能体 Standout:给 AI 打电话找工作丨日报

声网

持续领跑,再获殊荣!

天翼云开发者社区

云计算 政务云 天翼云

AI对齐审计代理技术解析

qife122

AI对齐 模型测试

浪浪山小妖怪逆袭记:低代码打造基层数字化转型超能力

中烟创新

Grafana无法启动修复解决

天翼云开发者社区

Grafana

观测云产品更新 | RUM、APM、场景、监控、管理等

观测云

产品迭代

突围能源管理难题:MyEMS 开源方案的实战智慧

开源能源管理系统

开源 开源能源管理系统

DAPP的外包开发流程

北京木奇移动技术有限公司

dapp开发 区块链开发 软件外包公司

“文件自由”的鸿蒙实践:两个独立开发者与《流舟文件》的破局之旅

最新动态

虚引用GC耗时分析优化(由 1.2 降低至 0.1 秒)

京东科技开发者

星空开源MES(万界星空科技)——专业、通用、开源、免费的MES系统

万界星空科技

开源软件 mes 开源mes mes源码 万界星空科技mes

活动报名:出海增长,从 0 到 1,从 1 到 100、1000 一次性完整分享!丨RTE Meetup

声网

等保测评流程全解析:步步为营筑安全

等保测评

Text2SQL准确率暴涨22.6%!3大维度全拆

京东科技开发者

MCP神器!MCP-USE 一键部署连接任何MCP服务器

程序员海军

AI+ AIGC MCP MCP Server

火山引擎数智平台发布Data Agent"一客一策"与AI数据湖"算子广场"

字节跳动数据平台

大数据 智能体 agent

海外舆情监测如何成为品牌建设的“导航仪”

沃观Wovision

企业出海 海外舆情监控 沃观Wovision

从海外热帖到政策风向:境外舆情如何指导出海战略?

沃观Wovision

海外舆情监控 沃观Wovision 舆情监测系统

等保 2.0:开启网络安全防护新篇章

等保测评

万力轮胎36亿柬埔寨橡胶轮胎项目的RFID技术真相

斯科信息

斯科信息 RFID技术 RFID标签

基于开发者空间OpenGauss数据库列存引擎的分析与使用

华为云开发者联盟

opengauss AI+ dify 华为开发者空间

区块链U卡APP的外包开发

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发公司

多任务学习在推荐算法中的应用(一)_文化 & 方法_Alex-zhai_InfoQ精选文章