阿里提出联合预估算法JUMP：点击率和停留时长预测效果最优_阿里巴巴_周腾飞

停留时长预估

对于停留时间的预估，我们借鉴了“生存分析”(Survival Analysis) 的思想，通过时间发生的时间去近似用户在一个内容上停留的时间；从概念上来说，停留时长被认为是“离开当前内容”这个事件的发生时间。如果我们记用户的停留时长的样本为 O，假设存在一个函数，将 O 映射到一个简单的分布 f 上：

这里 f 可能是一个高斯分布，伽马分布等。可以证明的是：

其中 F 表示累计概率分布（CDF），T 是对 O 的在线近似。那么有了上述公式后，我们就可以使用最大似然估计去预估样本的停留时间。我们分析了 RecSys15 数据及上的停留时间，原始分布如左下图，然而我们对停留时间取 log 后，得到了右下图。我们很高兴的发现在取 log 之后，停留时间是符合正态分布的。

于是我们取 g 为 log 函数，f 为正态分布函数，最终我们能得到似然函数：

学习建模

我们记一个用户的会话为一个行为序列：\(s_k=\{(i_j,\log \tau _j,\delta _j)\},j=1,2,\cdots ,k\)。其中 i 表示第 j 个点击的商品，\(\tau _j\) 表示停留时间，而\(\delta _j\) 是一个 bool 类型，表示是否是会话的最后一个商品（或者停留时间过长）。我们假设样本是从一个分布 P(S) 中采样出来，那么可以将分布分解为 2 项的积。

其中前一项表示点击率的似然，后一项表示停留时间的似然；\(s_{k-1}\) 表示会话中第 k 次点击前的行为。为了从会话的行为中抽取更多的有效信息，我们提出了一种三层 RNN 模型去编码。

Attention Layer: 我们设计注意力机制主要目的是去除会话中的噪音，保留真正有效的信息。表示 fast-slow 层的输出，a 对应 attention 的权重，对应的计算方法如下面公式：

Fast-Slow Layer: fast-slow 层提出了一种新奇的 RNN 网络。当我们处理第 j 个输入\((i_j,\log \tau _j,\delta _j)\) 的时候，会进入一个 F-S 处理单元，其中包括一个慢元子和一个快元子序列，慢元子会记忆更多长期的记忆，而快元子会更多的获取当前的信息。F-S 处理单元如下图所示：

Embedding Layer: 网络的最底层是一个 embedding 层，该层将一个二元组\((i_j,\log \tau _j)\) 映射到一个向量上，我们使用 batch-normalizing 对输入进行标准化：

实验

为了验证算法的性能，我们将 JUMP 算法对比了主流的基于会话的预估算法，验证在点击率预估和停留时长预估上的效果。对比的算法包括 GRU、IGRU、NARM、DTGRU，RMTP、ATRP、NSR，使用的数据集是 RecSys15、CIKM16 和 REDDIT。

点击率预估的结果如下表所示，我们可以看到在全部数据集上，JUMP 算法都能超越其他算法，取得最好的 Recall、MRR 和 NDCG 指标。

同时我们观察了 embedding 维度对 recall 指标的影响，结果如下图。我们可以到看随着 embedding 维度的提升，recall 指标都能得到一定的上升，但是基本都在 100 维左右达到最高；其次，我们仍然可以发现，JUMP 算法取得的效果是优于其他算法的，蓝色曲线总是在其他曲线之上。

除了点击率外，我们观察了在时间预估这个任务上的效果，结果如下表所示。对比 ATRP、RMTP 和 NSR 算法，JUMP 能明显提升预估的准度。

总结

本文提出了一种新奇的算法 JUMP，同时预估一个会话中的点击率和停留时间。主要有 3 点重要贡献：

使用生存分析的方法来建模用户的停留时间，建立在可靠的数据理论基础上；
提出了一种三层的 RNN 结构，基于注意力机制能提升模型的鲁棒性，降低噪音的影响；
使用了一种全新设计的 fast-slow 结构，加强对短会话的学习能力。大量实验验证了算法的有效性，在多个公开数据集上的结果，对比其他的算法都有大幅提升。

论文全文链接：

http://www.cs.zju.edu.cn/people/qianhui/pub/Zhou18.pdf

发布

暂无评论

创作场景

阿里提出联合预估算法 JUMP：点击率和停留时长预测效果最优

停留时长预估

学习建模

实验

总结

评论

Spring Boot「01」构建 REST API

Photoshop软件应用项目（二）

IDEA的Docker插件实战(Dockerfile篇)

hashmap常见面试题

欢迎新大陆软件加入openGauss社区

业务流程巡检拨测常用的开源工具

40道Promise输出题，你都会了吗？🔥

分布式定时任务设计及其框架

数据结构线性表链表

【Java深入学习】可见性

Python进阶(五)浅谈python匿名函数及编写无参数decorator

【Java深入学习】join再理解

Python应用之基础结构：二叉树前序遍历

斐波那契数

Vue常用修饰符大全

Qt | 实现自定义手机号输入框控件

Java的跨平台和环境搭建

2022 年适用于 Linux 和 Windows 的五款最佳 Python 代码编辑器

【算法作业】实验四：逆波兰表达式求值 & Fibonacci数列的尾递归与非递归程序

Python进阶(七)浅谈python3和Python2的区别

大数据ELK（十八）：Beats 简单介绍和FileBeat工作原理

LinkedList源码分析（二）

Node.js TLSSocket 库里涉及到的证书链的概念简介

AI大模型的白垩纪

【算法作业】实验二：给立方体排序的小明&&同时整除的数

【算法作业】实验三：划分集合-贪心 & 可能的IP地址-回溯

10项任务助你落地架构课程！

C++ | 关于extern关键字的使用

Python应用之基础结构：链表- 删除排序链表中的重复元素

【C语言内功修炼】动态内存管理的奥秘

MFC|CCombobox控件修改编辑框光标显示位置

创作场景

阿里提出联合预估算法 JUMP：点击率和停留时长预测效果最优

停留时长预估

学习建模

实验

总结

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载