本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文主要根据 RecSys 2019 中论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》总结最近三年四大顶会深度推荐系统上的 18 个最新算法。
今年 RecSys 2019 上出现的一篇极具批判性的论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。灵魂一问深度学习是否在推荐系统已经取得了足够可信的进展?在知乎上也引起了激烈的讨论:如何看待RecSys 2019上的一篇文章认为现有DNN-based推荐算法带来的基本上都是伪提升?
作者总结了过去三年四大顶会(KDD、SIGIR、WWW 和 RecSys)推荐系统上 18 个最新算法,只有 7 个能重现效果,而且在不同的测试数据集上它们与浅层经典方法效果对比中经常都败下阵来,并开源了评估代码与数据集。
抛开论文中提到到目前推荐系统众所周知的因为评估数据集、评估指标、以及 baseline 调参等问题不一致导致诸多论文算法在性能可复现上存在的诸多问题,作为产业界的算法工程师来说更多的是需要从最新的顶会工作中开拓视野、吸取不同的思路,来确定工业界线上系统中的下一步的迭代方向。不管黑猫白猫,只要应用在线上系统有确切实际效果的工作就是好工作。
1. Collaborative Memory Network for Recommendation Systems
作者:Travis Ebesu, Bin Shen, Yi Fang;
论文:t.cn/AiRbpFAR; 代码:t.cn/EPRooTK;
Google at SIGIR 2018,提出 CMN 算法融合记忆网络与注意力机制帮助 CF 类算法捕捉 user 和 item 之间的高阶复杂关系。效果好于 CDAE 和 NeuMF 等,并开源了代码。
2. Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model
作者:Binbin Hu, Chuan Shi, Wayne Xin Zhao, Philip S. Yu;
论文:t.cn/AiRbsEUf; 代码:t.cn/EtOkDu7;
KDD 2018,提出 MCRec 算法借助丰富的元路径和互注意力机制进行 Top-N 推荐,可以有效学习 user、item 以及基于元路径的上下文的表示从而学习他们之间的交互。效果好于 NeuMF 等,并开源了代码。
3. Collaborative Variational Autoencoder for Recommender Systems
作者:Xiaopeng Li, James She;
论文:t.cn/AiRGt8SQ; 代码:t.cn/EyWuDRS;
KDD 2017,提出 CVAE 考虑多媒体场景下的推荐内容与交互数据,以无监督的方式学习 item 和用户的深度隐式表示以及他们之间的隐式关系。效果好于 CDL 等,并开源了代码。
4. Collaborative Deep Learning for Recommender Systems
作者:Hao Wang, Naiyan Wang, Dit-Yan Yeung;
论文:t.cn/AiRG66mD; 代码:t.cn/AiRG66mF;
KDD 2015,针对 CF 类方法学习用户与 item 的交互往往过于稀疏导致推荐效果不好的问题,提出 CDL 算法结合用户交互数据与 item 内容辅助信息来学习隐式表示。效果好于 CTR 和 CMF 等模型,并开源了代码。
5. Neural Collaborative Filtering
作者:Xiangnan He, Lizi Liao, Hanwang Zhang, Liqiang Nie, Xia Hu, Tat-Seng Chua;
论文:t.cn/ROuL87r; 代码:t.cn/ROuhFZP;
WWW 2017,提出 NCF 框架使用 NN 网络结构代替內积形式来学习用户和 item 之间的交互,从而实现对 MF 类方法进行扩展。效果好于现有 MF 类方法,并开源了代码。
6. Spectral Collaborative Filtering
作者:Lei Zheng, Chun-Ta Lu, Fei Jiang, Jiawei Zhang, Philip S. Yu;
论文:t.cn/AiRM65fz; 代码:t.cn/AiRM65VF;
RecSys 2018,提出 SpectralCF 算法引入光谱图理论结合在用户-item 二分图上进行光谱卷积操作解决 CF 类算法在推荐冷启动问题上的弱点。效果好于 NCF 等,并开源了代码。
7. Variational Autoencoders for Collaborative Filtering
作者:Dawen Liang, Rahul G. Krishnan, Matthew D. Hoffman, Tony Jebara;
论文:t.cn/RRD6veZ; 代码:t.cn/RRD6veA;
NetFlix at WWW 2018,基于变分自动编码器的 CF 算法。效果明显好于 NCF 和 CDAE 等,并开源了代码。
8. Multi-Pointer Co-Attention Networks for Recommendation
作者:Yi Tay, Luu Anh Tuan, Siu Cheung Hui
论文:t.cn/AiRotBGQ; 代码:t.cn/E72ViBh;
KDD 2018,基于协同注意力机制,针对用户评论以及与商品相关的评论进行重要性选择,用来学习用户与 item 的表示。效果好于同样基于评论建模的 D-ATT/ TransNet/DeepCoNN 等,并开源了代码。
9. Recurrent Knowledge Graph Embedding for Effective Recommendation
作者:Zhu Sun, Jie Yang, Jie Zhang, Alessandro Bozzon, Long-Kai Huang, Chi Xu
论文:t.cn/AiRKtn8B; 代码:t.cn/AiRKtn81;
RecSys 2018,提出一种 KG embedding 方法 RKGE,基于 RNN 网络自动学习实体与实体间 path 的 embedding 表示。效果好于 NCF 与 CKE 等,并开源了代码。
10. RecGAN: Recurrent Generative Adversarial Networks for Recommendation Systems
作者:Homanga Bharadhwaj, Homin Park, Brian Y. Lim;
RecSys 2018,结合 RNN 和 GAN 提出 RecGAN 框架更好地学习用户 item 交互背后的时域与隐式特征。
11. Attentive Neural Architecture Incorporating Song Features for Music Recommendation
作者:Noveen Sachdeva, Kartik Gupta, Vikram Pudi
RecSys 2018,基于 Attention 机制结合歌曲的特征更好地学习用户短期兴趣进行下一首音乐的推荐,效果好于 RNN 以及基于 Session 的 CF 类算法。
12. 3D Convolutional Networks for Session-based Recommendation with Content Features
作者:Trinh Xuan Tuan, Tu Minh Phuong
RecSys 2017,使用三维卷积神经网络针对序列推荐中的用户-item 交互数据以及内容特征更好地进行建模,效果好于 GRU4Rec 等。
13. Convolutional Matrix Factorization for Document Context-Aware Recommendation
作者:Donghyun Kim, Chanyoung Park, Jinoh Oh, Seungyong Lee, Hwanjo Yu
论文:t.cn/AiEGRrew; 代码:t.cn/AiEGRreA;
RecSys 2016,提出 ConvMF 算法结合 CNN 以及概率矩阵分解 PMF 更好地捕捉 item 的上下文信息,从而提高预测的准确度。效果好于 CDL 等,并开源了代码。
14. Meta-Prod2Vec: Product Embeddings Using Side-Information for Recommendation
作者:Flavian Vasile, Elena Smirnova, Alexis Conneau
RecSys 2016,提出 Meta-Prod2Vec 算法针对 Prod2Vec 算法加入类别型 side information。效果好于原有 Prod2Vec。
15. A Contextual Attention Recurrent Architecture for Context-Aware Venue Recommendation
作者:Jarana Manotumruksa, Craig Macdonald, Iadh Ounis
论文:t.cn/AiEqZfuT; 代码:t.cn/AiEqLdDT;
SIGIR 2018,提出 CARA 框架结合序列中的反馈信息以及上下文信息更好地捕获用户的动态偏好,进行酒店推荐。主要包含一个上下文注意力门和基于时间和地理位置门。效果好于 GRU 以及 LatentCross 等,并开源了代码。
16. Attentive Collaborative Filtering: Multimedia Recommendation with Item-and Component-Level Attention
作者:Jingyuan Chen, Hanwang Zhang, Xiangnan He, Liqiang Nie, Wei Liu, Tat-Seng Chua
论文:t.cn/AiEq5MT6; 代码:t.cn/AiEq5MTA;
SIGIR 2017,提出适用于 CF 的注意力机制跨级啊 ACF,包含 component-level 和 item-level 的注意力模块,更好地学习多媒体内容上用户的偏好。效果好于 DeepHybrid 等,并开源了代码。
17. Latent Relational Metric Learning via Memory-based Attention for Collaborative Ranking
作者:Yi Tay, Anh Tuan Luu, Siu Cheung Hui
论文:t.cn/AiEqIszv; 代码:t.cn/AiEqMIuC;
WWW 2018,提出一种协同推荐上新的度量学习方法 LRML,旨在学习用户和 item 之间的相关关系,而不是简单的用户和项目之间的 push 和 pull 关系。采用了一个增强的存储器模块,并通过这些记忆块来构建用户和项目潜在的关系。效果好于 NeuMF 和 CML 等,并开源了代码。
18. A Multi-view Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems
作者:Ali Mamdouh Elkahky, Yang Song, Xiaodong He
论文:t.cn/AiEqJyzT; 代码:t.cn/AiEqJ8iv;
微软 at WWW 2015,基于 DSSM 匹配模型提出一种跨领域构建用户模型的推荐算法 MV-DSSM 框架。MV-DNN 联合了多个域做的丰富特征进行联合模型推荐,效果好于 CTR 等并开源了代码。
参考链接:
本文授权转载自知乎专栏“深度推荐系统”。原文链接:https://zhuanlan.zhihu.com/p/81895505
评论