写点什么

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

Sergio De Simone

  • 2024-10-11
    北京
  • 本文字数:1210 字

    阅读完需:约 4 分钟

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

谷歌介绍了一种将 Transformer 模型应用于音乐推荐的创新方法。目前,这一技术正在 YouTube 上进行试验性部署,目标是开发出一种能够理解用户在听音乐时的行为模式的推荐系统,通过分析用户的实时互动数据更好地理解用户偏好。


推荐系统通过分析用户的行为——如播放音乐、跳过曲目或对某首歌曲表示喜爱——来捕捉用户偏好,并据此推荐用户可能感兴趣的内容。


谷歌研究团队指出,音乐推荐系统在用户所处环境发生变化时常常表现不佳,例如从在家里听音乐变成在健身房听音乐。这种场景转换可能伴随着用户偏好从舒缓音乐转到更具活力的音乐。研究人员强调,尝试将这些上下文变化考虑在内,导致推荐系统要完成的任务变得更加困难,因为它们需要理解用户在当前上下文中的行为。


他们认为,Transformer 架构在这方面可能会有所用处,因为它特别适合理解输入数据序列,正如自然语言处理(NLP)和大语言模型(LLM)所证实的。谷歌研究团队相信,Transformer 架构有望展现出与理解基于用户上下文的语言相同的能力,从而深入洞察用户的行为序列。


自注意力层能够捕捉句子中单词之间的关系,这表明它们可能具备解析用户行为联系的潜力。在 Transformer 模型中,注意力层通过学习输入 Token 之间的权重分配,类似于分析句子中单词的关系,从而实现对用户行为序列的理解。


谷歌研究团队的目标是将 Transformer 架构从生成式模型转变为理解基于当前上下文的用户行为序列。这种理解随后与个性化排名模型相结合,生成精准的推荐。为了解释用户行为在不同上下文中可能具有的不同含义,研究人员以在健身房听音乐的用户为例,指出他们可能更偏好节奏感强的音乐。而在家中,这类音乐可能会被跳过。因此,在健身房时,推荐系统应降低对这种行为的关注权重。换句话说,推荐系统需要在考虑用户特定上下文与整体用户音乐收听记录之间合理分配注意力权重。


我们仍然会利用他们之前听过的音乐记录,并推荐与他们常听的音乐相似的曲目。实际上,我们正在探索哪些历史记录对于当前音乐排序任务是有价值的,以及哪些不是。


作为对谷歌推荐系统工作原理的简要总结,基于 Transformer 的系统遵循推荐系统的典型流程,分为三个主要阶段:首先从资料库检索项目,然后根据用户行为对项目进行排序,最后通过筛选减少展示给用户的选项。在对项目进行排名时,系统将 Transformer 技术与现有的排名模型相结合。每首歌曲都关联一个叫作“曲目嵌入”的向量,该向量同时用于 Transformer 和排名模型。与用户行为和曲目元数据相关的信号被映射到等长的向量,使得它们能够像曲目嵌入一样处理。例如,当向 Transformer 提供输入时,用户行为嵌入和音乐曲目嵌入会被相加,形成一个 Token。最终,Transformer 的输出与排名模型的输出通过多层神经网络进行融合。


谷歌研究人员的初步实验结果表明,推荐系统的性能得到了提升,具体表现为用户跳过率的降低和音乐播放时间的增加。


查看英文原文:

https://www.infoq.com/news/2024/09/transofrmer-based-recommender/

2024-10-11 08:089126

评论

发布
暂无评论
发现更多内容

能源势动:电力行业的碳中和该如何实现?

脑极体

玩转gRPC—深入概念与原理

闫同学

gRPC 网络协议 后端开发

TLA+ 入门教程(1):形式化方法简介

多颗糖

分布式系统 TLA+

关于栈区、堆区、全局区、文字常量区、程序代码区

NewBoy

前端 移动端 iOS 知识体系 7月月更

HPDC智能基座人才发展峰会随笔

乌龟哥哥

7月月更

认识ThreadPoolExecutor

zarmnosaj

7月月更

广电五舟与华为签署合作协议,共同推进昇腾AI产业持续发展

Geek_2d6073

leetcode 72. Edit Distance 编辑距离(中等)

okokabcd

LeetCode 动态规划 算法与数据结构

Vuex(三)

小恺

7月日更

质量体系建设之路的分分合合

声网

创业讲堂 生态专栏

跨域请求

Jason199

跨域 7月月更

牛客java选择题每日打卡Day6

京与旧铺

7月月更

【愚公系列】2022年7月 Go教学课程 003-IDE的安装和基本使用

愚公搬代码

7月月更

可观测|时序数据降采样在Prometheus实践复盘

阿里巴巴云原生

阿里云 云原生 Prometheus 可观测

HUAWEI nova 10系列发布 华为应用市场筑牢应用安全防火墙

最新动态

繁华落尽、物是人非:个人站长该何去何从

石头IT视角

浅聊一下中间件

为自己带盐

中间件 7月月更 dotnetcore

后CentOS时代的操作系统漫谈

冯骐

centos 开源 openEuler 国产化 Anolis

可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成

Apache SeaTunnel

数据同步 数据集成 可视化开发 数据集成平台 拖拉拽

使用 BlocConsumer 同时构建响应式组件和监听状态

岛上码农

flutter ios 安卓 移动端开发 7月月更

服务线上治理

阿泽🧸

微服务 7月月更

2022-Java后端工程师面试指南-(Java基础篇)

自然

Java’ 7月月更

【算法社区】训练准备和复杂度分析

小明Java问道之路

数据结构 算法 LeetCode 7月月更 算法社区

蓝队攻防演练中的三段作战

穿过生命散发芬芳

攻防演练 7月月更

【Docker 那些事儿】容器为什么傲娇?全靠Hub撑腰

Albert Edison

7月月更

C语言中sizeof操作符的坑

Albert Edison

c++ C语言 7月月更 sizeof

赋能数字经济 福昕软件出席金砖国家可持续发展高层论坛

联营汇聚

智洋创新与华为签署合作协议,共同推进昇腾AI产业持续发展

Geek_2d6073

湘江鲲鹏加入昇腾万里伙伴计划,与华为续写合作新篇章

Geek_2d6073

图解网络:什么是网关负载均衡协议GLBP?

wljslmz

网络协议 7月月更 GLBP 图解网络 网关负载均衡协议

算法入门很简单:链表题套路及精选题目

宇宙之一粟

链表 7月月更

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐_架构/框架_InfoQ精选文章