写点什么

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

Sergio De Simone

  • 2024-10-11
    北京
  • 本文字数:1210 字

    阅读完需:约 4 分钟

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

谷歌介绍了一种将 Transformer 模型应用于音乐推荐的创新方法。目前,这一技术正在 YouTube 上进行试验性部署,目标是开发出一种能够理解用户在听音乐时的行为模式的推荐系统,通过分析用户的实时互动数据更好地理解用户偏好。


推荐系统通过分析用户的行为——如播放音乐、跳过曲目或对某首歌曲表示喜爱——来捕捉用户偏好,并据此推荐用户可能感兴趣的内容。


谷歌研究团队指出,音乐推荐系统在用户所处环境发生变化时常常表现不佳,例如从在家里听音乐变成在健身房听音乐。这种场景转换可能伴随着用户偏好从舒缓音乐转到更具活力的音乐。研究人员强调,尝试将这些上下文变化考虑在内,导致推荐系统要完成的任务变得更加困难,因为它们需要理解用户在当前上下文中的行为。


他们认为,Transformer 架构在这方面可能会有所用处,因为它特别适合理解输入数据序列,正如自然语言处理(NLP)和大语言模型(LLM)所证实的。谷歌研究团队相信,Transformer 架构有望展现出与理解基于用户上下文的语言相同的能力,从而深入洞察用户的行为序列。


自注意力层能够捕捉句子中单词之间的关系,这表明它们可能具备解析用户行为联系的潜力。在 Transformer 模型中,注意力层通过学习输入 Token 之间的权重分配,类似于分析句子中单词的关系,从而实现对用户行为序列的理解。


谷歌研究团队的目标是将 Transformer 架构从生成式模型转变为理解基于当前上下文的用户行为序列。这种理解随后与个性化排名模型相结合,生成精准的推荐。为了解释用户行为在不同上下文中可能具有的不同含义,研究人员以在健身房听音乐的用户为例,指出他们可能更偏好节奏感强的音乐。而在家中,这类音乐可能会被跳过。因此,在健身房时,推荐系统应降低对这种行为的关注权重。换句话说,推荐系统需要在考虑用户特定上下文与整体用户音乐收听记录之间合理分配注意力权重。


我们仍然会利用他们之前听过的音乐记录,并推荐与他们常听的音乐相似的曲目。实际上,我们正在探索哪些历史记录对于当前音乐排序任务是有价值的,以及哪些不是。


作为对谷歌推荐系统工作原理的简要总结,基于 Transformer 的系统遵循推荐系统的典型流程,分为三个主要阶段:首先从资料库检索项目,然后根据用户行为对项目进行排序,最后通过筛选减少展示给用户的选项。在对项目进行排名时,系统将 Transformer 技术与现有的排名模型相结合。每首歌曲都关联一个叫作“曲目嵌入”的向量,该向量同时用于 Transformer 和排名模型。与用户行为和曲目元数据相关的信号被映射到等长的向量,使得它们能够像曲目嵌入一样处理。例如,当向 Transformer 提供输入时,用户行为嵌入和音乐曲目嵌入会被相加,形成一个 Token。最终,Transformer 的输出与排名模型的输出通过多层神经网络进行融合。


谷歌研究人员的初步实验结果表明,推荐系统的性能得到了提升,具体表现为用户跳过率的降低和音乐播放时间的增加。


查看英文原文:

https://www.infoq.com/news/2024/09/transofrmer-based-recommender/

2024-10-11 08:089166

评论

发布
暂无评论
发现更多内容

解决90%面试问题!GitHub顶级"Java面试手册"了解下八股文天花板

三十而立

Java java面试

币安/欧意合约自动跟单软件开发源代码

开发v-hkkf5566

永洪BI、瓴羊Quick BI领衔国产BI工具

巷子

华为昇思MindSpore开源社区三周年生日会,三大亮点不容错过!

Geek_2d6073

低代码开发:助力企业高效实现数字转型的一大利器

加入高科技仿生人

大数据 低代码 数字化 数字转型

内核不中断前提下,Gaussdb(DWS)内存报错排查方法

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

合约跟单项目系统开发(技术源码)丨合约量化系统开发技术(成熟案例)

I8O28578624

软件测试/测试开发丨在Docker 上搭建持续集成平台 Jenkins

测试人

软件测试 自动化测试 测试开发

两项大奖加持,浩鲸科技福利小店-WHALE SELECT

鲸品堂

福利 平台 平台搭建 企业号 3 月 PK 榜

山东大学-飞桨人工智能教育创新中心正式挂牌,打造区域产教融合新范式

飞桨PaddlePaddle

关于 MyBatis 我总结了 10 种通用的写法

三十而立

Java mybatis

一点点进步的OceanBase数据库文档!

OceanBase 数据库

数据库 oceanbase

多功能PDF编辑工具:Nitro PDF Pro激活版

真大的脸盆

Mac PDF Mac 软件 PDF编辑 pdf编辑工具

任务卷轴模式系统开发NFT技术

薇電13242772558

系统

质量内建落地的四要素

老张

质量保障 质量内建 交付质量

git客户端软件:Sublime Merge 激活版

真大的脸盆

Mac Mac 软件 Git客户端

GPT-4写代码能力提升21%!MIT新方法让LLM学会反思,网友:和人类的思考方式一样

Openlab_cosmoplat

机器学习 开源社区 智能 ChatGPT GPT-4

百度安全助力小度智能屏通过中国泰尔实验室适老化技术测试认定

百度安全

智能硬件

百图生科AIGP平台发布:提供多种蛋白质生成能力,邀伙伴联手开发“新物种”

硬科技星球

批量上传iOS应用程序截图的实用技巧

雪奈椰子

ADDS-DepthNet:基于域分离的全天图像自监督单目深度估计

飞桨PaddlePaddle

模型驱动软件开发 打造企业数字化未来

力软低代码开发平台

智慧公厕:未来城市的必备设施

光明源智慧厕所

物联网 智慧城市

中康科技黄毅宁:AI+医疗,于我而言是圆梦

飞桨PaddlePaddle

如何高效搭建资产管理平台?众安科技告诉你答案是图技术

NebulaGraph

图数据库

面试造火箭?GitHub飙升“2023(Java 岗)面试真题汇总”转载40万

三十而立

Java java面试

从GPT-4、文心一言再到Copilot,AIGC卷出新赛道?

引迈信息

微软 AIGC 文心一言 GPT-4

黄牛党“屯购”OPPO Find X6 无感验证护航官方商城安全

Geek_2d6073

软件测试/测试开发丨APP自动化Android特殊控件Toast识别

测试人

软件测试 自动化测试 测试开发

数据库领域3月大事件

NineData

数据库 云计算

谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐_架构/框架_InfoQ精选文章