写点什么

百度技术沙龙第 31 期回顾:推荐引擎算法与技术(含资料下载)

  • 2012-10-22
  • 本文字数:2099 字

    阅读完需:约 7 分钟

在 10 月 20 日由 @百度主办、 @InfoQ 负责策划组织和实施的第 31 期百度技术沙龙活动上,来自百度推荐与个性化部研发工程师赵岷、百分点 COO 兼技术副总裁张韶峰分别分享了各自在前端开发中的经验与实践,话题涉及“推荐引擎实践–策略篇”,以及“百分点推荐引擎实践”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。

主题一:推荐引擎实践–策略篇(网盘文件下载

来自百度推荐与个性化部研发工程师赵岷第一个为大家分享,内容主要涉及为何推荐、百度推荐与个性化实践、推荐系统设计要素和推荐系统设计之策略篇等,当提到为何推荐时,赵岷指出目前搜索与推荐实为互补的关系。面对信息爆炸的情况,用户会通过搜索引擎进行主动的搜索,然而当知识匮乏时间有限时,就需要系统根据用户的需求进行主动的推荐。百度推荐引擎目前正在做的就是将两者结合在一起。

赵岷认为目前推荐个性化推荐升温的原因基于以下几点:

  1. 提升用户体验和满意度
  2. 用户数据的积累已经可以支撑个性化应用
  3. 个性化的商业前景广阔

在个性化首页、知道问题推荐、贴吧帖子推荐、音乐推荐等都可以看到个性化的影子,可以发现,百度的个性化是全类型、全方位的。

赵岷随后为大家展示了百度推荐引擎的 7 层模型,分别为基础数据、推荐资源、内容模型、推荐算法、推荐子系统、产品策略、评估等。百度推荐的核心任务有两点:

  1. 通过人的行为 / 偏好 / 兴趣与事物的特性等建立事物间、人之间的关联
  2. 把关联的人或事物推荐给人

那么为了完成如上的任务,在设计推荐系统的时候就需要从如下的 6 个角度去考虑:

  1. 需求分析和用户调研
  2. 功能设计
  3. 界面设计
  4. 架构设计
  5. 算法设计
  6. 系统评测

对于推荐系统设计策略,赵岷从功能分析、数据分析和算法设计等方面进行了讲解。在设计推荐系统的时候,需要根据用户数量、用户群体以及推荐的功能几个方面进行设计。同时,推荐系统以数据为基础,那么在设计的时候就需要考虑各类数据是否充足、数据的可用性等问题,推荐系统不光要吸引用户提供反馈,更重要的是吸引用户提供准确反馈。赵岷认为,当用户数据充足的时候,及时是简单的算法也会有很好的性能。

在算法设计方面,赵岷提到推荐系统算法的选择是基于数据和用户,同一个算法可以实现不同功能,同一个功能可以使用不同的算法。在进行用户和内容建模时,需要将两者的特征向量描述清楚。目前的离线关联算反主要有两种:关联\相似度计算和机器学习。

最后赵岷分享了做搜索算法时的一些感受,她提到了如下三点;

  1. 注重木桶效应,将算法、用户行为、产品设计都有机结合起来。
  2. 数据为王,通过数据评判推荐效果。
  3. 推荐引擎必须要和领域知识紧密结合。

主题二:

来自百分点的 COO 兼技术副总裁张韶峰为大家第二个做分享,为了让大家能够更直观的感受到推荐系统的作用,张韶峰抛开 PPT 直接进行现场演示。

会后,参加活动的文峰聂详细总结了所展示的内容:

  1. 百分点的业务中如何将推荐算法做成引擎
  2. 展示引擎,根据用户的诉求实现不同的展示方式
  3. 客户可以添加和调节规则来影响搜索引擎
  4. 通过流处理的场景引擎帮助或者引诱用户形成购买

Open Space(开放式讨论环节)

为了促进参会者与我们每期的嘉宾以及讲师近距离交流,深入探讨在演讲过程中的疑问,本次活动依然设置了 Open Space(开放式讨论)环节。

在 Open Space 的总结环节,几位话题小组长分别对讨论的内容进行了总结。

赵岷:大家讨论了推荐引擎中算法的选择、策略设计,包括模型的构建等。以及各种模型在工业界的使用,在使用时需要注意的问题。

张韶峰:讨论了实时计算、模型的实时更新,不同行业中模型如何运用。

廖若雪:大家对百度还是很感兴趣,希望对百度感兴趣的朋友能够真正的参与进来。

王益:主要分析了当前的广告的形式,包括无线广告与有线广告的、传统广告与新媒体广告。一致认为未来只有使数据流打通、理解用户的兴趣,才能更好的触发广告。

会后,一些参会者也通过新浪微博分享了他们的参会感受:

钢铁侠 - 大 V :总结一下昨天的收获。 推荐算法有三个主要部分,打标签 做权重 排序。打标签细化一个样本的标签,细分不同的维度,使标签尽可能包含样本的各个方面。做权重,根据不同的维度对样本的标签给予不同的维度,根据用户的关联操调整标签的权重。排序,依据标签的最终权重排序相关样本。

张玉东 _ 凡客:百分点做到了推荐的实时计算,并实时计算用户的特征,这些特征可以用在 EDM,搜索,广告着陆等。而这些场景恰恰是协同过滤难以发挥作用的地方,因为其缺少了重要的解释环节。

懒猫评说:一群男人在研究女人的想法,但在坐女士难觅,高深的算法要是能加上女士的点评就更精彩了!

Bond-I :赵岷娓娓道来,条理清晰。希望未来在百度技术 salon 看到听到更深入的东西

孙伟 Clark :百度赵岷老师系统讲解了推荐系统原理,应用以及算法,PPT 已拍照,晚上回忆一下。课件休息与赵老师交流者甚多。期待下一位百分点老师的精彩分享。

有关百度技术沙龙的更多信息,可以通过新浪微博关注 @百度技术沙龙,或者参加百度技术沙龙微群,InfoQ 上也总结了过往30 期所有百度技术沙龙的演讲视频和资料等,感兴趣的读者可以直接浏览内容

特别提示:第32 期百度技术沙龙将在11 月17 日,在北京举行,欢迎关注 @InfoQ @百度技术沙龙获取后续的活动信息。

2012-10-22 04:124463
用户头像

发布了 89 篇内容, 共 31.9 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

乐视每周工作四天半?我们也可以

不想敲代码

程序员 效率工具 协同办公

SREWorks v1.4 版本发布 | 离线安装 & 前端重构

阿里云大数据AI技术

大数据 开源 运维 企业号 1 月 PK 榜

我在京东做研发 | 京东云算法科学家解析爆火的ChatGPT

京东科技开发者

AI 技术 算法 经验分享 ChatGPT

前端一面必会手写面试题(边面边更)

helloworld1024fd

JavaScript

构建自组织团队,让敏捷管理更好地落地

敏捷开发

项目管理 敏捷开发 项目管理软件 自组织

一步步实现React-Hooks核心原理

helloworld1024fd

JavaScript

水印LOGO有哪些类型?如何在线给图片添加水印LOGO?

互联网民工阿强

图片处理 添加水印 水印 水印LOGO

深航携手华为云,共建数字化智慧民航标杆

Geek_2d6073

FinClip 12 月大事件 | IDE支持小游戏开发调试和预览

FinClip

架构实战 - 模块 6 作业

mm

#架构实战营 电商微服务分析

从零到一手写迷你版Vue

helloworld1024fd

JavaScript

社招前端二面必会手写面试题总结

helloworld1024fd

JavaScript

学习前端技术选择培训还是自学比较好?

小谷哥

FLStudio水果萝卜最新汉化21版本下载

茶色酒

flstudio FLStudio21 FLStudio21.0.0

小游戏引擎如何选?看完这篇就够了

FinClip

在vue的v-for中,key为什么不能用index?

bb_xiaxia1998

Vue

字节前端必会vue面试题集锦

bb_xiaxia1998

Vue

软件测试/测试开发 | 相比 Selenium,Web 自动化测试框架 Playwright 有哪些强大的优势?

测试人

软件测试 测试框架 测试开发 playwright Web自动化测试

支付系统就该这么设计(万能通用),稳的一批!

Java全栈架构师

程序员 面试 支付系统 架构设计 架构师

学习java技术哪些方法比较靠谱

小谷哥

阿里云办公安全产品专家高传贵:零信任,让全球办公安全更简单

云布道师

阿里云

火山引擎DataLeap数据调度实例的 DAG 优化方案

字节跳动数据平台

大数据 数据治理 数据研发

Hyperledger AnonCreds:开源、开放规范下,保护隐私的可验证凭证

BSN研习社

写过vue自定义指令吗,原理是什么?.m

bb_xiaxia1998

Vue

【从零开始学爬虫】采集食品行业最新报价数据

前嗅大数据

数据采集 爬虫软件 爬虫案例 爬虫入门教程 爬虫分享

聚焦技术创新实力,时序数据库 TDengine 荣登中国技术先锋年度评选两大榜单

TDengine

数据库 tdengine 时序数据库

培训大数据技术怎么学

小谷哥

简单几种云成本优化方法讲解-行云管家

行云管家

云计算 云成本 云支出

Java中不可或缺的关键字「volatile」

小小怪下士

Java 程序员 volatile

2023前端二面必会vue面试题指南

bb_xiaxia1998

Vue

2023年新云南等级保护测评机构名录!

行云管家

等保 等级保护 等保测评机构

百度技术沙龙第31期回顾:推荐引擎算法与技术(含资料下载)_百度_水羽哲_InfoQ精选文章