写点什么

百度技术沙龙第 31 期回顾:推荐引擎算法与技术(含资料下载)

  • 2012-10-22
  • 本文字数:2099 字

    阅读完需:约 7 分钟

在 10 月 20 日由 @百度主办、 @InfoQ 负责策划组织和实施的第 31 期百度技术沙龙活动上,来自百度推荐与个性化部研发工程师赵岷、百分点 COO 兼技术副总裁张韶峰分别分享了各自在前端开发中的经验与实践,话题涉及“推荐引擎实践–策略篇”,以及“百分点推荐引擎实践”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。

主题一:推荐引擎实践–策略篇(网盘文件下载

来自百度推荐与个性化部研发工程师赵岷第一个为大家分享,内容主要涉及为何推荐、百度推荐与个性化实践、推荐系统设计要素和推荐系统设计之策略篇等,当提到为何推荐时,赵岷指出目前搜索与推荐实为互补的关系。面对信息爆炸的情况,用户会通过搜索引擎进行主动的搜索,然而当知识匮乏时间有限时,就需要系统根据用户的需求进行主动的推荐。百度推荐引擎目前正在做的就是将两者结合在一起。

赵岷认为目前推荐个性化推荐升温的原因基于以下几点:

  1. 提升用户体验和满意度
  2. 用户数据的积累已经可以支撑个性化应用
  3. 个性化的商业前景广阔

在个性化首页、知道问题推荐、贴吧帖子推荐、音乐推荐等都可以看到个性化的影子,可以发现,百度的个性化是全类型、全方位的。

赵岷随后为大家展示了百度推荐引擎的 7 层模型,分别为基础数据、推荐资源、内容模型、推荐算法、推荐子系统、产品策略、评估等。百度推荐的核心任务有两点:

  1. 通过人的行为 / 偏好 / 兴趣与事物的特性等建立事物间、人之间的关联
  2. 把关联的人或事物推荐给人

那么为了完成如上的任务,在设计推荐系统的时候就需要从如下的 6 个角度去考虑:

  1. 需求分析和用户调研
  2. 功能设计
  3. 界面设计
  4. 架构设计
  5. 算法设计
  6. 系统评测

对于推荐系统设计策略,赵岷从功能分析、数据分析和算法设计等方面进行了讲解。在设计推荐系统的时候,需要根据用户数量、用户群体以及推荐的功能几个方面进行设计。同时,推荐系统以数据为基础,那么在设计的时候就需要考虑各类数据是否充足、数据的可用性等问题,推荐系统不光要吸引用户提供反馈,更重要的是吸引用户提供准确反馈。赵岷认为,当用户数据充足的时候,及时是简单的算法也会有很好的性能。

在算法设计方面,赵岷提到推荐系统算法的选择是基于数据和用户,同一个算法可以实现不同功能,同一个功能可以使用不同的算法。在进行用户和内容建模时,需要将两者的特征向量描述清楚。目前的离线关联算反主要有两种:关联\相似度计算和机器学习。

最后赵岷分享了做搜索算法时的一些感受,她提到了如下三点;

  1. 注重木桶效应,将算法、用户行为、产品设计都有机结合起来。
  2. 数据为王,通过数据评判推荐效果。
  3. 推荐引擎必须要和领域知识紧密结合。

主题二:

来自百分点的 COO 兼技术副总裁张韶峰为大家第二个做分享,为了让大家能够更直观的感受到推荐系统的作用,张韶峰抛开 PPT 直接进行现场演示。

会后,参加活动的文峰聂详细总结了所展示的内容:

  1. 百分点的业务中如何将推荐算法做成引擎
  2. 展示引擎,根据用户的诉求实现不同的展示方式
  3. 客户可以添加和调节规则来影响搜索引擎
  4. 通过流处理的场景引擎帮助或者引诱用户形成购买

Open Space(开放式讨论环节)

为了促进参会者与我们每期的嘉宾以及讲师近距离交流,深入探讨在演讲过程中的疑问,本次活动依然设置了 Open Space(开放式讨论)环节。

在 Open Space 的总结环节,几位话题小组长分别对讨论的内容进行了总结。

赵岷:大家讨论了推荐引擎中算法的选择、策略设计,包括模型的构建等。以及各种模型在工业界的使用,在使用时需要注意的问题。

张韶峰:讨论了实时计算、模型的实时更新,不同行业中模型如何运用。

廖若雪:大家对百度还是很感兴趣,希望对百度感兴趣的朋友能够真正的参与进来。

王益:主要分析了当前的广告的形式,包括无线广告与有线广告的、传统广告与新媒体广告。一致认为未来只有使数据流打通、理解用户的兴趣,才能更好的触发广告。

会后,一些参会者也通过新浪微博分享了他们的参会感受:

钢铁侠 - 大 V :总结一下昨天的收获。 推荐算法有三个主要部分,打标签 做权重 排序。打标签细化一个样本的标签,细分不同的维度,使标签尽可能包含样本的各个方面。做权重,根据不同的维度对样本的标签给予不同的维度,根据用户的关联操调整标签的权重。排序,依据标签的最终权重排序相关样本。

张玉东 _ 凡客:百分点做到了推荐的实时计算,并实时计算用户的特征,这些特征可以用在 EDM,搜索,广告着陆等。而这些场景恰恰是协同过滤难以发挥作用的地方,因为其缺少了重要的解释环节。

懒猫评说:一群男人在研究女人的想法,但在坐女士难觅,高深的算法要是能加上女士的点评就更精彩了!

Bond-I :赵岷娓娓道来,条理清晰。希望未来在百度技术 salon 看到听到更深入的东西

孙伟 Clark :百度赵岷老师系统讲解了推荐系统原理,应用以及算法,PPT 已拍照,晚上回忆一下。课件休息与赵老师交流者甚多。期待下一位百分点老师的精彩分享。

有关百度技术沙龙的更多信息,可以通过新浪微博关注 @百度技术沙龙,或者参加百度技术沙龙微群,InfoQ 上也总结了过往30 期所有百度技术沙龙的演讲视频和资料等,感兴趣的读者可以直接浏览内容

特别提示:第32 期百度技术沙龙将在11 月17 日,在北京举行,欢迎关注 @InfoQ @百度技术沙龙获取后续的活动信息。

2012-10-22 04:124531
用户头像

发布了 89 篇内容, 共 32.6 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

自动化API测试工具ReadyAPI新增业务历史记录功能

龙智—DevSecOps解决方案

ReadyAPI

混音师必备软件:iZotope Ozone 11激活最新

胖墩儿不胖y

Mac软件 音频处理工具 母带处理软件

QCN9074 QCN9024|DR9074E Compatible with DR4019 Platform OpenWrt

wallyslilly

QCN9074 QCN9024

剑指pulsar之数据写入流程

少年游侠客

消息队列 pulsar 写数据

新形势下芯片研发如何实现数智化转型,革“芯”未来?龙智即将携手Perforce及Atlassian亮相ICCAD 2023

龙智—DevSecOps解决方案

ICCAD

焱融全闪 | 高算力时代下的国产存储之光

焱融科技

ATC汽车电子与软件技术周:汽车行业客户使用静态代码扫描工具的案例与建议

龙智—DevSecOps解决方案

ACT

实用PCB拼版攻略,您的拼版合理吗?

华秋电子

拼板

JAVA 调用Open AI 接口生成图片url并直接在浏览器上响应显示

风清扬

openai 图片生成 AI绘画 ChatGPT chatgpt api

利用稳定扩散快速修复图像

3D建模设计

人工智能「 Stable Diffustion 图像修复

TiDB故障处理之让人迷惑的Region is Unavailable

TiDB 社区干货传送门

集群管理 故障排查/诊断 扩/缩容

支付宝代扣接口签约的各种问题排查(建议收藏)

盐焗代码虾

支付宝 代扣

Node.js 中 HTML 解析的终极指南:探索各种方法

Liam

JavaScript node.js html 前端 Web

Stable Diffusion 的提示词使用技巧

3D建模设计

Stable Diffusion 自动纹理

如何使用 NFTScan NFT API 在 Polygon 网络上开发 Web3 应用

NFT Research

NFT NFT\ NFTScan nft工具 API 接口

推送没人看?MobPush助力APP运营提质增效

MobTech袤博科技

浙大材料学院高性能存储实践,加速 AI 新材料科研创新

焱融科技

【TiDB 社区智慧合集】史上最全的 158篇 TiDB 用户实践合集来啦!千万不要错过!

TiDB 社区干货传送门

我们该如何规划自己的职业生涯?

老张

职业规划 职场成长

生信领域|焱融存储为极智基因打造高性能生物医学平台

焱融科技

After Effects 2024 for Mac(ae视频特效制作工具) v24.0.2永久激活版

mac

windows 苹果mac After Effects 2024 AE2024 视频特效制作软件

云原生微服务的下一站:Proxyless Service Mesh

华为云开发者联盟

微服务 云原生 华为云 华为云开发者联盟

TiDB x 北京银行丨新一代分布式数据库的探索与实践

TiDB 社区干货传送门

实践案例

Mac电脑版红巨星粒子插件 Red Giant Trapcode Suite激活中文版

mac大玩家j

Mac软件 红巨星粒子插件 视觉效果插件

KaiwuDB 内核解析 - SQL 查询的生命周期

KaiwuDB

数据库 sql查询 生命周期 KaiwuDB

YRCloudFile V7.0.0发布| 新增 EC 数据冗余保护功能

焱融科技

软件项目验收计划书

金陵老街

混合云场景下基于 Fluid 的焱融高效存储方案

焱融科技

Lightsail CDN 现已对 Lightsail Container Services 作为来源进行支持

亚马逊云科技 (Amazon Web Services)

CDN Amazon Lightsail Amazon CloudFront

MobPush智能推送工具,助力实现用户全生命周期管理

MobTech袤博科技

智能推送

大模型在代码缺陷检测领域的应用实践

百度Geek说

知识图谱 大模型 企业号11月PK榜

百度技术沙龙第31期回顾:推荐引擎算法与技术(含资料下载)_百度_水羽哲_InfoQ精选文章