写点什么

构建动态并响应实时用户行为的 Pinterest

  • 2019-09-07
  • 本文字数:1000 字

    阅读完需:约 3 分钟

构建动态并响应实时用户行为的Pinterest

ArchSummit北京2018大会上,刘波讲师做了《构建动态并响应实时用户行为的 Pinterest》主题演讲,主要内容如下。


演讲简介


Pinterest 的使命是帮助用户发现并尝试他们喜爱的事物。在过去的三年里,Pinterest 的系统架构发生了巨大的改变。三年前,绝大部分 Pinterest 产品的内容都是由离线 Job 预先生成。目前,Pinterest 通过各类产品所展现给用户的内容全部经由后台系统在线生成,并且能够自动的根据用户实时行为进行动态调整。另外,过去三年高速增长的用户数量和产品复杂度也对系统提出了更苛刻的需求。


本次演讲将介绍 Pinterest 系统在过去三年里的演进过程,展示当前整体系统的架构。该架构对内容分发型互联网产品将具有借鉴意义。另外,本演讲将着重介绍其中几个主要系统的架构设计与技术难点,例如机器学习模型在线 Serving Platform 的架构设计,RocksDB 的实时数据复制,机器学习模型的 CPU 性能优化等。


演讲提纲


  1. Pinterest 的几类主要产品(Following Feed、推荐和 Topic Feed 等)

  2. 支撑这些产品的一系列系统在过去三年里的演进过程

  3. 机器学习模型在线 Serving Platform 的架构

  4. RocksDB 的实时数据复制策略

  5. 有状态服务的应用层集群管理

  6. 一些解决过的技术难点和踩过的坑


听众受益点


  1. 大规模内容分发型互联网产品整体架构设计经验

  2. 机器学习模型在线 Serving Platform 的架构设计经验

  3. 基于单机存储引擎(如 RocksDB)搭建各类大规模在线分布式有状态服务系统的经验


讲师介绍


刘波


Pinterest 基础架构部软件工程经理


现就职于基础架构部门,具有丰富的大规模在线分布式数据系统的设计与开发经验。从零开始设计并开源了 Pinterest 的 C++ 核心库 Rocksplicator(包含实时数据复制,应用层集群自动管理,底层客户端库,弹性路由,统计报告等)。在 Rocksplicator 的基础上,他带领团队设计并开发了十余个应用于不同场景的分布式系统,包括机器学习模型在线 Serving Platform,基于 RocksDB 的 Feed 系统、Counter 系统、实时用户事件 tracking 系统, KV 系统等。这些系统为绝大部分 Pinterest 产品提供服务,包括 Homefeed、广告、搜索、推荐、增长、Spam 检测等。


加入 Pinterest 之前,刘波曾在 Facebook 开发分布式图数据库系统 TAO。TAO 负责整个 Facebook 社交图的存储与在线访问,支持超过 100 亿每秒的请求。刘波在获得博士学位后做过一段时间的教学和学术研究工作。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2018/beijing/schedule


2019-09-07 08:041589

评论

发布
暂无评论
发现更多内容

快速入门一篇搞定RocketMq-实现微服务实战落地

不在线第一只蜗牛

Syncovery for Mac:高效灵活的文件备份与同步软件

iMac小白

Syncovery下载 Syncovery破解版 Syncovery mac

今天分享一个有趣的 Python 库 - howdoi

高端章鱼哥

Redis开源社区持续壮大,华为云为Valkey项目注入新的活力

华为云开发者联盟

数据库 redis 开源 华为云 华为云开发者联盟

探秘Appium:Capability 进阶技巧揭秘!

测试人

软件测试

探秘Appium:Capability 进阶技巧揭秘!

测吧(北京)科技有限公司

测试

架构师六个生存法则之一:如何找到唯一且正确的架构目标?

不在线第一只蜗牛

架构

高防BGP云服务器助你抵御各种网络威胁,业务畅通无忧

一只扑棱蛾子

高防服务器

Redis开源社区持续壮大,华为云为Valkey项目注入新的活力

华为云PaaS服务小智

华为云

NineData亮相2024中国移动算力网络大会

NineData

数据库 中国移动 移动云 算力网络 NineData

自关联外键插入数据时报错:YAS-02033 foreign key constraint violated parent key not found

YashanDB

Proxyman Premium for Mac:强大的网络调试与分析工具

iMac小白

Proxyman Premium下载

软件测试学习笔记丨后端架构优化设计 - spring boot 增删改查操作

测试人

软件测试

Python文本统计与分析从基础到进阶

华为云开发者联盟

Python 开发 华为云 华为云开发者联盟

如何全面规避医疗数据安全风险?“一中心三大管控域”打开新思路!

BinTools图尔兹

数据库 数据安全 脱敏 电子病历 医疗信息化

分享几个.NET开源的AI和LLM相关项目框架

EquatorCoco

人工智能 .net 开源 AI

vue3早已具备抛弃虚拟DOM的能力了

EquatorCoco

DOM 虚拟机 Vue3

KaiwuDB 解析器之语义解析

KaiwuDB

数据库 解析

JetBrains DataSpell for Mac:数据科学家的高效助手

iMac小白

DataSpell注册码 DataSpell下载 DataSpell破解版 DataSpell2024

Mac FoneLab Android Data Recovery for Mac:高效恢复Android数据的专业软件

iMac小白

Footprint Analytics 与 Core Chain 达成战略合作

Footprint Analytics

blockchain NEW chain

Redis官方开源的可视化管理工具 - RedisInsight

快乐非自愿限量之名

redis 开源

OSXBytes Lock-It for Mac(应用程序加密工具)v1.3.0激活版

iMac小白

交易履约之产品中心实践| 京东云技术团队

京东科技开发者

Aiseesoft Data Recovery for Mac:Mac用户的数据恢复利器

iMac小白

Allavsoft for Mac:强大易用的多媒体下载与转换工具

iMac小白

Allavsoft下载 Allavsoft mac Allavsoft注册版

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)

汀丶人工智能

langchain 智能问答 rag 检索式增强

百舸实践之「埋点数据深度治理与应用」 | 京东云技术团队

京东科技开发者

构建动态并响应实时用户行为的Pinterest_最佳实践_刘波_InfoQ精选文章