写点什么

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

  • 2019-08-17
  • 本文字数:829 字

    阅读完需:约 3 分钟

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

QCon广州2019大会上,孙晓光讲师做了《知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计》主题演讲,主要内容如下。


演讲简介


知乎从问答起步在过去的 8 年中逐步成长为一个大规模的综合性知识内容平台,今天在知乎站上有多达 38 万个话题,超过 2800 万个问题总共收获了超过 1.3 亿个回答,同时知乎还沉淀了数量众多的优质文章、电子书以及其他付费内容。知乎通过个性化首页推荐的方式在海量的信息中高效的分发用户感兴趣的优质内容。为了避免给用户推荐重复的内容,首页会记录下所有给用户推荐过的内容长期保存。直至今天知乎已读的数据规模已超过万亿并以每天接近 30 亿的速度持续增长,实时、可靠且高效的存储和查询已读数据存在着诸多挑战。在过去的一年多已读服务的架构在承载着 40000/s 新数据写入的同时还支撑着峰值每秒 30000 条独立请求和 1200 万文档已读状态的查询,并且在大流量的冲击下响应时间依旧稳定维持在 P99 24ms 以及 P999 45ms 的低水位线。在本次演讲中我们会分享目前知乎已读服务的整体架构以及我们如何在这个架构上应对各种挑战满足业务需求,希望这个分享能为大家开拓解决类似问题的思路。


内容大纲


  1. 业务场景:知乎个性化首页利用已读过滤服务高效率分发用户未阅读过的优质内容 。

  2. 服务架构:知乎目前已读数据已经达万亿条量级并且还在以更快的加速度持续增长,而缓存系统则是万亿规模数据集高吞吐低时延的关键点。已读服务通过将缓冲智能化来应对数据频繁更新和数据高度稀疏对缓存系统在一致性和命中率方面的挑战。

  3. 原生分布式数据库的迁移代价和海量数据集下的收益。


听众受益


  1. 大量更新的海量数据缓存系统设计;

  2. 缓存一致性的考量和取舍;

  3. 原生分布式数据库的迁移成本和巨大收益。


讲师介绍


孙晓光


知乎 搜索后端负责人


知乎搜索后端负责人,目前承担知乎搜索后端架构设计以及工程团队的管理工作。曾多年从事私有云相关产品开发工作关注云原生技术,TiKV 项目 Committer。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/guangzhou/schedule


2019-08-17 00:009596

评论

发布
暂无评论
发现更多内容

全网征集!说说你跟宜搭之间的故事吧

一只大光圈

阿里 低代码 数字化 钉钉宜搭 宜搭

如何通过云效Codeup完成代码合并 | 云效

阿里云云效

云计算 阿里云 代码管理 Codeup 代码合并

2022年,网传苹果即将发布的新机型iPhone 14 Pro和iPhone 14 Pro Max将会是全新屏幕造型,不再是刘海屏,你对新屏幕造型的iPhone 14期待吗?

InfoQ IT百科

秒云助力中电科32所发布“基于拟态应用集成框架的SaaS云管理平台解决方案”

MIAOYUN

内生安全 拟态应用集成框架 网络空间内生安全大会

rm格式的文件怎么打开?

InfoQ IT百科

电脑上怎么快速切换显示不同的软件界面

InfoQ IT百科

敏捷实践 | 提高小组可预测性的敏捷指标

LigaAI

敏捷开发 敏捷度量

面向全球市场,PlatoFarm今日登录HUOBI等全球四大平台

西柚子

Rust异步框架的性能评估

非凸科技

tokio Zenoh 异步框架 async_std smol

2022年,5G芯片会有哪些值得期待的发展趋势?

InfoQ IT百科

手机运行内存应该怎么选?

InfoQ IT百科

众妙之门玄之又玄,游戏系统中的伪随机(Pseudo-Randomization)和真随机(True-Randomization)算法实现Python3

刘悦的技术博客

算法 游戏 Python3 算法实践 随机数

坚持做正确的事情

FunTester

为什么智能手机传感器市场一直是索尼占主导

InfoQ IT百科

如何彻底删除电脑上的文件?

InfoQ IT百科

开源大数据OLAP引擎最佳实践

五分钟学大数据

数仓 4月月更

对线郭老师职业发展,记下自己的心得体会

北洋

面试 职业规划 程序猿 4月月更

悟空的私藏「架构』书籍推荐

悟空聊架构

4月日更 悟空聊架构

Go 学习笔记——Switch(我不是游戏机)

为自己带盐

Go 学习笔记 4月月更

企业级知识管理(KM)建设方法及过程

小炮

知识管理

社区运营书籍推荐

坚果

4月月更

设计千万级学生管理系统的考试试卷存储方案

哈喽

「架构实战营」

你知道你的手机上有多少传感器吗?

InfoQ IT百科

APP应该关注哪些数据指标?

InfoQ IT百科

企业级知识管理(KM)建设方法及过程

小炮

知识管理

CrashSight 常规功能&特色功能介绍

WeTest

科创人·派拉软件CEO谭翔:零信任本质是数字安全,To B也要深研用户心智

科创人

这个API Hub厉害了,收录了钉钉企业微信等开放Api,还能直接调试 !

Liam

前端 Postman API OpenAPI 开放api

面向全球市场,PlatoFarm今日登录HUOBI等全球四大平台

小哈区块

优麒麟 22.04 LTS 版本正式发布 | UKUI 3.1开启全新体验!

优麒麟

Linux 开源 操作系统 优麒麟 22.04

报名开启|QKE 容器引擎托管版暨容器生态发布会!

青云技术社区

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计_QCon_孙晓光_InfoQ精选文章