写点什么

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

  • 2019-08-17
  • 本文字数:829 字

    阅读完需:约 3 分钟

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

QCon广州2019大会上,孙晓光讲师做了《知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计》主题演讲,主要内容如下。


演讲简介


知乎从问答起步在过去的 8 年中逐步成长为一个大规模的综合性知识内容平台,今天在知乎站上有多达 38 万个话题,超过 2800 万个问题总共收获了超过 1.3 亿个回答,同时知乎还沉淀了数量众多的优质文章、电子书以及其他付费内容。知乎通过个性化首页推荐的方式在海量的信息中高效的分发用户感兴趣的优质内容。为了避免给用户推荐重复的内容,首页会记录下所有给用户推荐过的内容长期保存。直至今天知乎已读的数据规模已超过万亿并以每天接近 30 亿的速度持续增长,实时、可靠且高效的存储和查询已读数据存在着诸多挑战。在过去的一年多已读服务的架构在承载着 40000/s 新数据写入的同时还支撑着峰值每秒 30000 条独立请求和 1200 万文档已读状态的查询,并且在大流量的冲击下响应时间依旧稳定维持在 P99 24ms 以及 P999 45ms 的低水位线。在本次演讲中我们会分享目前知乎已读服务的整体架构以及我们如何在这个架构上应对各种挑战满足业务需求,希望这个分享能为大家开拓解决类似问题的思路。


内容大纲


  1. 业务场景:知乎个性化首页利用已读过滤服务高效率分发用户未阅读过的优质内容 。

  2. 服务架构:知乎目前已读数据已经达万亿条量级并且还在以更快的加速度持续增长,而缓存系统则是万亿规模数据集高吞吐低时延的关键点。已读服务通过将缓冲智能化来应对数据频繁更新和数据高度稀疏对缓存系统在一致性和命中率方面的挑战。

  3. 原生分布式数据库的迁移代价和海量数据集下的收益。


听众受益


  1. 大量更新的海量数据缓存系统设计;

  2. 缓存一致性的考量和取舍;

  3. 原生分布式数据库的迁移成本和巨大收益。


讲师介绍


孙晓光


知乎 搜索后端负责人


知乎搜索后端负责人,目前承担知乎搜索后端架构设计以及工程团队的管理工作。曾多年从事私有云相关产品开发工作关注云原生技术,TiKV 项目 Committer。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/guangzhou/schedule


2019-08-17 00:009372

评论

发布
暂无评论
发现更多内容

如何基于文心一言NLP大模型搭建生成式智能对话服务

百度开发者中心

人工智能 nlp 大模型

Navicat Premium 15 for Mac v15.0.36中文激活版下载

iMac小白

XMind for mac (XMind思维导图)v24.01中文版下载

iMac小白

赋能开发者实现LLMOps全流程

百度开发者中心

人工智能 大模型

龙蜥副理事长张东:潮蜥共引,繁荣系统软件生态 | 2023龙蜥操作系统大会

OpenAnolis小助手

操作系统 算力 系统软件 龙蜥社区 浪潮信息

软件测试开发/全日制/测试管理丨测试用例设计

测试人

软件测试 自动化测试 测试开发 测试用例 用例设计

实践案例:通过API优化加快上市时间

幂简集成

产品 MVP API OpenAPI REST API

Parallels Desktop 19 for Mac 一键激活版(PD19虚拟机)

iMac小白

“数据要素×” 行动计划要做的几件小事,可都不是小事啊!

用友BIP

数据要素

文件备份和同步软件推荐:Syncovery 最新激活版

胖墩儿不胖y

Mac软件 同步备份软件

CloudMounter for mac v4.3 激活版下载(云盘本地加载工具)

iMac小白

Mybatis 拦截器实现单数据源内多数据库切换 | 京东物流技术团队

京东科技开发者

对话式搜索:基于OpenSearch向量检索版+大模型的实践

百度开发者中心

人工智能 大模型 对话系统

QLab Pro for Mac(音频剪辑软件)v5.3.3激活版下载

iMac小白

8种超简单的Golang生成随机字符串方式

华为云开发者联盟

开发 华为云 Go 语言 华为云开发者联盟

解锁前端新潜能:如何使用 Rust 锈化前端工具链

京东科技开发者

Safari暗模式添加插件 Noir 最新激活版

mac大玩家j

Mac软件 屏幕管理软件

AVTouchBar for mac v3.0.7激活版(Touch Bar音频可视化器)

iMac小白

泰开集团总会计师杜艳春:浅谈设备制造企业数智化之路

用友BIP

企业数智化

文心一言 VS 讯飞星火 VS chatgpt (174)-- 算法导论13.3 3题

福大大架构师每日一题

福大大架构师每日一题

【领先实践之离散制造行业】MOM全场景,助力光伏单晶行业降本增效

用友BIP

领先实践 光伏单晶行业

商业智能、数据分析和需求预测在现代零售管理中的关键运用

第七在线

Studio One 6 for mac v6.5.1永久激活版下载

iMac小白

测试环境使用问题及其优化对策实践

京东科技开发者

云智一体,大模型服务的超级工厂

百度开发者中心

人工智能 云计算 nlp 大模型

企业数字化转型是什么?数字化转型的痛点又是什么?怎么转?从哪里转?转了有哪些好处?

天津汇柏科技有限公司

数字化转型峰会

AlDente Pro for Mac v1.24激活版下载

iMac小白

Magnet for mac v2.14.0中文免激活版下载

iMac小白

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计_QCon_孙晓光_InfoQ精选文章