QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

架构 Twitter

  • 2008-06-22
  • 本文字数:1120 字

    阅读完需:约 4 分钟

风行的社交应用Twitter ,其底层架构最近已成为多次讨论的焦点。由于团队试图解决一些问题,Twitter已经有几次停止运行的情况,并关闭了几个常用的功能。从Twitter 的前进脚步之中,我们能学到些什么呢?包括 Om Malik Dare Obasanjo 在内的几个人猜测是 Twitter 的底层架构导致了这些问题的出现。最近,Robert Scoble 就应用情况和公司前景采访了Twitter 的Evan Williams 和Biz Stone 。采访的视频可在 qik 上找到。

在采访中,Williams 和 Stone 回答了关于 Twitter 数据架构的大问题:Twitter 是否使用单实例存储(SIS)类型的方法来处理用户消息?在大约 13 分钟的采访记录中,Williams 谈到了消息存储和用户时间线检索:

它不是这么处理的(为用户的每个跟随者都产生一个消息副本),但实际上这可能更有效率。现在消息存储到数据库中,当人们想获取他们的时间线时,我们从数据 库中构造时间线,然后缓存到内存中,当然不是每次都缓存。但由于内容写入太频繁,我们往往也要频繁地访问数据库,而这只是为了更新缓存。所以缓存中有很多 消息副本,而在磁盘上却只有一条消息。我们以后的架构可能更多的是以多次写入的方式,因为读取在这种方式下将快更多。

从 SIS 消息架构迁移的可能性为利用像数据Sharding 这样的数据技术开启了一扇大门,数据Sharding 技术已经在许多高容量网站和应用中广受欢迎。Randy Shoup谈到了eBay 通过部分利用Sharding 来架构系统的方式,以此获得高可伸缩性:> 数据库层次的问题比较有挑战性,原因是数据天生就是有状态的。我们会按照主要的访问路径对数据做水平分割(或称为“Sharding”)。例如用户数据目 前被分割到20 台主机上,每台主机存放1/20 的用户。随着用户数量的增长,以及每个用户的数据量增长,我们会增加更多的主机,将用户分散到更多的机器上 去。商品数据、购买数据、帐户数据等等也都用同样的方式处理。用例不同,我们分割数据的方案也不同。

Bogdan Nicolau 写过一篇为数据库Sharding 基础的概述。在该系列中,Bogdan 讨论了如何决定在何处、以及如何为应用分割数据。决定时的主要一点是:> 我试图表达的是,无论你选择什么逻辑来切分表,总是要记住你不想有任何join、order by、或limit 语句,这些语句会需要不止一个的表Shards。

Bogdan 继续谈论了应用端对Shards 的利用。Bogdan 提供了几个代码例子来解释一个典型问题,同时还解释了背后的原理:> 正如你所看到的,因为要生成映射表,负担主要落在了写入一方。读取时就不需要关心涉及的数据切分算法了。

随着众人参与关于如何扩展Web 2.0 的讨论,Twitter 也许将继续向一个更稳定、可伸缩的架构迈进。InfoQ 有许多性能和可伸缩性相关的资源,在这里查看这些资源

查看英文原文: Architecting Twitter

2008-06-22 21:402604
用户头像

发布了 151 篇内容, 共 63.0 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

IO:阻塞和非阻塞、同步和异步

小小怪下士

Java 程序员 io 异步 阻塞

新时代的技术领导力

agnostic

领导力

如何优雅的用Redis作为Mybatis的二级缓存?

做梦都在改BUG

Java redis 缓存 mybatis

电影排行榜(requests + bs4 & scrapy)

漫步桔田

今天终于知道 Redis 为什么要用跳跃表了

做梦都在改BUG

Java 数据库 redis 缓存 跳跃表

软件测试 | Jenkins的节点管理

测吧(北京)科技有限公司

测试

Python 基础练习题(六)

漫步桔田

极客时间架构训练营模块八作业-消息队列存储消息数据的 MySQL 表格

张Dave

阿里巴巴内网Java面试2000题解析(2023最新版)

架构师之道

编程 java面试

Python 数学练习题(二)

漫步桔田

软件测试 | Jenkins报警机制

测吧(北京)科技有限公司

测试

软件测试 | 矩阵job与父子job

测吧(北京)科技有限公司

测试

GitHub标星百万的Java进阶架构师手册,用20%技术解决80%问题?

做梦都在改BUG

Java 架构师

软件测试 | 接口加密与解密

测吧(北京)科技有限公司

测试

软件测试 |Jenkins的常用插件

测吧(北京)科技有限公司

测试

仅一小时点赞破万!GitHub爆赞的Spring Boot最佳实践

做梦都在改BUG

Java spring 微服务 Spring Boot 框架

软件测试 | Jenkins持续集成

测吧(北京)科技有限公司

测试

Python 基础练习题(五)

漫步桔田

刚插上网线,电脑怎么知道自己的IP是什么?

做梦都在改BUG

Python 基础练习题(四)

漫步桔田

软件测试 | HTTP网络认证体系

测吧(北京)科技有限公司

测试

RocketMQ 消息重试机制、死信队列

做梦都在改BUG

Java RocketMQ 消息队列 消息中间件

软件测试 | Jenkins job机制

测吧(北京)科技有限公司

测试

软件测试 | 参数化job

测吧(北京)科技有限公司

测试

Python:Excel自动化实践入门篇 甲【送图书门票】

eng八戒

python excel

速来~与 Werner Vogels 博士一起探索敏捷性与创新速度一起提升的秘方

亚马逊云科技 (Amazon Web Services)

Python 数学练习题(一)

漫步桔田

软件测试 |多套测试环境下的接口测试

测吧(北京)科技有限公司

测试

软件测试 | Jenkins权限控制

测吧(北京)科技有限公司

测试

软件测试 |静态扫描体系集成

测吧(北京)科技有限公司

测试

架构Twitter_Ruby_Steven Robbins_InfoQ精选文章