介绍
Redis(REmote DIctionary Server 的意思)是一个开源的内存数据存储,通常用作数据库、缓存以及消息代理。它可以存储和操作高级的数据结构类型,比如 lists、maps、sets 以及排序 sets。Redis 接受多种格式的键,因此可以在服务器上执行操作,减少客户端的工作负载。它将数据库完全地保存在内存中,只使用磁盘进行持久化存储。Redis 是一种流行的数据存储解决方案,受到了 Github、Pinterest、Snapchat、Twitter、StackOverflow、Flickr 等科技巨头的青睐。
为什么要用 Redis?
它非常快,它由 ANSI C 编写,可以在 Linux、Mac OS X 和 Solaris 等 POSIX 系统上运行。
Reis 经常被评为最流行的键值数据库以及在容器上使用最流行的 NoSQL 数据库。
它的缓存解决方案减少了对云数据库后端的调用。
应用程序可以通过客户端 API 库访问它。
所有流行的编程语言都支持 Redis。
它开源且非常稳定的。
Redis 的应用案例
Facebook 的一些在线游戏中,游戏分数更新频率非常高。当使用 Redis 排序 set 时,即使每分钟有数百万用户和数百万个新分数,执行这些操作都非常简单。
Twitter 在 Redis 集群中存储了所有用户的时间线。
Pinterest 将用户关注者图存储在 Redis 集群中,其中的数据分布在数百个实例中。
Github 使用 Redis 作为队列
什么是 Redis 集群?
Redis 集群是一个多 Redis 实例的集合,用于通过对数据库分区来扩展数据库,使其更具有弹性。集群中的每个成员,无论是主副本还是次级副本,都管理哈希槽的一个子集。如果一个主服务器出现不能访问的故障,那么它的从属服务器会提升为主服务器。在由三个主节点组成的最小的 Redis 集群中,每个主节点都有一个从属节点(为了至少能保证最低程度的故障转移),每个主节点分配一个范围在 0 至 16383 之间的哈希槽。节点 A 包含哈希槽范围为从 0 到 5000,节点 B 为 5001 到 10000,节点 C 从 10001 到 18383。集群内部的通信则通过内部总线进行,使用 gossip 协议来传播关于集群的信息或者发现新节点。
在 Kubernetes 上部署 Redis 集群
在 Kubernetes 中部署 Redis 集群很有挑战,因为每个 Redis 实例都依赖于一个配置文件,该文件跟踪其他集群实例及其角色。为此,我们需要结合使用 Kubernetes 状态集(StatefulSets)和持久卷(PersistentVolumes)。
前期准备
要完成此次的 demo,我们需要有下列准备:
Rancher
Google 云平台或者其他云提供商账号。下面的展示中使用了 GKE,不过使用任何云提供商都是可以的,且操作方法大致相同。
启动 Rancher 实例
如果你没有 Rancher 的实例,可以参考这里的 Quick Start 文档简单快速地启动一个:
https://rancher.com/quick-start/
用 Rancher 部署 GKE 集群
用 Rancher 启动并配置你的 Kubernetes 集群,具体步骤可以参考文档:
https://rancher.com/docs/rancher/v2.x/en/cluster-provisioning/hosted-kubernetes-clusters/gke/
当集群准备就绪,我们可以通过 kubectl 指令检查当前状态
部署 Redis
接着部署 Redis 集群,我们既可以通过 kubectl 来应用 YAML 文件,也可以将它们导入到 Rancher UI 中。下面列出了我们所有需要的 YAML 文件。
YAML 内容如下:
redis-sts.yaml
redis-svc.yaml
验证部署
检查 Redis 节点是否启动并运行:
下面的 6 个卷是我们创建的
我们可以检查任何一个 pod,看看它添加的卷:
同样的数据还可以在 Rancher UI 上看到
部署 Redis 集群
下一步就是创建 Redis 集群了。为此,我们需要运行以下命令,输入 yes 接受配置。前三个节点成为主节点,最后三个节点设置为从属节点。
以下是完整的输出命令:
验证集群部署
检查集群细节以及每个成员的角色
测试 Redis 集群
我们希望使用集群并且模拟节点故障。对于前一个任务,我们将部署一个简单的 python 应用程序,而后一个任务,我们将删除一个节点来观察集群行为。
部署 Hit Counter 应用
我们将在集群中部署一个简单的应用程序,并在其之前放置一个负载均衡器。该应用程序的目的是在将计数器的值作为 HTTP 响应返回值返回之前,增加计数器的值,并将值存到 Redis 集群上。
使用 kubectl 或者 Rancher UI 部署:
YAML 内容如下:
app-deployment-service.yaml
Rancher 展示了我们创建的资源:一个包含 python 应用的 pod,以及 LoadBalancer 类型的服务。该服务的详细信息内,将显示其公共 IP 地址:
到了这一步,我们可以用浏览器访问 IP,生成 hit counter 的值:
模拟节点故障
我们可以通过删除 pod(使用 kubectl 或 Rancher UI)来模拟集群成员的故障。当我们删除原先是 master 的 redis-cluster-0 时,我们看到 Kubernetes 将 redis-cluster-3 提升为 master,而当 redis-cluster-0 重新回来时,redis-cluster-3 会重新恢复从属身份。
之前
之后
我们可以看到 redis-cluster-0 的 IP 发生了变化,那么集群是如何恢复的呢?
在创建集群时,我们创建了 ConfigMap,该 ConfigMap 又在/conf/update-node.sh 处创建了一个脚本,容器在启动时调用该脚本。该脚本使用本地节点的新 IP 地址更新 Redis 配置。有了 confic 中的新 IP,集群就可以在新的 pod 中以不同的 IP 地址启动并恢复。
在这个过程中,如果我们继续加载页面,计数器仍会继续增加,在集群收敛之后,我们会看到没有丢失任何数据。
结论
Redis 是一个强大的数据存储和缓存工具。因为 Redis 存储数据的方式,Redis 集群更是能通过提供分片、相关性能优势、线性扩展和高可用性,来进一步扩展其功能。数据在多个节点之间自动分割,即使节点的子集出现故障或者不能和集群其他部分通信,操作仍然能够继续。
有关 Redis 集群的更多信息,请访问教程(https://redis.io/topics/cluster-tutorial)或者文档(https://redis.io/topics/cluster-spec)。
有关 Rancher 的更多信息,请访问我们的主页(https://www.cnrancher.com)或者部署文档(https://www.cnrancher.com/docs/rancher/v2.x/cn/overview/)。
评论