Kubernetes 集群通常使用 ssl 证书来加密通信,Rancher 会自动为集群生成证书。在 Rancher v2.0.14、v2.1.9 之前的版本,Rancher 配置集群的自动生成证书的有效期为 1 年,这意味着如果您在大约 1 年前使用这些版本创建了 Rancher 配置集群,那么您需要尽快开始轮换证书,否则证书过期后集群将进入错误状态。轮换证书是一次性操作,新生成的证书有效期为 10 年。
本文将为您详细介绍如何进行轮换证书的操作。即使您的证书现在已经过期,您也可以依照以下步骤进行证书的轮换。但请注意先不要升级 rancher server,根据本文最后一节【证书已过期导致无法连接 k8s】进行处理。
注意
在重新启动组件时,轮换 Kubernetes 证书可能会导致您的群集暂时不可用。此外,对于生产环境,建议在维护窗口期间执行此操作。
通过 UI 轮换证书(业务集群)
注:可用版本 Rancher v2.2.0 +
在 Rancher v2.2.0 以及更高版本,可通过 UI 的证书轮换功能对集群证书进行更新,此功能适用于【自定义安装的集群】。
证书轮换之后,Kubernetes 组件将自动重新启动,重启不影响应用 Pod,重启时间需要 3 到 5 分钟。
证书轮换可用于下列服务:
etcd
kubelet
kube-apiserver
kube-proxy
kube-scheduler
kube-controller-manager
通过 UI 轮换证书,目前支持:
批量更新所有服务证书(CA 证书不变)
更新某个指定服务(CA 证书不变)
(重要)集群更新
如果 Rancher 版本是从 v2.x.x 升级到 2.2.x,则需要先做一次 集群更新 操作。
1、进入【全局\集群视图】;
2、选择【目标集群】右侧的【省略号菜单】,选择升级;
3、点击右侧【显示高级选项】,检查【Etcd 快照轮换】功能是否开启,建议开启此功能;
4、在【授权集群访问地址】中,检查功能是否已开启,建议开始此功能,下边的域名可以不用填写;
5、最后点击【保存】,集群将自动进行更新
轮换证书
1、进入【全局\集群视图】;
2、选择对应集群右侧的【省略号菜单】,选择更新证书有效期;
3、选择更新所有服务证书,并点击保存
4、集群将自动更新证书
5、因为证书改变,相应的 token 也会变化,在集群证书更新完成后,需要对连接 API SERVER 的 Pod 进行重建,以获取新的 token。
cattle-system/cattle-cluster-agent
cattle-system/cattle-node-agent
cattle-system/kube-api-auth
ingress-nginx/nginx-ingress-controller
kube-system/canal
kube-system/kube-dns
kube-system/kube-dns-autoscaler
其他应用 Pod
通过 UI API 轮换证书(业务集群)
注:可用版本 Rancher v2.0.14+ v2.1.9+
对于 Rancher v2.0.14、v2.1.9 以及更高版本,可通过 API 对集群证书进行更新。API 证书轮换将会同时对所有组件证书进行更新,不支持指定组件更新证书。
1、在【全局】视图中,定位到需要更新证书的集群,然后点击右侧省略号菜单,然后点击【API 查看】。
2、点击右上方的 RotateCertificates
3、点击 Show Request
4、点击 Send Request
5、因为证书改变,相应的 token 也会变化,在集群证书更新完成后,需要对连接 API SERVER 的 Pod 进行重建,以获取新的 token。
cattle-system/cattle-cluster-agent
cattle-system/cattle-node-agent
cattle-system/kube-api-auth
ingress-nginx/nginx-ingress-controller
kube-system/canal
kube-system/kube-dns
kube-system/kube-dns-autoscaler
其他应用 Pod
RKE 证书轮换(local 集群和业务集群通用)
注:可用版本 rke v0.2.0+
如果以前是通过 rke v0.2.0 之前的版本创建的 Kubernetes 集群,在轮换证书前先执行 rke up 操作,请参考:
通过 RKE 轮换证书,目前支持:
批量更新所有服务证书(CA 证书不变)
更新某个指定服务(CA 证书不变)
轮换 CA 和所有服务证书
1、批量更新所有服务证书(CA 证书不变)
2、更新指定服务(CA 证书不变)
3、轮换 CA 和所有服务证书
4、因为证书改变,相应的 token 也会变化,在集群证书更新完成后,需要对连接 API SERVER 的 Pod 进行重建,以获取新的 token
cattle-system/cattle-cluster-agent
cattle-system/cattle-node-agent
cattle-system/kube-api-auth
ingress-nginx/nginx-ingress-controller
kube-system/canal
kube-system/kube-dns
kube-system/kube-dns-autoscaler
其他应用 Pod
独立容器 Rancher server 证书更新
Rancher v2.0.14+ 、v2.1.9+、v2.2.0+会自动检查证书有效期,如果发现证书过期,将会自动生成新的证书。所以独立容器运行的 Rancher server 只需把 rancher 版本升级到支持的版本,无需做其他操作。
故障处理
提示 CA 证书为空
如果执行更新证书后出现如下错误提示,因为没有执行集群更新操作。
解决方法
1、选择对应问题集群,然后查看浏览器的集群 ID,如下图:
2、执行命令 kubectl edit clusters <clusters_ID>
如果 Rancher 是 HA 安装,直接在 local 集群中,通过 rke 生成的 kube 配置文件执行以上命令;
如果 Rancher 是单容器运行,通过 docker exec -ti <容器 ID> bash 进入容器中,然后执行 apt install vim -y 安装 vim 工具,然后再执行以上命令;
3、删除 spec.rancherKubernetesEngineConfig.rotateCertificates 层级下的配置参数:
修改为
输入:wq 保存 yaml 文件后集群将自动更新,更新完成后再进行证书更新。
证书已过期导致无法连接 K8S
如果集群证书已经过期,那么即使升级到 Rancher v2.0.14、v2.1.9 以及更高版本也无法轮换证书。rancher 是通过 Agent 去更新证书,如果证书过期将无法与 Agent 连接。
解决方法
可以手动设置节点的时间,把时间往后调整一些。因为 Agent 只与 K8S master 和 Rancher server 通信,如果 rancher server 证书未过期,那就只需调整 K8S master 节点时间。
调整命令:
然后再对 rancher server 进行升级,接着按照证书轮换步骤进行证书轮换,等到证书轮换完成后再把时间同步回来。
检查证书有效期
评论