写点什么

才云自研 Kubernetes 负载均衡器

  • 2020-03-06
  • 本文字数:2344 字

    阅读完需:约 8 分钟

才云自研 Kubernetes 负载均衡器


Kubernetes 在早期设计网络的时候就已经考虑了容器的服务发现和负载均衡。Kubernetes 为 pods 的逻辑集合抽象出了 Service 资源,配合 Iptables 和 Cloud Provider 来为用户提供访问的入口,但是 Kubernetes 日益增长的用户规模和越来越复杂化的业务场景对负载均衡逐渐提出了新的挑战。


才云科技在通过不断地实践探索及从社区获取的经验积累后,自主研发了 Kubernetes 的负载均衡器,来支持 Bare Metal 和 Public Cloud 环境。下面就让我们一起来看看才云的这次研究有什么新的发现与启迪。

大纲

  • 介绍 Service

  • 介绍 Ingress

  • 介绍 Caicloud Loadbalancer

Kubernetes 如何对外暴露服务

  • 在云环境中,如 AWS、GCE, 可以使用 Type=LoadBalancer 的 Service 使用 Type=NodePort 的 Service

  • 将 Pod 的 Port 映射到 Host 的 Port

  • 使用社区的 Service LoadBalancer 项目

  • 使用 Ingress

何为 Service

在 K8S 中,Service 是 Pods 的逻辑集合,它对外提供了访问这群 pod 的一种方式。


目前 K8S 的 Sevice 都是通过 iptables 来实现的。kube-proxy 将 service 的规则刷到 node 的 iptables 中,Client 通过 serviceIP+port 访问 service 时,经过 node 的 iptables 规则转发到真正的 endpoint pods。如下图:


社区的 Service LoadBalancer

这里简单提一下这个项目 (https://github.com/kubernetes/contrib/tree/master/service-loadbalancer)。它旨在为 Bare Metal 环境提供类似于 Cloud Load Balancer 的功能, 而需要使用 Node Port 来在每个 Node 上都暴露一个端口来进行转发.


这个 Controller 会在每个 Role=Loadbalancer Label 的 Node 上自动创建一个 Service-Loadbalancer Pod, 每个 Service-Loadbalancer 包含以下功能:


  • 启动一个 Controller: Watch K8s Services and Endpoints

  • 启动一个 Load Balancer Manifest: 它会启动一个 Load Balancer,这个 LB 是可插拔的, 很容易 从 HAproxy 的实 现切换到类似于 F5 或者 Pound 的负载均衡器上

  • 一个配置模板, 因为不同的 Load Balancer Manifest 有不同的配置格式

Ingress

Ingress Ingress 介绍


一般来说,Service 和 Pod 的 IP 地址只能在集群的网络中被路由,所有到达 Edge Router 的流量都会被丢弃或者转发到其他地方, 看起来像下面这样:



Ingress 是一个规则的集合,它允许集群外的流量通过一定的规则到达集群内的 Service 。看起来像这样:



Ingress Controller


Ingress 只是一些规则,要达到上面的需求,还需要在集群内部部署一个 Ingress Controller 而 Ingress Controller 本质上是一个 Nginx/Haproxy 。


要使用 Ingress 需要经过下面几步:


1.在集群中部署 Ingress Controller, 假设 Ingress Controller 的 IP 是 178.91.123.132


2.添加 Ingress 规则,如将 foo.bar.com 这个域名下的流量导到 serviceA:8080 ,将 bar.foo.com 的流量导到 serviceB:8080


3.在请求方需要有域名解析服务将 foo.bar.com 和 bar.foo.com 解析到 178.91.123.132



Ingress 存在的问题


Ingress 和 Ingress Controller 是 K8S 提供的非常棒的功能,但是使用下来有以下的问题:


1.如何提供 Ingress Controller 本身的高可用。


2.多个 Ingress Controller 如何同时对外提供服务。


3.IngressController 自动化运维,扩容缩容监控等。

Caicloud LoadBalancer

LoadBalancer Controller


针对 Ingress 的问题,才云科技设计了自己的 LoadBalancer。


在整个架构中,我们通过一个 LoadBalancer Admin 对外提供 RESTful api 来方便操作 LoadBalancer Third Party Resource (简称 LoadBalancer TPR)。


由 LoadBalancer Controller list/watch LoadBalancer TPR, 然后根据 TPR 的 specification 去创建 Provider 和 Proxy(Ingress Controller)并对 Node 进行相应的操作。


在这里引入了一个新的组件,LoadBalancer Provider,它是用来保证 Ingress Controller 入又的高可用。


如在 Bare Metal 环境下,我们会在每个运行 Ingress Controller 的节点上, 使用 LVS/DR Provider 来将流量分发 到同一组的 Ingress Controller,同时这个 Provider 还需要保证 VIP 的高可用 而在云环境中,则可以使用云产商各自的 L4 负载来将流量分发到同一组 Ingress Controller,用 Provider 做一次 适配就 OK 了。


LoadBalancer Controller 中包含了三种 Kubernetes Controller,分别为 Provider,Proxy,Node Controller,分别 管理各自关心的资源,互不影响。


架构图如下:



Bare Metal LoadBalancer


在 Bare Metal 的环境下,我们选择了 LVS/DR 模式做 Provider,所有的流量通过 VIP, 经过 LVS 到达 Ingress Controller,由 Ingress Controller 来控制这些流量代理到对应的 Endpoint。


在这个模式下有下面这些要点:


  • Ingress Controller 运行在 Host 网络模式下

  • DR 模式需要修改机器的 arp_ignore=1, arp_announce=2

  • 在 Node 上的 回路设备(lo)上添加 VIP,将 Ingress Controller 作为 LVS 的 Real Server,DR 模式下需要 Real Server 机器持有 VIP

  • 在这种方案下,LVS 的 Director(Ipvs Provider)话则会导致流量死循环的问题。所以我们采用 Fwmark 来区分流量,对于从 Peer 节点转发来的 流量不应该再经过 Ipvs 规则。当然这个是我们使用了 Keepalived 引起的问题。


公有云

在公有云下就比较简单了,由 Provider 去适配公有云的 L4 层负载,由公有云的负载来负责将流量导流到 Ingress Controller。


总结

目前才云的 LoadBalancer 还处于 alpha 阶段,但是已经在我们内部的集群里面替换了原来的 Keepalived+HAproxy, 来为集群的多 Master 提供 HA 的支持,替换的过程中遇到了很多坑,但总算让它正确运行起来。


后续 LoadBalancer 还需要添加更多的 Provider 来适配公有云,添加监控信息,增加弹性伸缩等功能。


本文转载自才云 Caicloud 公众号。


原文链接:https://mp.weixin.qq.com/s/1XFgQVPojpzfPGEuja3kNA


2020-03-06 17:251182

评论

发布
暂无评论
发现更多内容

社交媒体营销的“影响力指数”评估体系

Wolink

跨境电商 社交媒体 海外营销推广 品牌出海 海外红人营销

【2026年权威甄选】八大海外网红营销服务公司综合实力对比

Wolink

企业出海 跨境电商 出海 出海服务商 品牌推广

百度大数据成本治理实践

百度Geek说

hadoop spark 数据治理 成本优化

穿透式监管产品发布,助力构建全方位风险防控体系

inBuilder低代码平台

穿透式监管 风险监管 风险防控 智慧监督 风险溯源

Java Reactive Stream 初探

inBuilder低代码平台

响应式编程 背压处理 流式编程 非阻塞式编程

OceanBase Session ID 之谜

老纪的技术唠嗑局

数据库 session

根植中国,驰骋全球 | 中国重汽:擎动商用车产业格局的中国力量

科技经济

写给 0-1 岁的初创公司合伙人 系列文章汇总

Y11

创业 找工作 创业者 实习 校招

报表数据源配置总翻车?这篇 JNPF 实操指南,小白也能 10 分钟搞定!

引迈信息

超融合架构技术全景盘点:部署模型、资源调度与高可用机制

智驱前线

地推任务管理小程序系统:高效赋能推广与分店管理的核心工具

微擎应用市场

海外网红推广新趋势:最新玩法与成功案例解析

Wolink

跨境电商 出海企业 海外营销推广 海外红人营销 品牌推广

潮玩宇宙这类链游加数藏玩法做下来多少成本呢

西安链酷科技

企业级AI应用落地:森马如何通过AI网关解决大模型“多而杂、难观测、不稳健”的挑战?

阿里巴巴云原生

阿里云 云原生 森马 阿里云AI网关

诚客网络人力资源管理系统:一站式 HR 数字化管理解决方案

微擎应用市场

波场链TRX质押与能量业务:机遇与路径全解析

西安链酷科技

掌门生意宝公众号管理系统:一站式实体商家线上营销解决方案

微擎应用市场

共筑国产AI+新生态!枫清科技×麒麟软件生态强强联合,国产AI一体机重磅发布

Fabarta

社群引流裂变管家:智能社群运营的全能解决方案

微擎应用市场

精彩回顾 | 深度拆解AI+可观测性的落地价值,驱动智能运维全面革新!

博睿数据

区块链 Web3 系统的测试

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

点量云流突破技术边界,实现2D应用与3D内容的无缝云渲染融合

点量实时云渲染

数字孪生 云渲染 实时云渲染 云流化 像素流送

出海企业必备!2026年海外媒体监测工具 Top 10 盘点

沃观Wovision

社交媒体监控 海外社交媒体监控 媒体监测 社媒分析

分享一下从业六年的区块链热点变化

西安链酷科技

运动手表+质押分红链游:硅谷客户的成功案例与全解析

西安链酷科技

Solana ETF 再添「新军」,资金流入却难挡币价颓势,山寨币 ETF 浪潮尚待时日

TechubNews

B2B出海线索枯竭?构建海外推广持续获客的5个核心要素

Wolink

出海 出海企业 海外营销推广 海外推广 海外红人营销

区块链 Web3 系统的运维

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

采购 Abaqus 前的关键一步:企业 & 高校必备准备事项解析

思茂信息

仿真 abaqus 有限元分析

1700美元IDOR漏洞:未经授权修改网站托管配置

qife122

网络安全 API安全

跨节点协同、合规可控:隐语SecretFlow在运营商架构中的应用解析

隐语SecretFlow

才云自研 Kubernetes 负载均衡器_行业深度_才云科技_InfoQ精选文章