写点什么

影响 K8S Pod 分配和调度策略的两大关键特性

  • 2020-05-25
  • 本文字数:2193 字

    阅读完需:约 7 分钟

影响K8S Pod分配和调度策略的两大关键特性

在 Kubernetes 中有一个最复杂的调度器可以处理 pod 的分配策略。基于在 pod 规范中所提及的资源需求,Kubernetes 调度器会自动选择最合适的节点来运行 pod。


但在许多实际场景下,我们必须干预调度过程才能在 pod 和一个节点或两个特定 pod 之间进行匹配。因此,Kubernetes 中有一种十分强大的机制来管理及控制 pod 的分配逻辑。


那么,本文将探索影响 Kubernetes 中默认调度决定的关键特性。

节点亲和性/反亲和性

Kubernetes 一向以来都是依赖 label 和 selector 来对资源进行分组。例如,某服务使用 selector 来过滤具有特定 label 的 pod,这些 label 可以选择性地接收流量。Label 和 selector 可以使用简单的基于等式的条件(=and!=)来评估规则。通过 nodeSelector 的特性(即强制将 pod 调度到特定节点上),可以将这一技术扩展到节点中。


此外,label 和 selector 开始支持基于集合的 query,它带来了基于 in、notin 和 exist 运算符的高级过滤技术。与基于等式的需求相结合,基于集合的需求提供了复杂的技术来过滤 Kubernetes 中的资源。


节点亲和性/反亲和性使用 label 和 annotation 的基于表达集的过滤技术来定义特定节点上的 pod 的分配逻辑。Annotation 可以提供不会暴露到 selector 的其他元数据,这意味着用于 annotation 的键不会包含在 query 和过滤资源中。但是节点亲和性可以在表达式中使用 annotation。反亲和性可以确保 pod 不会被强制调度到与规则匹配的节点上。


除了能够在 query 中使用复杂的逻辑之外,节点亲和性/反亲和性能够为分配逻辑强制施加硬性和软性规则。硬性规则将会执行严格的策略,可能会阻止将 pod 分配到不符合条件的节点上。而软性规则则会首先确认节点是否与特定的条件相匹配,如果它们不匹配,它将使用默认的调度模式来分配 Pod。表达式 requiredDuringSchedulingIgnoredDuringExecutionpreferredDuringSchedulingIgnoredDuringExecution 将会分别执行硬性规则和软性规则。


以下是在硬性和软性规则下使用节点亲和性/反亲和性的示例:


affinity:  nodeAffinity:    preferredDuringSchedulingIgnoredDuringExecution:      nodeSelectorTerms:        - matchExpressions:          - key: "failure-domain.beta.kubernetes.io/zone"            operator: In            values: ["asia-south1-a"]
复制代码


以上规则将指示 Kubernetes 调度器尝试将 Pod 分配到在 GKE 集群的 asia-south1-a 区域中运行的节点上。如果没有可用的节点,则调度器将会直接应用标准的分配逻辑。


affinity:  nodeAffinity:    requiredDuringSchedulingIgnoredDuringExecution:      nodeSelectorTerms:        - matchExpressions:          - key: "failure-domain.beta.kubernetes.io/zone"            operator: NotIn            values: ["asia-south1-a"]
复制代码


以上规则通过使用 NotIn 运算符来强制执行反亲和性。这是一个硬性规则,它能够确保没有 pod 被分配到运行在 asia-south1-a 空间中的 GKE 节点。

Pod 亲和性/反亲和性

尽管节点亲和性/反亲和性能够处理 pod 和节点之间的匹配,但是有些场景下我们需要确保 pod 在一起运行或在相同的节点上不运行 2 个 pod。Pod 亲和性/反亲和性将帮助我们应用强制实施粒度分配逻辑。


与节点亲和性/反亲和性中的表达式类似,pod 亲和性/反亲和性也能够通过 requiredDuringSchedulingIgnoredDuringExecutionpreferredDuringSchedulingIgnoredDuringExecution 强制实施硬性以及软性规则。还可以将节点亲和性与 pod 亲和性进行混合和匹配,以定义复杂的分配逻辑。


为了能够更好地理解概念,想象一下我们有一个 web 和缓存 deployment,其中三个副本在一个 3 节点的集群中运行。为了确保在 web 和缓存 pod 之间低延迟,我们想要在用一个节点上运行它们。与此同时,我们不想在相同的节点上运行超过 1 个缓存 pod。基于此情况,我们需要实施以下策略:每个节点仅运行 1 个且只有 1 个缓存 Pod 的 web pod。


首先,我们将使用反亲和性规则来部署缓存,它将阻止超过 1 个 pod 运行在 1 个节点上:


      affinity:        podAntiAffinity:          requiredDuringSchedulingIgnoredDuringExecution:          - labelSelector:              matchExpressions:              - key: app                operator: In                values:                - redis            topologyKey: "kubernetes.io/hostname"
复制代码


topoloyKey 使用附加到节点的默认 label 动态过滤节点的名称。请注意,我们使用 podAntiAffinity 表达式和 in 运算符来应用规则的方式。


假设在集群的某个节点上安排了 3 个 pod 缓存,那么现在我们想要在与缓存 Pod 相同的节点上部署 web pod。我们将使用 podAffinity 来实施这一逻辑:


        podAffinity:          requiredDuringSchedulingIgnoredDuringExecution:          - labelSelector:              matchExpressions:              - key: app                operator: In                values:                - redis            topologyKey: "kubernetes.io/hostname"
复制代码


以上代码表明 Kubernetes 调度器要寻找有缓存 Pod 的节点并部署 web pod。


除了节点和 pod 的亲和性/反亲和性之外,我们还能使用 taints 和 tolerations 来定义自定义分配逻辑。此外,我们还能写自定义调度程序,它可以从默认的调度程序中接管调度逻辑。


2020-05-25 16:40845

评论

发布
暂无评论
发现更多内容

ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用

阿里巴巴云原生

阿里云 云原生 消息队列

Combination of IPQ5322 and QCN9274: Unlock the high performance potential of WiFi 7

wifi6-yiyi

WiFi7

ppt文字描边怎么设置?用这2个软件轻松制作!

职场工具箱

职场 PPT 办公软件 AI生成PPT

分布式服务高可用实现:复制

京东科技开发者

阿里云消息团队创新论文被软件工程顶会 FM 2024 录用

阿里巴巴云原生

阿里云 云原生 消息队列

公链实体矿机矿池搭建系统开发指南

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 钱包开发 代币开发

雷鸟发布 AR 眼镜雷鸟 Air 3:售价 1699 元;苹果 M4 版 iMac 发布 10999 元起丨 RTE 开发者日报

声网

功能强大的文件查找工具Find Any File (FAF) for Mac

Mac相关知识分享

软件

Dropzone 4 for mac(文件拖拽增强工具)

Mac相关知识分享

文件管理工具

威睿能源:赋能绿色转型,打造低碳未来

科技热闻

1688跨境寻原通数据接口对接:跨境电商卖家必看!

tbapi

1688API 1688代采系统 1688跨境寻源通 1688跨境代采

构建区块链生态系统:公链、浏览器、钱包与节点搭建全攻略

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 钱包开发 代币开发

【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit(4)

HarmonyOS SDK

HarmonyOS

主动写入流对@ResponseBody注解的影响

京东科技开发者

图像生成新范式:智源推出全能视觉生成模型 OmniGen

智源研究院

NFTScan | 10.21~10.27 NFT 市场热点汇总

NFT Research

NFT\

如何与上级保持良好关系

老张

职场 升职加薪 沟通方式

如何技术上配置对接Teams Direct Routing

cts喜友科技

通讯 云通讯 通讯通信

基于纯血鸿蒙开发,微信适配情况如何?

博文视点Broadview

商家下载中心设计演进之路|得物技术

得物技术

Java 后端 架构设计

无代码时代来临,程序员面临淘汰?

积木链小链

程序员 IT 无代码 无代码平台

淘宝商品评价API的获取与应用

科普小能手

API 接口 API 测试 淘宝API接口 淘宝API 淘宝商品评价接口

解锁热带雨林:Mint Expedition 第四季正式开启!

NFT Research

blockchain NFT\ #Web3

荣誉|奇点云入选“2024爱分析·数据智能优秀厂商”

奇点云

Docker运行环境安装

京东科技开发者

拼多多的数字农业三部曲:新技术、新农人、新商路

Alter

数字农业

利用 EMQX ECP 实现边缘服务配置的版本管理与参数化下发

EMQ映云科技

边缘计算 智能IoT边缘服务 emqx EMQX ECP

如何通过事件溯源实现百万TPS全内存撮合交易引擎

Damon

事件溯源 撮合交易系统 全内存

JVM 调优深度剖析:优化 Java 应用的全方位攻略(一)

王中阳Go

Java JVM

HDFS 统一存储实战经验|京东零售技术实践

京东零售技术

大数据 数据

软件工程师如何有效推动大型项目:全面指南

爱吃小舅的鱼

软件工程 项目 软件工程师

影响K8S Pod分配和调度策略的两大关键特性_文化 & 方法_Rancher_InfoQ精选文章