【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

开源 CI/CD 构建框架 TekTon 的深入剖析

  • 2020-05-10
  • 本文字数:5298 字

    阅读完需:约 17 分钟

开源 CI/CD 构建框架 TekTon 的深入剖析

简介

Tekton 是一个功能强大且灵活的 Kubernetes 原生 CI/CD 构建框架,用于创建持续集成和交付(CI/CD)系统。 关于 Tekton ,网上可以搜到很多很多介绍文档,本文主要阐述我对 Tekton 的实现原理和背后的技术逻辑的一点理解。


Tekton 定义了 Task、TaskRun、Pipeline、PipelineRun、PipelineResource 五类核心对象,通过对 Task 和 Pipeline 的抽象,我们可以定义出任意组合的 pipeline 模板来完成各种各样的 CI/CD 任务,再通过 TaskRun、PipelineRun 和 PipelineResource 可以将这些模板套用到各个实际的项目中。

实现原理

高度抽象的结构化设计使得 Tekton 具有非常灵活的特性,那么 Tekton 是如何实现 workflow 的流转的呢?


Tekton 利用 Kubernetes 的 List-Watch 机制,在启动时初始化了 2 个 Controller、PipelineRunController 和 TaskRunController 。


PipelineRunController 监听 PipelineRun 对象的变化。在它的 reconcile 逻辑中,将 pipeline 中所有的 Task 构建为一张有向无环图(DAG),通过遍历 DAG 找到当前可被调度的 Task 节点创建对应的 TaskRun 对象。


TaskRunController 监听 TaskRun 对象的变化。在它的 reconcile 逻辑中将 TaskRun 和对应 Task 转化为可执行的 Pod ,由 kubernetes 调度执行。利用 Kubernetes 的 OwnerReference 机制, PipelineRun Own TaskRun、TaskRun Own Pod、Pod 状态变更时,触发 TaskRun 的 reconcile 逻辑, TaskRun 状态变更时触发 PipelineRun 的 reconcile 逻辑。



DAG 支持


Tekton 对 DAG 的支持相对比较简单。在 Tekton 中一个 Pipeline 就是一张 DAG ,Pipeline 中的多个 Task 可是 DAG 中的节点。Task 默认并发执行,可以通过 RunAfter 和 From 关键字控制执行顺序。


示例:


- name: lint-repo  taskRef:    name: pylint  resources:    inputs:      - name: workspace        resource: my-repo- name: test-app  taskRef:    name: make-test  resources:    inputs:      - name: workspace        resource: my-repo- name: build-app  taskRef:    name: kaniko-build-app  runAfter:    - test-app  resources:    inputs:      - name: workspace        resource: my-repo    outputs:      - name: image        resource: my-app-image- name: build-frontend  taskRef:    name: kaniko-build-frontend  runAfter:    - test-app  resources:    inputs:      - name: workspace        resource: my-repo    outputs:      - name: image        resource: my-frontend-image- name: deploy-all  taskRef:    name: deploy-kubectl  resources:    inputs:      - name: my-app-image        resource: my-app-image        from:          - build-app      - name: my-frontend-image        resource: my-frontend-image        from:          - build-frontend
复制代码


渲染出的执行顺序为:


        |            |        v            v     test-app    lint-repo    /        \   v          vbuild-app  build-frontend   \          /    v        v    deploy-all
复制代码


相比于 Argo 等专注在 workflow 的项目而言, Tekton 支持的任务编排方式是非常有限的。常见的循环,递归,重试,超时等待等策略都是没有的。


条件判断


Tekton 支持 condition 关键字来进行条件判断。Condtion 只支持判断当前 Task 是否执行,不能作为 DAG 的分支条件来进行动态 DAG 的渲染。


condition:


https://github.com/tektoncd/pipeline/blob/e2755583d52ae46907790d40ba4886d55611cd23/docs/conditions.md


* condition检查失败(exitCode != 0),task不会被执行,pipelineRun状态不会因为condition检查失败而失败。* 多个条件之间 “与” 逻辑关系
复制代码

PipelineResource 在 Task 间数据交换

作为 CI/CD 的工具,代码在什么时候 Clone 到 WorkSpace 中,如何实现的? Tekton 中抽象了 PipelineResource 进行任务之间的数据交换, GitResource 是其中最基础的一种。用法如下。


声明一个 Git 类型的 PipelineResource :


kind: PipelineResourcemetadata:  name: skaffold-git-build-push-kanikospec:  type: git  params:  - name: revision    value: v0.32.0  - name: url    value: https://github.com/GoogleContainerTools/skaffold
复制代码


在 Task 中引用这个 Resource 做为输入:


kind: Taskmetadata:  name: build-push-kanikospec:  inputs:    resources:    - name: workspace      type: git  steps:  - name: build-and-push    image: registry.cn-shanghai.aliyuncs.com/kaniko-project-edas/executor:v0.17.1
复制代码


代码会被 clone 在 /workspace 目录。


Tekton 是如何处理这些 PipelineResource 的呢,这就要从 Taskrun Controller 如何创建 Pod 说起。


Tekton 中一个 TaskRun 对应一个 Pod ,每个 Pod 有一系列 init-containers 和 step-containers 组成。 init-container 中完成认证信息初始化, workspace 目录初始化等初始化工作。


在处理 step-container 时,会根据这个 Task 引用的资源 Append 或者 Insert 一个 step-container 来处理对应的输和输出,如下图所示。



Task 中 Step 执行顺序控制


Tekton 源自 Knative Build ,在 Knative Build 中使用 Init-container 来串联 Steps 保证 Steps 顺序执行,在上面的分析中我们知道 Tekton 是用 Containers 来执行 Steps , Pod 的 Containers 是并行执行的, Tekton 是如何保证 Steps 执行顺序呢?


这是一个 TaskRun 创建的 Pod 的部分描述信息,可以看到所有的 Step 都是被 /tekton/tools/entrypoints 封装起来执行的。 -wait_file 指定一个文件,通过监听文件句柄,在探测到文件存在时执行被封装的 Step 任务。 -post_file 指定一个文件,在 Step 任务完成后创建这个文件。通过文件序列 /tekton/tools/${index} 来对 Step 进行排序。


- args:    - -wait_file    - /tekton/tools/0    - -post_file    - /tekton/tools/1    - -termination_path    - /tekton/termination    - -entrypoint    - /ko-app/git-init    - --    - -url    - https://github.com/GoogleContainerTools/skaffold    - -revision    - v0.32.0    - -path    - /workspace/workspace    command:    - /tekton/tools/entrypoint    image: registry.cn-shanghai.aliyuncs.com/kaniko-project-edas/git-init:v0.10.2    name: step-git-source-skaffold-git-build-push-kaniko-rz765  - args:    - -wait_file    - /tekton/tools/1    - -post_file    - /tekton/tools/2    - -termination_path    - /tekton/termination    - -entrypoint    - /kaniko/executor    - --    - --dockerfile=Dockerfile    - --destination=localhost:5000/leeroy-web    - --context=/workspace/workspace/examples/microservices/leeroy-web    - --oci-layout-path=$(inputs.resources.builtImage.path)    command:    - /tekton/tools/entrypoint    image: registry.cn-shanghai.aliyuncs.com/kaniko-project-edas/executor@sha256:565d31516f9bb91763dcf8e23ee161144fd4e27624b257674136c71559ce4493    name: step-build-and-push  - args:    - -wait_file    - /tekton/tools/2    - -post_file    - /tekton/tools/3    - -termination_path    - /tekton/termination    - -entrypoint    - /ko-app/imagedigestexporter    - --    - -images    - '[{"name":"skaffold-image-leeroy-web-build-push-kaniko","type":"image","url":"localhost:5000/leeroy-web","digest":"","OutputImageDir":"/workspace/output/builtImage"}]'    command:    - /tekton/tools/entrypoint    image: registry.cn-shanghai.aliyuncs.com/kaniko-project-edas/imagedigestexporter:v0.10.2    name: step-image-digest-exporter-lvlj9
复制代码

实践

使用 Tekton 构建代码并部署到 SAE


Serverless 应用引擎( SAE ) 是阿里云上一款面向应用的 Serverless PaaS 平台,帮助 PaaS 层用户免运维 IaaS,按需使用,按量计费,实现低门槛微服务应用上云,有效解决成本及效率问题。支持 Spring Cloud、Dubbo 和 HSF 等流行的开发框架,真正实现了 Serverless 架构和微服务架构的完美融合。


接下来将使用 Tekton 部署一个 Spring Cloud 微服务应用到 SAE 平台。


示例中的演示代码地址:https://github.com/alicloud-demo/spring-cloud-demo
复制代码


1、前置条件


在 Kubernetes 集群上安装 Tekton :


https://github.com/tektoncd/pipeline/blob/master/docs/install.md


创建一个 SAE 应用:


https://help.aliyun.com/document_detail/122439.html


2、定义一个 Git 资源


apiVersion: tekton.dev/v1alpha1kind: PipelineResourcemetadata:  name: spring-cloud-demospec:  type: git  params:  - name: url    value: https://github.com/alicloud-demo/spring-cloud-demo
复制代码


3、定义构建和部署 Task


根据 SAE 官方文档进行部署,详情参考:


https://help.aliyun.com/document_detail/110639.html


apiVersion: tekton.dev/v1alpha1kind: Taskmetadata:  name: build-deploy-saespec:  inputs:    resources:    - name: source      type: git  steps:  - name: build-and-deploy    image: maven:3.3-jdk-8    command: ["mvn", "clean", "package", "-f", "source", "toolkit:deploy", "-Dtoolkit_profile=toolkit_profile.yaml", "-Dtoolkit_package=toolkit_package.yaml", "-Dtoolkit_deploy=toolkit_deploy.yaml"]    securityContext:      runAsUser: 0
复制代码


4、定义 TaskRun 运行任务


apiVersion: tekton.dev/v1alpha1kind: TaskRunmetadata:  name: build-deploy-saespec:  taskRef:    name: build-deploy-sae  inputs:    resources:    - name: source      resourceRef:        name: spring-cloud-demo
复制代码


5、导入到 kubernetes 中运行


kubectl apply -f source-2-service-taskrun.yaml
复制代码



6、查看日志


kubectl logs build-deploy-sae-pod-85xdk step-build-and-deploy
复制代码


构建日志:



部署日志:


[INFO] Start to upload [provider3-1.0-SNAPSHOT.jar] using [Sae uploader].[INFO] [##################################################] 100.0%[INFO] Upload finished in 3341 ms, download url: [https://edas-hz.oss-cn-hangzhou.aliyuncs.com/apps/K8S_APP_ID/37adb12b-5f0c-4711-98ec-1f1e91e6b043/provider3-1.0-SNAPSHOT.jar][INFO] Begin to trace change order: e2499b9a-6a51-4904-819c-1838c1dd62cb[INFO] PipelineName: Batch: 1, PipelineId:f029314a-88bb-450b-aa35-7cc550ff1329[INFO] Waiting...[INFO] Waiting...[INFO] Waiting...[INFO] Waiting...[INFO] Waiting...[INFO] Waiting...[INFO] Waiting...[INFO] Waiting...[INFO] Deploy application successfully![INFO] ------------------------------------------------------------------------[INFO] BUILD SUCCESS[INFO] ------------------------------------------------------------------------[INFO] Total time: 32:41 min[INFO] Finished at: 2020-04-15T10:09:39+00:00[INFO] Final Memory: 47M/190M[INFO] ------------------------------------------------------------------------
复制代码


7、验证部署结果


在 SAE 控制台查看变更记录:



验证应用访问:


总结

区别于传统的 CI/CD 工具(Jenkins),Tekton 是一套构建 CICD 系统的框架。 Tekton 不能使你立即获得 CI/CD 的能力。但是基于 Tekton 可以设计出各种花式的构建部署流水线。得益于 Tekton 良好的抽象,这些设计出的流水线可以作为模板在多个组织,项目间共享。Tekton 源自 Knative 的 Build-Template 项目,设计之初的一个重要目标就是使人们能够共享和重用构成 pipeline 的组件,以及 Pipeline 本身。在 Tekton 的 RoadMap 中 Tekton Catelog 就是为了实现这一目标而提出的。


区别于 Argo 这种基于 Kubernetes 的 Workflow 工具, Tekton 在工作流控制上的支持是比较弱的。一些复杂的场景比如循环,递归等都是不支持的。更不用说 Argo 在高并发和大集群调度下的性能优化。这和 Tekton 的定位有关, Tekton 定位于实现 CICD 的框架,对于 CICD 不需要过于复杂的流程控制。大部分的研发流程可以被若干个最佳实践来覆盖。而这些最佳实践应该也必须可以在不同的组织间共享,为此 Tekton 设计了 PipelineResource 的概念。 PipelineResource 是 Task 间交互的接口,也是跨平台跨组织共享重用的组件,在 PipelineResource 上还可以有很多想象空间。


作者介绍


九辩,阿里巴巴高级开发工程师,负责阿里云 EDAS(企业级分布式应用服务)应用生命周期研发工作,长期关注云时代微服务的部署和治理工作。


本文转载自公众号阿里巴巴中间件(ID:Aliware_2018)。


原文链接


https://mp.weixin.qq.com/s?__biz=MzU4NzU0MDIzOQ==&mid=2247489348&idx=3&sn=161f6eabdfce7dfb8c51ae2e9f8faada&chksm=fdeb2524ca9cac326c362778f8dcf2299a5fb28c80657b44c7c82760f5c8df773421455faf90&scene=27#wechat_redirect


2020-05-10 14:065632

评论 1 条评论

发布
用户头像
Tekton 需要从 gcr.io 下载镜像,可以使用国内的镜像源 gcr.lank8s.cn
http://gcr.iohttp://registry.k8s.io 的镜像都可以使用http://lank8s.cn提供的镜像服务来拉取镜像,详情看看这篇文章
https://liangyuanpeng.com/post/service-lank8s.cn/
2023-05-29 15:43 · 广东
回复
没有更多了
发现更多内容

龙头整机厂商宝德加入,共建龙蜥社区开源新生态

OpenAnolis小助手

Linux 开源 合作伙伴

教程直播第7期|如何对 OceanBase 进行 SQL 诊断和调优

OceanBase 数据库

oceanbase OceanBase 开源 OceanBase 社区版 OceanBase教程

WTM活动回顾|WomenTechmakers 2021 Courage to Create

江湖老铁

大数据开发之Flink + TiDB

@零度

flink 大数据开发

工商银行实时大数据平台建设历程及展望

Apache Flink

大数据 flink 编程 实时计算

HBase的 rowkey 设计原则

编程江湖

HBase 架构

初识MASA Blazor

MASA技术团队

C# .net 微软 后端 blazor

Flink CDC 系列 - Flink MongoDB CDC 在 XTransfer 的生产实践

Apache Flink

大数据 flink 编程 实时计算 IT

MyBatis的功能架构是怎样的

编程江湖

mybatis

从 Flink Forward Asia 2021,看 Flink 未来开启新篇章

Apache Flink

大数据 flink 编程 实时计算

大咖集结,共创生态|AIOps社区专家团正式集结出道

云智慧AIOps社区

开源项目 开源社区 智能运维 开发者社区 社区治理

Pravega Flink Connector Table API 进阶功能探秘

Apache Flink

大数据 flink 编程 实时计算 Pravega

针对 jQuery 的优化方法有哪些

编程江湖

WorkPlus移动数字化平台赋能新型智慧城市建设

WorkPlus

内网是什么意思?指什么网?内网需要做等保测评吗?

行云管家

安全 内网 等保测评

Apache Flink ML 2.0.0 发布公告

Apache Flink

大数据 flink 编程 实时计算

虎符推出AMM流动性资金池 支持现货专区做市赚收益

区块链前沿News

流动性 虎符 Hoo 虎符交易所 AMM

Flink 大规模作业调度性能优化

Apache Flink

大数据 flink 编程 实时计算

Redis OM .NET Redis对象映射框架

MASA技术团队

C# .net 微软 后端 redis'

一个低成本确保IM消息时序的方法探讨

WorkPlus

「元宇宙十万个为什么」:为什么元宇宙值得投资?

WorkPlus

🏆【Alibaba中间件技术系列】「Nacos技术专题」配置中心加载原理和配置实时更新原理分析(中)

洛神灬殇

nacos 配置中心 Alibaba 1月日更 Apache alibaba

免费下载!FFA 系列专刊|《Flink CDC 新一代数据集成框架》电子书

Apache Flink

大数据 flink 编程 实时计算 IT

认识 Express 的 res.send() 和 res.end()

编程三昧

JavaScript 前端 nodejs Express 1月月更

数据安全产品之堡垒机详细介绍-行云管家

行云管家

网络安全 防火墙 数据安全 堡垒机

有一群青年人,用热爱连接起科技与智慧生活的“双向奔赴”

最新动态

足球、篮球、花样滑冰、乒乓球四大运动的动作识别通用方案开源了

百度大脑

人工智能

Alink、Tensorflow on Flink 在京东的应用

Apache Flink

大数据 flink 编程 实时计算 Alink

架构训练营 week6 作业

红莲疾风

「架构实战营」

技术升级!国内公有云厂商首个支持保留消息功能

百度开发者中心

物联网

netty系列之:可以自动通知执行结果的Future,有见过吗?

程序那些事

Java Netty 程序那些事

开源 CI/CD 构建框架 TekTon 的深入剖析_服务革新_九辩_InfoQ精选文章