产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么
字节跳动云原生创新实践与开源之路

字节跳动云原生创新实践与开源之路

策划: 张雅文

深度探索字节跳动在云原生领域的前沿实践与开源贡献。通过对 Katalyst 、KubeAdmiral 等项目的剖析,揭示了字节跳动的突破性技术探索。专题以丰富的实践案例、创新方案和开源贡献,为读者和业界提供宝贵的经验和资源。

Gödel Scheduler 性能优化: 算法设计思想与数据结构应用
Gödel Scheduler 性能优化: 算法设计思想与数据结构应用

下长期稳定运行的能力。Scheduler 是字节跳动开源的在离线统一调度器,旨在使用同一套调度器来统一调度和管理在离线业务,实现资源并池,从而在提升资源利用率和资源弹性的同时,优化业务成本和体验,降低运维压力。

KubeAdmiral v1.0.0 发布!
KubeAdmiral v1.0.0 发布!

KubeAdmiral 是字节跳动于 2023 年 7 月正式开源的多云多集群管理引擎,它孵化于字节跳动内部,从上线至今一直强力支撑抖音、今日头条等大规模业务的平稳运行,目前管理着超过 21 万台机器、超过 1000 万 Pod。

Katalyst 如何基于 NRI 实现精细化且可插拔的容器资源管理
Katalyst 如何基于 NRI 实现精细化且可插拔的容器资源管理

本文将介绍 Katalyst 如何通过 NRI 无侵入地对容器的 CPU、内存、IO 和网络等资源实现精细化且可插拔的管理,从而在提高资源利用率的同时,保证业务的 SLO 不受影响。

新增 2 开源项目进入 CNCF 云原生全景图
新增 2 开源项目进入 CNCF 云原生全景图

近日,字节跳动 2 个云原生开源项目 Katalyst 和 KubeAdmiral 陆续进入 CNCF 云原生全景图,均被收录在 Orchestration & Management - Scheduling & Orchestration 分类下,成为 CNCF 官方认可生态构建工具中的一部分。

Katalyst v0.5.0 发布:进一步解耦,进一步优化
Katalyst v0.5.0 发布:进一步解耦,进一步优化

Katalyst v0.5.0 版本发布,引入了 Out-of-Band Resource Manager (ORM) 以解耦资源管理策略,优化了资源超分功能,并提供了动态超分和原生绑核能力的兼容,旨在提升云原生场景下的资源效能和成本优化。

字节跳动下一代通用高性能 OneAgent
字节跳动下一代通用高性能 OneAgent

本文介绍了字节跳动云原生可观测团队在构建 OneAgent 方面的探索,涉及数据模型、流程管道、编排调度和构建体系等方面,还分享了 OneAgent 在字节跳动内部的几个应用案例,展示了其在数据采集效率、资源消耗和系统稳定性方面的优势。

SoCC 论文解读:字节跳动如何在大规模集群中进行统一资源调度
SoCC 论文解读:字节跳动如何在大规模集群中进行统一资源调度

字节跳动开发了 Gödel 调度系统,其基于 Kubernetes 平台,实现了在线和离线任务的统一资源管理和调度,显著提升了大规模数据中心的资源利用率、弹性和调度吞吐率。

Katalyst v0.4.0 发布:潮汐混部与资源超分
Katalyst v0.4.0 发布:潮汐混部与资源超分

Katalyst 社区 0.4.0 版本中潮汐混部与资源超分的介绍与解读

Katalyst Custom Config:轻松管理上万节点的差异化配置
Katalyst Custom Config:轻松管理上万节点的差异化配置

本文通过讲解 Katalyst 中的 Katalyst Custom Config 方案,介绍了 Katalyst 实现复杂配置管理的思路以及实际的使用场景。

字节跳动开源KubeAdmiral:基于 K8s 的新一代多集群编排调度引擎
字节跳动开源 KubeAdmiral:基于 K8s 的新一代多集群编排调度引擎

多集群编排调度本质上并不简单,一个通用、完善的多集群联邦系统必定需要各种场景的打磨。

字节跳动多租户网关 KubeZoo 进入 CNCF 云原生全景图
字节跳动多租户网关 KubeZoo 进入 CNCF 云原生全景图

发布了最新版本的云原生全景图。领域占有一席之地。认可的构建云原生最佳实践中的一环。Landscape:https://deploy-preview-2785--landscape.netlify.app/?

字节跳动宣布开源 KubeWharf,一个实践驱动的云原生项目集
字节跳动宣布开源 KubeWharf,一个实践驱动的云原生项目集

在 7 月 23 日稀土开发者大会上,字节跳动宣布 KubeWharf 项目正式开源。进行了大规模应用和不断优化增强之后的技术结晶。

字节跳动高性能 Kubernetes 元信息存储方案探索与实践
字节跳动高性能 Kubernetes 元信息存储方案探索与实践

字节跳动云原生工程师薛英才分享了 基于分布式 KV 存储引擎的高性能 K8s 元数据存储项目 KubeBrain。

字节跳动开源 Kelemetry:面向 Kubernetes 控制面的全局追踪系统
字节跳动开源 Kelemetry:面向 Kubernetes 控制面的全局追踪系统

Kelemetry 是字节跳动开发的用于 Kubernetes 控制平面的追踪系统。为解决可观察性数据孤岛的问题,Kelemetry 以组件无关、非侵入性的方式,收集并连接来自不同组件的信号,并以追踪的形式展示相关数据。

字节跳动开源 Katalyst:在离线混部调度,成本优化升级
字节跳动开源 Katalyst:在离线混部调度,成本优化升级

字节跳动从 2016 年开始基于 Kubernetes 构建统一的基础设施,提炼出资源管控系统 Katalyst 并正式开源。

字节跳动 kube-apiserver 高可用方案 KubeGateway
字节跳动 kube-apiserver 高可用方案 KubeGateway

Kubernetes 集群 kube-apiserver 请求的负载均衡和治理方案

突破 etcd 限制!字节开源自研 K8s 存储 KubeBrain
突破 etcd 限制!字节开源自研 K8s 存储 KubeBrain

支撑线上超过 20,000 节点的超大规模 Kubernetes 集群的稳定运行

Katalyst:字节跳动云原生成本优化实践
Katalyst:字节跳动云原生成本优化实践

本篇文章带你了解字节跳动混部发展历程,还有 Katalyst 系统介绍、应用与案例介绍。

字节跳动的多云云原生实践之路
字节跳动的多云云原生实践之路

只有构建好适合自身的分布式云架构,才能真正做到“用好云”。

Gödel:字节跳动在离线混部统一调度系统
Gödel:字节跳动在离线混部统一调度系统

2023 年 10 月 30 日至 11 月 1 日,SoCC 2023 将在美国加州 Santa Cruz 举行。字节跳动基础架构 - 编排调度团队的研究成果被 SoCC 2023 接收,并受邀进行现场报告。

Katalyst Memory Advisor:用户态的 K8s 内存管理方案
Katalyst Memory Advisor:用户态的 K8s 内存管理方案

本文重点介绍 Kubernetes 和 Linux 内核原生的内存管理机制及其局限,以及 Katalyst 如何通过 Memory Advisor 在提升内存利用率的同时,保障业务的内存服务质量。

降本增效的秘密:抖音集团如何实践潮汐混部
降本增效的秘密:抖音集团如何实践潮汐混部

分时弹性混部比较适合基础设施能力建设尚处于早期的用户,在现有环境中快速上量,实现资源效能提升,本文带你了解抖音集团如何实践潮汐混部

KubeCon | 使用 KubeRay 和 Kueue 在 Kubernetes 中托管 Ray 工作负载
KubeCon | 使用 KubeRay 和 Kueue 在 Kubernetes 中托管 Ray 工作负载

本文将从 Ray 为何得到 AI 研究者们的青睐,在字节如何使用 KubeRay 来托管 Ray 应用,Kueue 如何管理和调度 RayJob 三个方面进行介绍。

如何使用 Cluster Autoscaler 将批处理作业的节点扩容到 2000 个
如何使用 Cluster Autoscaler 将批处理作业的节点扩容到 2000 个

本文将分享火山引擎容器服务 VKE 作为云上 Kubernetes 平台,在帮助客户实现集群资源弹性过程中的一些经历和挑战。

字节跳动开源 Gödel Scheduler:在离线统一调度器
字节跳动开源 Gödel Scheduler:在离线统一调度器

统一调度管理在离线业务,字节跳动推出 Gödel Scheduler

服务调用延迟降低 10%-70%,字节跳动做了什么?
服务调用延迟降低 10%-70%,字节跳动做了什么?

Environments》成功入选。随着云计算的普及与迅速发展,微服务架构已被越来越多的互联网公司采用。

没有更多了
字节跳动云原生创新实践与开源之路_技术洞察_技术趋势_大厂实践_InfoQ精选专题