在当今快速发展的云原生与 AI 驱动技术领域,企业面临着前所未有的挑战与机遇。随着智能计算服务、大规模容器化应用以及多模态大语言模型的广泛应用,如何在保持创新速度的同时,优化架构、控制成本并确保系统的高效稳定运行成为每个技术团队必须应对的关键问题。
与此同时,业界也逐渐意识到,推动这些技术实践的核心在于代码和系统架构的优化——从可观测性系统的高效设计,到容器集群中对磁盘 IO 的精准管理,再到 Serverless 技术在大语言模型中的灵活应用,这些都在不断塑造未来的技术生态。
在此背景下,在 10 月 18 日 -19 日,即将到来的 QCon 上海站,我们策划了《云原生工程实践》 专题,邀请高级研发总监携程蔡峰担任专题出品人,为专题进行内容质量把控。蔡峰拥有多年的技术实践和领导经验,引领携程从虚拟机时代、容器化时代到如今的 Kubernetes 时代,不断演进与创新。
本专题,我们邀请了来自阿里云、蚂蚁集团、携程、eBay、网易、微博、亚马逊云科技等顶尖企业的技术专家,分享他们的实践与探索。本文为详细介绍~另外,在本届 QCon 上海站,我们也设置了大模型基础设施与算力优化、AI 应用开发实践、AI 重塑技术工作流程等专题论坛,欲了解更多精彩内容,可点击原文链接查看。
精彩演讲一
随着云原生技术逐渐成为 AI 应用的基础平台,如何构建高效、稳定的可观测性系统以应对复杂的智能计算服务成为了业界关注的焦点。我们有幸邀请到阿里云高级技术专家徐可甲,他是阿里云 iLogtail 开源项目的负责人,长期专注于大数据安全和可观测数据采集等领域,拥有超过 10 年的丰富经验。他将在演讲中带来《面向智算服务构建下一代可观测 Pipeline》的深入分享,探讨如何通过云原生技术推动智算服务的高效运行。
徐可甲将带领大家深入剖析如何在 Kubernetes 容器集群中管理和采集海量数据,重点讲解 iLogtail 如何在智能计算服务的复杂生态中,低成本且高效地构建可观测性数据采集与处理 Pipeline。他将详细解析可观测性系统在大规模多租集群中的技术难点,介绍如何通过优化性能、提升系统稳定性,实现对数据采集的精准控制。
此外,他将结合真实案例,展示阿里云在智算服务场景中的具体技术实践,深入探讨数据采集的全面性、数据隔离性、自动化管控等策略,以及如何解决高并发和性能瓶颈问题。通过本次分享,听众将获得在智算服务领域构建高效可观测性 Pipeline 的宝贵经验,理解如何从容应对智能计算服务中的复杂场景和技术挑战。
精彩演讲二
随着企业逐步转向混合多云架构,如何有效管理和优化成本成为一大挑战。我们荣幸地邀请到携程容器与混合云团队技术专家许钦以及携程资深研发工程师陈丹双。
两位专家将以《携程混合多云架构下的 FinOps 实践》为题,分享携程在全球多云架构下的成本管理策略。他们将详细介绍如何通过落地 FinOps 实践,在复杂的多云环境中实现成本洞察、分析与优化。他们也将特别探讨携程如何构建统一的成本可视化平台、创新的计费模型,以及通过精细化分析提高云资源的利用效率。
本次分享将帮助听众深入理解 FinOps 的概念与应用,学习如何在混合多云环境中进行有效的成本管理与优化,提升企业的云资源使用效益与成本控制水平。
精彩演讲三
云原生架构的兴起正在为中间件系统的高可用性和自动化管理带来全新机遇与挑战。作为网易轻舟的资深云原生架构师 ,裴明明在该领域拥有丰富的实战经验,并且是开源项目 Harbor 的维护者。
他将带来《云原生架构下中间件联邦高可用架构实践》的主题演讲,分享网易在云原生技术栈下如何高效管理中间件系统,确保其在跨可用区场景中的高可靠性和高性能表现。
裴明明将深入解析中间件系统在传统架构与云原生架构下的不同管理方式,着重讲解网易如何利用 Kubernetes 联邦集群管理技术实现中间件系统的跨可用区高可用性。通过详解 K8s 中间件集群的联邦能力及其设计原理,他将展示如何解决有状态应用的同步、访问和灾难恢复等核心技术难题,确保中间件的持久性与稳定性。
他还将分享网易在构建云原生可观测性系统时的具体实践,如何通过 Operator 机制优化中间件集群的自动化管理,提升运维效率和集群自愈能力。
此次演讲将为听众带来云原生架构下中间件系统管理的最佳实践,特别是在多租户环境和大规模集群中的高效管理经验,帮助开发者深入理解中间件架构设计与未来发展方向。
精彩演讲四
面对大规模混合部署和容器化场景下的性能需求,磁盘 IO 隔离成为云计算基础设施中最具挑战性的技术难题之一。eBay 资深软件工程师沈涛将以《eBay 云原生磁盘 IO 隔离技术实践》为主题,深入分享他在 eBay 全球云计算基础设施中应对复杂磁盘 IO 隔离问题的解决方案,并展示如何通过云原生技术和 Cgroup v2 实现高效的资源管理和调度。
沈涛拥有丰富的云计算与基础架构开发经验,长期致力于 Kubernetes、云存储和容器运行时的研发与维护工作。他将在演讲中带领听众深入解析 eBay 如何应对因混布导致的 noisy neighbor 问题,以及如何在容器、Emptydir 和 Local PVC 等场景中对磁盘 IO 进行精细化的资源分配与限制。重点介绍基于 Cgroup v2 的 IO 隔离技术,如何通过 IO controller 实现磁盘 IO 的 QoS 管理,确保系统的高性能与高可靠性。
除此之外,他将分享 eBay 在 Kubernetes 磁盘 IO 调度模型中的设计思路,展示如何通过优化调度算法和集群拓扑结构解决资源争用问题,并最终实现节点调度和磁盘 IO 隔离的高效落地。通过此次分享,听众将深入了解磁盘 IO 隔离的核心技术挑战,以及在大规模云原生环境中应对复杂存储需求的实际应用经验,为优化存储系统和提升性能提供重要的思路和参考。
精彩演讲五
随着多模态大语言模型(MLLM)在图文理解、创作、知识、推理和指令遵循等领域的应用不断深入,如何通过强化学习算法优化模型输出成为关键。我们荣幸地邀请到蚂蚁集团高级技术专家何子波, 他是蚂蚁 CTO 线平台工程与技术风险部的核心成员,专注于云原生基础设施代码化及大规模动态配置管理。
他将以《蚂蚁集团配置即代码的规模化实践之路》为题,分享蚂蚁如何通过自主研发的配置领域语言 KCL 和平台编排器 Kusion,成功应对复杂场景的动态配置需求。何子波将深入阐述蚂蚁在多集群架构与 K8s 多租户管理中的技术选型及实践经验,带领大家了解蚂蚁集团在云原生领域的前沿探索。
通过本次分享,听众将了解到云原生动态配置管理和基础设施代码化的最新技术趋势,并学习到蚂蚁如何通过平台化技术栈提升规模化应用的交付效率和稳定性。
精彩演讲六
微博高级技术主管段绪勇将在《微博基于云计算的广告系统架构优化实践》中,为我们带来广告系统在云计算时代的架构创新与优化经验。段绪勇深耕广告引擎开发,现任微博汽车事业部高级技术主管,在广告系统的扩展性和精准投放优化方面积累了丰富经验。
他将深入讲解微博如何利用云计算的弹性扩展与大数据处理能力,提升广告系统的响应速度和资源管理效率。通过具体的实践案例,段绪勇将分享微博在广告系统中的微服务架构、容器化技术,以及基于云计算的大规模广告投放优化方案。
本次演讲将为听众带来广告系统在云时代的架构设计思路,并探索人工智能与广告技术结合的未来趋势。
精彩演讲七
亚马逊云科技高级解决方案架构师姬军翔将带来《Serverless 助力大语言模型工程化实践》的精彩演讲,分享如何利用 Serverless 技术实现大语言模型的快速迭代与低成本部署。姬军翔在通信及电商领域拥有丰富的系统架构设计经验,现负责创新系统的原型验证及大模型项目落地。
他将详细介绍大语言模型的 7 层架构,并通过案例分析展示如何应对大规模模型部署中的弹性伸缩、资源管理等挑战,帮助听众掌握 Serverless 架构下大语言模型的最佳实践。
通过姬军翔的分享,听众将深入了解 Serverless 技术如何推动大语言模型的实际应用,并学习到如何平衡性能与成本,实现高效的模型部署方案。
会议推荐
10 月 18 日 -19 日,QCon 全球软件开发大会将在上海举办。从云原生工程、架构、线上可靠性、大前端、技术管理等经典内容,到 AI Agent、AI Infra、RAG 等大热的 AI 话题,60+ 资深专家共聚一堂,深度剖析相关落地实践案例,共话前沿技术趋势。大会火热报名中,详情可联系票务经理 17310043226 咨询。
评论