
2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。
快手技术专家刘裕惺已确认出席并发表题为《快手有状态服务大规模上云实践》的主题分享。随着云原生技术的飞速发展,有状态业务的上云已成为企业进一步释放云原生红利的关键领域。然而,由于有状态业务本身的复杂性,其云原生化过程面临诸多挑战,包括编排与调度、状态管理、流量治理、弹性扩展、运行时管控以及监控告警等多方面的难题。在这一过程中,快手经历了从传统运维到容器化,再到 Kubernetes 化,并最终实现 Operator 成熟化的多阶段技术演进。在有状态业务云原生化的实践中,快手积累了丰富的经验,覆盖数据库(如 MySQL、Redis、图数据库等)、大数据(如 ClickHouse、Doris、Hbase 等)等关键领域的应用与探索。
本次分享将重点聚焦快手在有状态业务云原生化过程中的最佳实践,详细剖析实际场景中的技术难点与解决方案。同时希望与大家共同探讨有状态业务上云的未来发展方向与广阔前景。
刘裕惺先后工作于阿里以及快手云原生团队,一直专注于云原生领域,在开源、商业化、云原生规模化领域都有相应的经验,是 CNCF/Dragonfly 以及 CNCF/sealer 项目的 maintainer 之一。目前专注于推动快手有状态业务(如数据库、中间件等)的云原生化转型。他在本次会议的详细演讲内容如下:
演讲提纲
有状态业务上云带来的新的复杂度
快手有状态业务云原生化演进关键路径
快手有状态业务云原生化方案落地实践经验
有状态业务上云迁移方案
面向过程与面向终态的冲突与低成本转换
有状态业务上云稳定性保障:
编排调度,状态生命周期管理 & 高可用调度能力
运行时管控,自动化与稳定性的双螺旋提升
灰度变更,有状态业务 rollout 的新挑战及其解决方案
4. 探讨有状态业务上云的未来趋势与发展
您认为,这样的技术在实践过程中有哪些痛点?
相比与无状态业务上云来看,有状态业务的上云需要较高的初期投入成本
由于有状态业务的复杂性与独特性,分享中提到的的实践经验与沉淀更多的是提供框架性的能力,而具体的落地仍需结合业务场景深入分析
演讲内容的前沿亮点
深度剖析有状态业务特性与 K8S 运维能力:清晰解析了有状态业务的核心特性,并结合 K8S 的原生能力,抽丝剥茧揭示有状态业务向云原生迁移的关键路径。
体系化的有状态业务上云实践经验:演讲以系统化的方式总结了有状态业务上云的经验,并提供了一条清晰的实现路径。这不仅降低了上云的试错成本,也为推动业界最佳实践的形成奠定了基础。
降低有状态业务上云的综合成本:通过分享具体的优化方案和实践案例,大幅降低了有状态业务上云的技术门槛和成本,助力企业更高效地完成云原生转型。
听众收益点:
深入理解有状态业务上云的复杂性及其本质。
掌握一条清晰的有状态业务上云的实践思路。
获取在有状态业务大规模上云过程中可能遇到的问题及相应解决方案的参考。
除此之外,本次大会还策划了多模态大模型及应用、AI 驱动的工程生产力、面向 AI 的研发基础设施、不被 AI 取代的工程师、大模型赋能 AIOps、云成本优化、Lakehouse 架构演进、越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。
目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。

为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088
评论