写点什么

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon 北京

  • 2025-04-05
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

大小:609.86K时长:03:28
从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


中国联通软件研究院副总架构师吴天昊已确认出席并发表题为《从被动“救火”到主动防御:中国联通 SRE 应急保障实践》的主题分享,围绕安全生产保障体系建设思路,以及端到端全流程的系统全生命周期稳定性保障工具建设视角,介绍中国联通超大规模 IT 系统稳定性保障实践经验。



吴天昊目前在中国联通软件研究院任副总架构师,主要负责中国联通安全生产保障体系建设,中国联通数字化监控平台整体功能技术架构设计、优化及演进。具备多年运维研发经验,致力于完善“平台+应用” 生态体系,打造联通集团自动化生产和智慧化运营的生产运营平台,助力系统稳定性持续提升。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景挑战:超大规模系统的稳定性困局

  • 云原生下系统安全生产面临的挑战

  • 系统应急保障的常见问题痛点

2. 体系能力:应急保障主动防御架构设计

  • 应急保障体系整体解决方案

  • 监控预警与故障诊断

  • 故障调度快速抢通

  • 应急演练主动预防

3. 案例分享:应急保障场景落地实践

  • 故障自愈的经典场景

  • 自动化应急处置案例

4. 总结与展望

  • 应用实施落地效果

  • 未来 AI 大模型赋能


您认为,这样的技术在实践过程中有哪些痛点?

  • 超大规模 IT 系统下的超大数据量处理实时性与告警诊断准确性的平衡博弈

  • 生产运维确定性稳态与 AI 生成式大模型的不确定性的平衡博弈


演讲亮点

  • 技术体系与核心能力结合视角,介绍系统稳定性保障落地思路

  • 结合具体案例,系统性的介绍中国联通超大规模 IT 系统稳定性保障实践


听众收益

  • 深度解读安全生产稳定性保障落地思路,获得可复用的稳定性保障架构设计方法论

  • 获取稳定性保障实战的关键技术细节和踩坑经验,规避共性问题陷阱,了解行业技术演进趋势


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-05 14:005514

评论

发布
暂无评论

基调听云直播回顾 | 让业务系统不再深不可测

基调听云

APM 可观测性 智能运维 基调听云

WhiteSource 是否容易受到“Spring4Shell”漏洞 CVE-2022-22965 的影响?

龙智—DevSecOps解决方案

Spring4Shell WhiteSource

东方园林应邀参加人民网《人民会客厅——两会时刻》栏目访谈

科技大数据

首个!青藤蜂巢荣获网络安全卓越验证中心&泰尔实验室双认证

青藤云安全

网络安全 青藤

AI 加持实时互动|ZegoAvatar ⾯部表情随动技术解析

ZEGO即构

计算机视觉 即构科技 Avatar

RISC-V开发板关机流程浅析

优麒麟

Linux 技术 risc-v开发板 优麒麟

Postman中文版客户端

Liam

Jmeter Postman API swagger Mock

安装配置GPU训练环境

十三

持续精进,性能突破,openGauss 3.0社区版正式发布

Geek_32c4d0

GaussDB(for openGauss) 社区版

音视频开发—时间戳相关整理(时间基tbr,tbn,tbc)

Linux服务器开发

WebRTC ffmpeg SRS 音视频开发 流媒体服务器开发

传统数据库改造难?华为云GaussDB“五心”解决

华为云数据库小助手

GaussDB

快速摆脱在线扩容难的噩梦,华为云数据库有妙计!企业级Redis 包年18元~

华为云数据库小助手

GaussDB GaussDB ( for Redis )

“天生要强”的迭代和蒙牛体育IP大满贯

科技新消息

你的产品越来越难卖?是时候关注价值流了

基调听云

DevOps APM 智能运维 基调听云

Tapdata Cloud 2.1.2 来啦:大波细节已就绪!字段类型可批量修改、支持微信扫码登录、新增支持 Vika 为目标

tapdata

WEB安全:深入反射式dll注入技术

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

AIOps(智能运维)中的指标算法场景分享 | 内附视频&ppt资料

云智慧AIOps社区

人工智能 AI 算法 运维 告警

“中国牛”、“天生要强”翻新,2022蒙牛继续大满贯

科技新消息

蒙牛中国乳业产业园牧场建设项目全面复工

科技新消息

启动报名2022南京智博会 第十四届南京国际智慧城市、物联网、大数据博览会

InfoQ_caf7dbb9aa8a

物联网

大数据洞察画像自动化实践

网易云信

大数据

信通院牵头数列科技参与主编的《信息系统稳定性保障能力建设指南》正式发布

TakinTalks稳定性社区

Whats On Tap | Tapdata Cloud 如何助力大型家居连锁商城推进数字化经营?

tapdata

精彩回顾 | 金融服务数字化生态的开放与安全

FinClip

金融 数据安全

TDengine 荣获 CSDN IT 技术影响力之星 “年度开源项目” 、 “年度IT领军人物”奖项

TDengine

数据库 tdengine 开源

解决方案体现的是一个公司的深度思考能力

基调听云

APM 智能运维 业务运维 基调听云

2022第十四届南京国际人工智能产品展会

InfoQ_caf7dbb9aa8a

ElasticSearch写入流程详解

IT巅峰技术

elasticsearch

Redis 布隆(Bloom Filter)过滤器原理与实战讲解

码哥字节

布隆过滤器 4月日更 Redis 数据结构 4月月更

沙龙:如何使信息系统更加稳定

博睿数据

蒙牛:以新营销和“更好”的年轻一代共鸣

科技新消息

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京_软件工程_QCon全球软件开发大会_InfoQ精选文章