写点什么

陆金所机房一键切换平台建设

  • 2019-08-11
  • 本文字数:1145 字

    阅读完需:约 4 分钟

陆金所机房一键切换平台建设

ArchSummit深圳2019大会上,刘俊讲师做了《陆金所机房一键切换平台建设》主题演讲,主要内容如下。


演讲简介


陆金所于 2017 年 11 月完成同城双活机房建设,在闭环 CMDB 和运维自动化变更云平台建设完成的基础上,为保证机房发生灾难情况下,将业务影响降至最低,陆金所技术运营部于 2018 年 4 月份启动了机房一键切换项目。


2018 年 12 月 1 日,陆金所用 4 分 38 秒成功将网站所有服务进行机房级切换演练(包含 1429 个应用系统,120 个 DB 实例,310 个外部网关,3100 个 job,11 个 A/S 应用,文件服务等核心架构组件),达成机房一键切换的设计目标。


2018 年 12 月 22 日,陆金所利用一键切换平台将主机房从宝信切换至外高桥机房。2019 年 3 月 30 日,陆金所将主机房从外高桥切换至宝信机房,耗时缩短到 4 分 05 秒。一键切换平台的完成,代表陆金所具备机房级容灾 5 分钟内恢复的能力,达到业界领先水平。


演讲提纲


1、设计目标:


  • 在宝信机房正常提供服务的情况下,通过一键切换平台 10 分钟内切换宝信机房至外高桥。


2、项目挑战:


  • 全站 1400+应用系统,100 套+DB 实例,300+大网关,3000+job 调度,梳理 A/S 应用(数量庞大,架构复杂,系统多样)

  • 数据一致性保障,CMDB 自动化闭环,自动化平台重构,一键切换多任务并发执行时效,时效要求高(技术框架改造量大)

  • 生产应用标准化改造工作量大(历史遗留问题多)


3、设计方案关键点:


  • 双活机房有状态的服务需要可以在机房之间做灵活切换

  • 服务经全面梳理确认为 7 大类型

  • 7 大服务切换需要反复生产验证,确保接口健壮性

  • 机房切换需分批次,逐步加量验证

  • DB 切换涉及百套以上 DB,Oracle/MySQL/Redis 都需要完成切换目标

  • 一键切换平台需具备高可用/权限控制/切换过程输出/服务展示/切换进度/自动检查/CMDB 闭环等功能


听众受益点


  1. 陆金所的运维自动化的根本实现原则是分而治之,大而化小

  2. 每个服务目录,无论是复杂的组合操作还是简单的原子操作,都统一遵循以上 4 步流程

  3. 所有涉及的元数据都要求从 CMDB 中获取,完成变更后所有变化也需要反应到 CMDB 中从而形成闭环

  4. 变更流程的所有细节都需要在变更设计阶段却确定并提交到相关审批流程中(切换过程自动化审批)

  5. 变更的执行要求全生命周期管理,过程中的状态以及产生的所有日志都会留存并提供用户实时查询与相关干预操作


讲师介绍


刘俊


陆金所 技术运营部运维开发团队经理


2016 年 4 月入司至今,先后在规划管理团队和运维开发团队担任资深架构师、团队经理职务。负责陆金所核心 IT 技术运营系统的建设与保障工作,负责陆金所 DevOps 核心运营流程与工具链的持续优化改进以及技术运营相关业务的技术选型、方案制定与架构设计。同时也负责 IT 技术体系可用率保障的相关技术工作。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/shenzhen/schedule


2019-08-11 00:001751

评论

发布
暂无评论
发现更多内容

Sentinel 新版本发布,提升配置灵活性以及可观测配套

阿里巴巴云原生

阿里云 开源 云原生

从 13 个企业关心的问题看懂用云范式的改变

阿里巴巴云原生

阿里云 云原生 云原生容器

定向减免!函数计算让轻量 ETL 数据加工更简单,更省钱

阿里巴巴云原生

阿里云 云原生 函数计算

OpenKruiseGame × KubeSphere 联合发布游戏服运维控制台,推动云原生游戏落地

阿里巴巴云原生

阿里云 开源 容器 云原生

解读 EventBridge Transform:数据转换和处理的灵活能力

阿里巴巴云原生

阿里云 云原生

【Linux技术专题】「夯实基本功系列」带你一同学习和实践操作Linux服务器必学的Shell指令(文件处理指令-上)

码界西柚

Linux 技术分享 后端领域‘’ 2024年第十九篇文章

进击的 Serverless:Java 应用如何从容地面对突增流量

阿里巴巴云原生

阿里云 Serverless 云原生

活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

阿里巴巴云原生

阿里云 容器 云原生

从 2.x 到 3.x,TDengine 在 3D 打印技术中的应用实践

TDengine

tdengine 时序数据库

千万级高性能长连接Go服务架构实践

百度Geek说

golang 架构 高并发 长连接 企业号 1 月 PK 榜

每个开发人员都应该知道的13个Nodejs库

南城FE

JavaScript 前端 nodejs

Consul 留给你的时间不多了

阿里巴巴云原生

阿里云 云原生

云原生离线工作流编排利器 -- 分布式工作流 Argo 集群

阿里巴巴云原生

阿里云 云原生

走出大模型部署新手村!小明这样用魔搭×函数计算

阿里巴巴云原生

阿里云 云原生 函数计算

成本更低、更可控,云原生可观测新计费模式正式上线

阿里巴巴云原生

阿里云 云原生 可观测

从0到1:大学校园参观预约小程序开发笔记(一)

CC同学

Jira 私有化部署即将停服,你准备好了吗?

极狐GitLab

陆金所机房一键切换平台建设_ArchSummit_刘俊_InfoQ精选文章