发布了 22 篇内容
共 63682字, 被阅读 28.7次
获得了 310 次赞同
获得了 88次喜欢, 获得了 222 次收藏
参与了 87 次互动
互动包含发布评论、点赞评论、参与投票等
跨 AZ 部署最佳实践之 Kafka
跨 AZ 部署是实现服务高可用较为有效的方法,同时也极具性价比。如果实现了跨 AZ 部署,不仅可以消除服务中的单点,同时还可以逐步建设如下能力:服务隔离,灰度发布,N+1 冗余,可谓一举多得。承接 ES 和 Zookeeper 跨 AZ 部署实践,本文继续介绍 Kafka 如何实现跨 AZ 部署
监控系统报警级别设定
监控系统报警级别设定
黄金排障场景之 Coredump
对真实世界的近 100 个 coredump 进行分析,给出 coredump 的发现、定位、止损和预防方案以及最佳实践
阿里稳定性指标 1-5-10 解读
1-5-10 的指标解读:1 分钟发现、5 分钟处置、10 分钟恢复
监控治理有效性评价体系
当一个中大型互联网公司,每天由监控系统发出大量报警,而故障却始终无法及时发现的时候,如何能够快速找到问题的根源,如何改进,以及如何度量改进的效果,这一系列的问题就会摆在大家面前,本文基于作者在多家公司的监控治理经验,从评价体系角度出发,整理
MAC 系统初始化
不需要的软件需要点击隐藏已购项目这样才能让下次重新安装时无脑安装
HTTPS 证书过期导致的故障
数字证书的安全基于它所使用的非对称算法的安全,而算法的安全是相对的安全,是指现在可预见的年月里,如 10000 年无法破解。但随着时间的推移,技术的进步,它就可以被很快的破解,所以算法的安全是基于时间的。SSL 证书的使用寿命不得超过 27 个月。
我们是如何将 ToB 服务的交付能力优化 75%?
ToB 服务交付的方式分为公有云部署和私有化部署两种。其中,对成本敏感的中小企业往往采用公有云部署的方式,从而尽量减少成本。客单价较高的大型企业、政府、银行和事业单位,考虑到数据隐私、安全、合规等要求,往往采用私有化部署的方式。
从二十个严重的配置故障中我们能学到什么?
配置故障是运维人员在工作中经常会遇到的问题,如何才能避免配置故障的发生呢?本文作者列出了自己职业生涯遇到的 20 个不同类型的配置故障,并分析了故障发生的原因,提出了相关的解决方法。
混沌工程:一年间重启 5000 台机器后学到的 7 个经验
当产品丰富度提升了之后,大家都担心一个问题,在这么短的时间内,上线如此多的产品,质量是否能够做到最好?于是,混沌工程作为提升产品质量的头号工程,便应运而生。
上云了,如何保障云数据库的高可用?
朋友和我吐槽,自从他负责的系统上云后,在云数据库上经历了好几次故障,而事后的故障复盘,居然都是他们自己的责任和问题,这让他很被动。
混沌工程落地的六个阶段
本文将混沌工程总结为六个阶段,并对各个阶段的落地过程加以总结,希望能够对大家落地混沌工程有所帮助。
最新评论
从二十个严重的配置故障中我们能学到什么?
阿里稳定性指标 1-5-10 解读
我们是如何将 ToB 服务的交付能力优化 75%?
跨 AZ 部署最佳实践之 Zookeeper
跨 AZ 部署最佳实践之 Zookeeper