故障注入(Fault Injection)的概念最早出现在测试领域,通过在代码路径中引入故障缺陷来验证错误处理的逻辑的有效性,提高测试的覆盖率。故障注入历史可以追溯到 1970 年,按类型也分为硬件实现故障注入(HWIFI)和软件实现故障注入(SWIFI)。
混沌工程的实验理论在 2017 年被 Netflix 及相关团队提出,目标是希望通过在生产环境周期性引入故障的方式,验证系统对非预期故障防御的有效性。相比于被动的应对故障,在可控的影响下实施混沌工程实验,提前揭示系统弱点,可以增强我们对系统可恢复性的信心。混沌工程属于一个新兴的技术领域,行业认知和实践积累比较少,大多数 IT 团队对它的理解还没有上升到一个领域概念。
评论