点击围观!腾讯 TAPD 助力金融行业研发提效、敏捷转型最佳实践! 了解详情
写点什么

“闰年虫”引发 Windows Azure 中断

  • 2012-03-03
  • 本文字数:1050 字

    阅读完需:约 3 分钟

微软 Windows Azure 云平台若干子区域受“闰年虫”影响致许多客户 12 至 24 个小时无法使用服务。

根据 Windows Azure 服务仪表板显示,从 UTC 时间 2 月 29 日凌晨到 3 月 1 日早上,大量的子区域服务和全球性服务发生了超过 24 小时的中断。以下是受影响的服务:

  • Windows Azure 计算服务(Compute Service)部分出现故障,6 个子区域中有 4 个出错,共影响了美国中北部区域 6.7%、美国中南部 28% 以及北欧区域 37% 的托管服务。另外,Azure 的一些其他服务也受到了波及,包括:访问控制 2.0(Access Control 2.0)、市场(Marketplace)、服务总线(Service Bus)以及访问控制 & 缓存入口(Access Control & Caching Portal);
  • 美国中南部区域的服务总线中断超过 24 小时;
  • 位于美国中南部的市场也部分受到了超过 12 小时的影响,特别是那些需要 OAuth 访问的服务。
  • 2012 年 2 月 29 日触发的某个证书问题导致服务管理(Service Management)服务在全球性范围内受到影响。一些区域约 12 小时无法正常访问,其他区域超过 24 小时无法正常访问。

存储、CDN 和其他服务似乎并未受到影响。 而平台管理入口(Platform Management Portal)由于另外一个不同的问题,导致 3 月 1 号全球范围内受到大约 3 小时的影响,其原因是因为“后台某个设置被配置错误”。

微软负责服务器和云服务的副总裁 Bill Laing 简要通报了 Azure 客户此次中断及其原因。据 Laing 描述,Azure 团队在太平洋标准时间 2 月 28 日下午 5:45,即 UTC 时间 2 月 29 日上午 1:45 意识到该问题。而问题的罪魁祸首是由 2 月 29 日这个特殊日子触发的一个软件 bug。

这个问题迅速被触发并确定起因是一个软件 bug。虽然根本原因分析还在进行当中,但是问题看起来似乎是对闰年的时间计算不正确所致。

赛门铁克报告说,闰年虫影响了他们6.1 版本的软件交付。Inedo 合作伙伴Alex Papadimoulis 报告说,他们的一些客户受到了影响。此外,新西兰一些销售设备也发生了故障

虽然这个bug 对小公司多少可以接受,但是对于微软着实有些尴尬,特别是因为它影响了客户托管在微软云平台上的服务。有意思的是,如此之小的事情竟然够弄垮这么大的计算平台,同样一年前亚马逊也发生过这样的事情:在美国东部区域的 一块可用区流量被错误地转到一个无法处理这些流量的低级别的路由中,影响了几个EBS(弹性块存储,Elastic Block Storage)结点,并最终导致了整个区域的垮掉。我们可能还会看到此类中断事件,毕竟“人非圣贤,孰能无过”。

查看英文原文: http://www.infoq.com/news/2012/03/Azure-Blackout-Leap-Year-Bug

2012-03-03 05:551438
用户头像

发布了 125 篇内容, 共 33.4 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

数据行业中的建模是什么?

清林情报分析师

数据分析 行业分析 数据建模 业务思维 模型思维

深入 HTTP/3(2)|不那么 Boring 的 SSL

SOFAStack

互联网 TLS HTTP3.0 QUIC协议 HTTP API

技术立根,行业立范,发展立本:中国工业互联网的2.0新征程

脑极体

百度智能小程序巡检调度方案演进之路

百度Geek说

PingCAP Clinic 服务:贯穿云上云下的 TiDB 集群诊断服务

PingCAP

前沿聚焦:2022最受关注的六大技术热词,你都知道吗?

华为云开发者联盟

零代码 NFT 数字人 元宇宙 云边端协同

Kube-OVN v1.10.0:新增Windows节点支持,用户自定义子网ACL等10+硬核功能

York

云原生 网络 cni

Java Core「4」java.util.concurrent 包简介

Samson

学习笔记 5月月更 Java core

企业的文档管理策略

小炮

文档管理

HDFS 细粒度锁优化,FusionInsight MRS有妙招

华为云开发者联盟

hdfs NameNode 元数据 FusionInsight MRS FGL

Kernel SIG直播:关于 Plugsched 调度器热升级 | 第 18 期

OpenAnolis小助手

Linux 直播 内核 sig 龙蜥大讲堂

为什么穷人越穷,富人越富?

大数据梦想家

程序人生

大数据学习必备 | 推荐几个牛X 的 github 项目,助你事半功倍

大数据梦想家

大数据 学习资料 Github'

聚焦无障碍阅读,福昕捐出2000套福昕高级PDF编辑器

联营汇聚

末流985,秋招斩获多家大厂offer 经验分享

大数据梦想家

面经分享 大数据开发

又一国际知名律师事务所选择福昕PDF

联营汇聚

Scrum实施的8个步骤

PingCode

vue + electronの文件读写

空城机

Electron 5月月更

使用 awk 命令统计文本

程序员小航

后端 awk Linxu

6月月更“粽”头戏,大家一起来参与吧!

InfoQ写作社区官方

热门活动 6月月更

Linux 使用 cp 命令强制覆盖功能

AlwaysBeta

Linux 运维

IoT技术的最后决战!百万大奖究竟花落谁家?

华为云开发者联盟

IoT 华为云 iotda NSBD-IOT

平衡人工智能的性能要求,实现可信AI在银行业务场景的高质量应用

易观分析

人工智能

7 款最棒的开源 React UI 库测评 - 特别针对国内使用场景推荐

蒋川

JavaScript react.js 开源 UI 组件库

十一、云原生网络微隔离

穿过生命散发芬芳

5月月更 微隔离

「v2.4」千呼万唤的图形化编排,来了!

Jianmu

持续集成 低代码 开发工具 开源项目 节点编排

eKuiper 1.5.0发布:实现无缝式工业数据采集+边缘流处理

EMQ映云科技

物联网 IoT emq 开源之夏 5月月更

云原生时代,热门监控工具对比与使用场景分析

云智慧AIOps社区

云原生 监控 Grafana Prometheus 监控宝

英特尔开源项目推动SYCL标准采用,打破单个厂商封闭生态系统

科技之家

TiDB 查询优化及调优系列(四)查询执行计划的调整及优化原理

PingCAP

开发一个社区网站,只要20分钟?

华为云开发者联盟

ide 敏捷开发 devcloud 网站开发

“闰年虫”引发Windows Azure中断_Azure_Abel Abel_InfoQ精选文章