写点什么

阿里云突发全球性严重故障,历经 2.5 小时恢复

  • 2023-11-12
    北京
  • 本文字数:1868 字

    阅读完需:约 6 分钟

大小:939.45K时长:05:20
阿里云突发全球性严重故障,历经2.5小时恢复

11 月 12 日下午,陆续有网友表示阿里旗下多款产品出现访问故障,随后【阿里云全线产品崩了】登上微博实时热搜。




据阿里云健康状态页(https://status.aliyun.com/#/)公告信息,本次故障为阿里云云产品控制台服务异常,开始于 2023-11-12 17:44。


阿里云全线产品均受影响,包括:


企业级分布式应用服务、消息队列 MQ、微服务引擎、链路追踪、应用高可用服务、应用实时监控服务、Prometheus 监控服务、消息服务、消息队列 Kafka 版、机器学习、图像搜索、智能推荐 AIRec、智能开放搜索 OpenSearch、云行情、数据总线 DataHub、检索分析服务 Elasticsearch 版、图计算服务 Graph Compute、实时计算 Flink 版、智能数据建设与治理 Dataphin、开源大数据平台 E-MapReduce、云原生大数据计算服务 MaxCompute、实时数仓 Hologres、大数据开发治理平台 DataWorks、智能媒体服务、媒体处理、视频点播、对象存储、文件存储 NAS、表格存储、日志服务、云存储网关、文件存储 HDFS 版、块存储、混合云备份服务、密钥管理服务、云防火墙、数据库审计、加密服务、运维安全中心(堡垒机)、容器镜像服务、容器服务 Kubernetes 版、API 网关、资源编排、云原生数据仓库 AnalyticDB PostgreSQL 版、图数据库、云原生内存数据库 Tair、云数据库 Redis 版、云原生关系型数据库 PolarDB、云数据库专属集群、云数据库 MySQL 版、云原生数据仓库 AnalyticDB MySQL 版、云原生分布式数据库 PolarDB-X、云数据库 ClickHouse、云原生多模数据库 Lindorm、云数据库 PostgreSQL 版、云数据库 SQL Server 版、云数据库 MongoDB 版、云数据库 HBase 版、数据传输、数据库自治服务、数据库备份、物联网平台、NAT 网关、负载均衡、云解析 PrivateZone、弹性公网 IP、共享带宽、转发路由器、私网连接、高速通道、IPv6 网关、专有网络 VPC、云企业网、VPN 网关、FPGA 云服务器、超级计算集群、批量计算、无影云桌面、弹性伸缩、弹性容器实例、弹性裸金属服务器、云服务器 ECS、轻量应用服务器、函数计算、Serverless 应用引擎、云托付、专有宿主机、GPU 云服务器、弹性高性能计算、操作审计、服务器迁移中心、运维编排、智能计算灵骏、云呼叫中心、交通云控平台、客服工作台、视觉智能开放平台、智能外呼机器人、智能语音交互、智能对话机器人、智能用户增长、运维事件中心、新零售智能助理、智能双录质检、地址标准化、机器翻译、自然语言处理、短信服务、云解析 DNS、域名、号码认证服务、邮件推送、版权与专利服务、语音服务、智能联络中心、工商财税、Salesforce on Alibaba Cloud、智能营销引擎、云采销、能耗宝、阿里邮箱、商标服务、移动研发平台、机器人流程自动化、号码隐私保护、DataV 数据可视化、音视频通信、视频直播、闪电立方、网盘与相册服务、安全、内容安全、安全管家、应用身份服务 (IDaaS)、实人认证、数字证书管理服务(原 SSL 证书)、风险识别、Web 应用防火墙、云安全中心(态势感知)、数据管理、云价签、云投屏、物联网智能视频服务、物联网无线连接服务、CDN、云数据传输、数据语音、智能接入网关、全站加速、ChatAPP 消息、全球加速、安全加速 SCDN、边缘节点服务 ENS、访问控制、资源管理、云监控、配置审计。


同时本次故障并非某一可用区的故障,而是全球大故障。受影响地域包括:


华北 2(北京)、华北 6(乌兰察布)、华北 1(青岛)、华东 2(上海)、华南 2(河源)、华北 3(张家口)、中国香港、印度(孟买)、美国(硅谷)、华南 1(深圳)、英国(伦敦)、韩国(首尔)、日本(东京)、阿联酋(迪拜)、西南 1(成都)、华南 3(广州)、新加坡、澳大利亚(悉尼)、马来西亚(吉隆坡)、华北 5(呼和浩特)、印度尼西亚(雅加达)、美国(弗吉尼亚)、菲律宾(马尼拉)、泰国(曼谷)、华东 1(杭州)、华南 1 金融云、华东 5(南京-本地地域)、华东 6(福州-本地地域)、华北 2 金融云(邀测)、华东 2 金融云、华东 1 金融云、华北 2 阿里政务云 1、非区域性、德国(法兰克福)、沙特(利雅得-合作伙伴运营)


截至发稿时,阿里云健康状态页显示所有地域、所有服务均已恢复正常运行。2023-11-12 21:11,阿里云在的最新公告中称,受影响云产品均已恢复,因故障影响部分云产品的数据(如监控、账单等)可能存在延迟推送情况,不影响业务运行。



阿里云关于此次故障事件的处理公告


关于此次故障的具体原因分析后续处理,阿里云暂未披露,InfoQ 将持续跟进报道。


相关文章推荐:


《B站宕机事故复盘:2021.07.13 我们是这样崩的》

《2022 年了,怎样才能做到真正的“永不宕机”?》

《这十个事件,让“永不宕机”变成了一个笑话》

《2018 年十大云宕机事故盘点:主流无一幸免!》


2023-11-12 21:5516024
用户头像
蔡芳芳 InfoQ主编

发布了 802 篇内容, 共 568.3 次阅读, 收获喜欢 2796 次。

关注

评论 2 条评论

发布
用户头像
天天吹微服务,其实是天大的一个单体
2023-11-15 12:12 · 北京
回复
用户头像
连续几次出现问题,应该好好想想内部到底出了什么问题。
2023-11-14 09:23 · 广东
回复
没有更多了
发现更多内容

收藏好,程序员必逛的 20 个网站

乌龟哥哥

8月月更

大数据训练营一期毕业作业

张大彪

7 天学个Go,Go 结构体 + Go range 来学学

梦想橡皮擦

Python 爬虫 8月月更

头脑风暴:最长公共子序列

HelloWorld杰少

算法 LeetCode 8月月更

Linux 的十大下载管理器,提升效率杠杠的,偷着乐吧!

wljslmz

Linux 8月月更

长安链学习 -WEB插件-SmartPlugin

Spring 全家桶之 Spring Data JPA(五)

小白

8月月更

Kubernetes是不是下一个容错域

CTO技术共享

模块九毕业设计

Geek_2ce415

Go-Excelize API源码阅读(十六)——GetSheetViewOptions、SetPageLayout

Regan Yue

Go 源码 Excelize 8月日更 8月月更

电商秒杀系统设计

intelamd

SpringBoot 快速入门(保姆级详细教程)

SpringBoot 2 8月月更

千万用户3毫秒内抽奖100名如何实现?

知识浅谈

8月月更

总结

Asha

高绩效研发团队领导者的视野和格局

顺哥聊成长

长安链学习-build_release.sh

长安链

[JS真好玩] 嘘!我改了掘金源代码!1行代码,让表格支持page_size切换,从每页10条变为20条!

HullQin

CSS JavaScript html 前端 8月月更

RT-Thread记录(十、全面认识 RT-Thread I/O 设备模型)

矜辰所致

单片机I/O设备的控制方式 RT-Thread 8月月更 设备模型

Kubernetes 集群API创建管理

CTO技术共享

Kubernetes 服务网格实现

CTO技术共享

RocketMQ高可用设计之主从复制和读写分离

急需上岸的小谢

8月月更

【LeetCode】检查单词是否为句中其他单词的前缀Java题解

Albert

LeetCode 8月月更

Spring 全家桶之 Spring Data JPA(四)

小白

8月月更

基于STM32+ESP8266设计物联网产品(重点支持微信小程序一键配网连接腾讯云平台)

DS小龙哥

8月月更

C++多态纯虚函数和抽象类与多态案例(二)

CtrlX

c c++ 面向对象 多态 8月月更

毕业总结

intelamd

云原生(二十三) | Kubernetes篇之Kubernetes 网络策略(NetworkPolicy)

Lansonli

云原生 k8s 8月月更

拜托!不要用“ ! = null 做判空了

TimeFriends

8月月更

如何在 SAP Spartacus 中编写 ASM-Compatible 的代码

汪子熙

angular SAP Hybris Spartacus 8月月更

Spring 全家桶之 Spring Data JPA(三)

小白

8月月更

【LeetCode】最大二叉树Java题解

Albert

LeetCode 8月月更

阿里云突发全球性严重故障,历经2.5小时恢复_阿里巴巴_蔡芳芳_InfoQ精选文章