时隔一个月,谷歌云再度发生故障,在 us-east1 遇到云网络问题。截至当日下午 16:05 分,公告显示问题仍然存在,部分用户依旧会感到延迟。
美国时间 2019 年 7 月 2 日,谷歌通过官方网站更新公告称 us-east 1 区遇到云网络问题,主要是网络和负载均衡问题,谷歌在努力制定解决方案。直到下午 16:05,谷歌云给出的公告表明服务仍然没有完全恢复,部分用户依旧会感觉到延迟。
根据公告,谷歌云此次出现故障的主要原因是光纤物理损坏。在此期间,谷歌会选择性重新路由用户流量,以确保用户服务继续可靠运行,直到受影响的光纤路径得到修复。
修复细节
2019 年 7 月 2 日 10:25(美国时间),谷歌发布公告表示在 us-east1 中遇到云网络问题,目前问题已经得到缓解,正在努力制定解决方案,用户可能仍需要通过全球负载均衡器观察流量。
上午 11:35,谷歌的工程团队正在进行修复工作,以解决 us-east1 中的 Google 云网络和负载平衡问题,错误率正在下降,但是一些用户可能仍然注意到延迟增加。
下午 14:31,谷歌云网络和负载平衡中断由 us-east1 中为网络路径提供服务的多个并发光纤物理损坏导致。谷歌选择性重新路由一些流量,以确保客户服务能够继续可靠运行,直到受影响的光纤路径得到修复。在此期间,一些客户仍然会观察到延迟增加。
直至下午 16:05,部分用户仍然会感到延迟增加。
据悉,谷歌 6 月初也曾发生故障。当时,不少网站和服务均遭到破坏,其中包括谷歌旗下服务以及非谷歌服务。据不完全统计,Snapchat、Vimeo、Shopify、Discord、Pokemon GO,以及谷歌的大部分服务,比如 YouTube、Gmail、谷歌搜索、G Suite 等均受到影响。
据了解,在 6 月初的故障中,美国东海岸用户率先出现问题,但宕机监控器 DownDetector 的报告表明,可能有更多地区受此影响。当时,曾有谷歌员工在 HackerNews 中表示,本次故障非常严重,以至于谷歌内部工程师相互沟通的工具也受到了影响,这让恢复工作变得更加困难。从目前曝光的信息来看,故障主要与Level 3中断有关,这是一家总部位于美国的 ISP,为谷歌数据中心提供连接和各种其他服务。
相比较而言,本次故障的受影响范围较小。但是,作为一家重要的云厂商,谷歌云未来还是应该努力降低故障发生频率,同时提醒所有云上用户做好安全措施。云计算让广大用户能以更低廉的成本灵活利用云中的各种资源,但是一旦“云”出现故障,就会牵一发而动全身,造成较大影响。
评论