微软数据中心故障 新加坡多个机构网络服务中断

微软数据中心故障新加坡多个机构网络服务中断新加坡多个机构的网络服务星期三(2月8日)因数据中心故障中断,受影响的包括新加坡中央公积金局、易通卡公司、新加坡滨海艺术中心和南洋理工大学。发生故障的是微软云端服务平台Azure东南亚地区的数据中心。根据Azure网站上的声明,数据中心星期三上午3时19分发生电流突波(powersurge),使得一部分冷却单元无法运作,数据中心的温度也在抢修过程中升高。为了避免硬件损坏,工程师决定主动关闭部分计算和存储设备,这导致多个下游服务受到影响。直至昨日晚间10时,Azure宣布数据中心的冷却系统已经成功修复,并开始逐步有序地重启之前关闭的设备。投稿:@ZaiHuabot频道:@TestFlightCN

相关推荐

封面图片

【数据中心Equinix出现问题导致新加坡境内多个银行服务瘫痪】

【数据中心Equinix出现问题导致新加坡境内多个银行服务瘫痪】2023年10月15日02点12分老不正经报道,10月14日新加坡星展银行、花旗银行等在新加坡全境瘫痪,部分客户无法登录网上银行服务或使用ATM和其他支付服务。星展银行表示,服务中断是由数据中心的问题造成的,社交媒体上的一些网友表示,他们在使用Meta的Facebook、Instagram和WhatsApp以及花旗银行的服务时遇到了问题。数据中心Equinix表示因为其技术问题影响了包括星展银行在内的一些客户的运营,并且正在调查。

封面图片

Cloudflare 服务受数据中心断电影响,影响多个服务。

Cloudflare服务受数据中心断电影响,影响多个服务。Cloudflare发布故障通告表示,正在评估断电对数据中心的影响,同时对服务进行故障转移。并正在努力解决这个问题。该事件影响多个服务在dataplane/edgelevel出现故障:Logpush、WARP/ZeroTrustdeviceposture、Cloudflare仪表板、CloudflareAPI、StreamAPI、WorkersAPI、警报通知系统。部分在controlplane/corelevel受到影响,这意味着只有现有配置的更改受到影响,但产品在边缘运行:MagicTransit,ArgoSmartRouting,WorkersKV,WAF,RateLimiting,Rules,WARP/ZeroTrustRegistration,WaitingRoom等。——

封面图片

Azure出现设备故障时 微软在澳大利亚数据中心园区只有三名员工

Azure出现设备故障时微软在澳大利亚数据中心园区只有三名员工该报告揭示了一些企业完全失去服务的原因:在此次事故中,许多存储节点被主动关闭或组件烧毁,以至于数据及其所有副本都处于离线状态。此外,在存储节点最终恢复后,托管25万多个数据库的"租户环"也发生了故障,尽管对客户的影响并不均衡。微软表示,两个受影响数据大厅的冷却能力"由七个冷却器组成,其中五个冷却器处于运行状态,两个冷却器处于备用状态(N+2)"。电源下陷(电压骤降)导致五个运行中的冷却器出现故障。此外,只有一台备用机组工作。微软表示,现场工作人员"执行了我们记录在案的应急操作程序(EOP),试图使冷却器重新启动,但没有成功"。该公司似乎被此次事件的规模吓到了,现场没有足够的工作人员,而且其应急程序也没有考虑到问题的规模。公司表示:"由于数据中心园区的规模,夜间团队的人员配备不足以及时重启冷却器。在更好地了解根本问题并采取适当的缓解措施之前,我们已暂时将团队人数从3人增至7人。"关于其EOP,微软表示"对于影响半径如此之大的事件而言,重新启动冷却器的EOP执行起来比较缓慢。""我们正在探索改进现有自动化的方法,以提高对各种电压骤降事件类型的应变能力。"虽然没有足够的员工来执行记录在案的程序,但如果有更多的员工,就能更快地达到同样的效果,因为冷水机组本身就存在问题。初步调查显示,冷水机组没有自动重新启动,"因为相应的泵没有从冷水机组获得运行信号"。"这一点非常重要,因为它是成功重启冷水机组不可或缺的因素,"微软公司表示。"我们正在与我们的OEM供应商合作,调查为什么冷却器没有命令各自的泵启动。"由于冷冻水回路温度已超过阈值",因此无法手动重启故障冷水机组。随着温度的升高,以及基础设施发出的热警告,微软别无选择,只能关闭服务器。这成功地使冷却水回路温度降至所需阈值以下,并恢复了冷却能力。不过,并非一切都能顺利恢复。这次事故影响了七家存储租户,其中五家为"标准"租户,两家为"高级"租户。微软表示,一些存储硬件"因数据大厅温度过高而损坏"。由于存储节点处于离线状态,因此无法进行诊断以排除故障。"因此,我们的现场数据中心团队需要手动移除组件,并逐一重新安装,以确定是哪个(些)特定组件导致每个节点无法启动,"微软说。"为了成功恢复数据和恢复受影响的节点,需要更换多个组件。还需要在个别服务器中临时重新安装一些原始/故障组件。"基础架构即代码自动化也出现故障,"错误地批准了过期请求,并将一些健康节点标记为不健康,从而减缓了存储恢复工作"。微软表示,托管25万多个SQL数据库的租户环的故障进一步减缓了恢复速度。该公司表示:"当我们试图将数据库从性能下降的环路中迁移出来时,SQL手头并没有经过良好测试的工具,而这些工具是为在源环路处于性能下降的情况下迁移数据库而构建的。很快,这就成为我们减轻影响的最大障碍。"最终的PIR预计将在几周内完成。...PC版:https://www.cnbeta.com.tw/articles/soft/1381623.htm手机版:https://m.cnbeta.com.tw/view/1381623.htm

封面图片

微软Azure数据中心故障,新加坡多个机构网络服务中断https://www.zaobao.com.sg/realtime/singapore/story20230208-1361135也是冷气故障

封面图片

微软将在泰国开设首个Azure区域数据中心

微软将在泰国开设首个Azure区域数据中心该公司在一份声明中表示:“该数据中心区域将扩大微软超大规模云服务的可用性。”纳德拉在泰国首都曼谷的一次活动上说:“这意味着,你不仅在泰国拥有Azure的全部能力,而且拥有世界一流的AI基础设施。”微软在声明中补充说,泰国数据中心还将有助于提高企业级的可靠性、性能,并符合数据驻留和隐私标准。...PC版:https://www.cnbeta.com.tw/articles/soft/1429267.htm手机版:https://m.cnbeta.com.tw/view/1429267.htm

封面图片

韩数据中心发生火灾致多个网络平台瘫痪 科技部长官致歉

韩数据中心发生火灾致多个网络平台瘫痪科技部长官致歉当地时间15日,韩国SK公司C&C板桥数据中心发生火灾,导致包括韩国最大的移动通讯应用程序KakaoTalk在内的若干服务出现中断。16日,韩国科学技术信息通信部长官李宗昊就此事致歉。PC版:https://www.cnbeta.com/articles/soft/1327631.htm手机版:https://m.cnbeta.com/view/1327631.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人