镜像站所在的超算集群无预兆停电

4月23日19:00

综合工程师和监控,镜像站所在的“太乙”超算集群于4月23日晚18:15左右中断。这次断电造成了镜像站所在服务器的关机。

预估影响

服务 状态
镜像站(内网) 有限度服务
镜像站(公网) 有限度服务
git 恢复服务
sharelatex 有限度服务
send 有限度服务
静态文件托管(校巴) 恢复服务

4月24日20:00

服务故障时间已超过24小时,本年度总体SLA已经低于99.9%

接工程师通知,本次故障的原因为学校配电设施损坏,超算集群(包括镜像站)将于不晚于25日恢复。

4月25日14:00

工程师通过临时电源开启镜像站,镜像站将在18:00前尽可能迁移数据。

4月25日20:00

由于电源修复时间无法预估,工程师将在近期使用“启明”集群的电源为镜像站供电。

镜像服务,sustech send,软件下载等服务已经陆续恢复。

为保证数据安全,sharelatex服务在电源维修完成前,将会一直在备份机器上运行。

4月30日18:00

镜像站供电现已恢复,主要服务将在五一假期结束前完全回复正常。