【Monado故障报告2024.03.20】
本站于3月20日约00:45 (UTC+8) 开始出现网络中断,在14小时后于约14:45恢复服务。本次故障为VPS服务商问题,因此造成的不便我们深感抱歉。
·故障时间线
约00:45: 网站开始出现超时,且无法通过SSH/VNC/服务商控制面板连接到VPS
00:58: 向服务商Contabo发送邮件反应
14:44: VPS重启,开始恢复服务
15:39: 向Contabo发送第二封邮件询问具体情况
现在: 未收到回信。服务商控制面板报告"We are currently facing an issue for the host system of this VPS. Our technicians will take care about the issue as soon as possible and we kindly ask for your patience."
·故障原因猜测
由于服务商尚未回信,我们只能根据以往发生类似问题的原因进行猜测。
2022年3月30日: "There is or has been an issue with the V-Host. A reboot took place for this V-host at 30.03.2022 07:18. (AMD-Vi Completion-Wait loop timed out)"
宿主机运行时发生崩溃,服务商发现后物理重启
2023年8月26日: "We have experienced some disruption in the Data Center where your servers are located."
宿主机所在的数据中心发生故障
我们发现VPS于14:44重新启动,因此猜测本次故障可能是由于宿主机出现异常高负载或硬件故障,导致 VPS 请求无法处理,同时服务商控制面板和 VNC 无法与宿主机通讯。虽然大部分请求超时,但仍有个别请求成功处理,表现为在故障期间有小概率成功访问或发嘟。最后,服务商进行物理重启(和其他操作)以解决问题。