RAID5故障引起共享盘丢失?看我如何快速恢复

IT狂人日志 2024-04-17 09:48:06

接到客户微信报修,说是共享盘断开,也就是网络驱动器丢失了,显示为红色的叉,无法连接。

我们的技术人员通过堡垒机,也无法登录该服务器。

那就只能驱动前往了,到了客户机房,只看见服务器是在蓝屏状态。

重启后,又出现“你的电脑出现问题,需要重启……”,此时发现,0号磁盘为黄灯,顿时有种不祥的预感。

耐心等它跑完,重启服务器,没有看到CTRL+R进入阵列卡管理界面的提示,所以就按F2进入设置界面,然后再找到阵列卡配置,查看硬盘状态。

很明显,0号磁盘确实坏了,好在是RAID5,应该不至于丢失数据。

退出设置,尝试启动操作系统。

不出所料,系统还是可以进入的,看了一下文件资料,应该没有丢失,通知客户,共享盘暂时已恢复,同时申请一块硬盘。

3T的硬盘不好找了,直接上块4T的SAS 7.2K。注意,此时服务器不要关机,直接拔掉旧硬盘,插入新的硬盘就可以了,RAID5会自动重建的。

新硬盘插入后,状态显示正常,根据经常,RAID5正在重建中。

由于这台旧服务器前期没有配置iDRAC,此时又不方便再重启,所以直接在系统里安装DELL OpenManage System Management Software,也一样能看到RAID5同步状态,当时并没有截图,以下是为了写文章,后补的图片。

从时间上日志可以看到,12:37拔出坏硬盘,12:51新硬盘接入,RAID开始重建,到晚上19:56,RAID5重建完成。

顺便说一句,在Windows Server中可以通过DELL OpenManage System Management Software来配置iDRAC,修改IP地址,修改密码等。

然后就能通过浏览器,访问iDRAC,实时查看服务器状态,以及配置邮件告警等功能。

下图1是服务器物理磁盘的状态,目前状态良好;下图2是服务器虚拟磁盘的状态,可以看到两组RAID5磁盘当前都是正常的了。

至于,邮件告警功能,配置也不难,看图片便知。

第一步,配置发件服务器及相关信息;

第二步,配置收件人,注意,当然可以是多个收件人;

第三步,设置报警的内容;

下次服务器再有什么故障,你就能收到邮件了,能在很大程度上防患于未然,尤其是硬盘故障,早点知道,能避免数据丢失的损失。

当然了,能部署Zabbix或者Prometheus这类实时监测软件,那就更好了,凡是我们长期服务的客户,基本上都在我们的监测之中,我们平时远程,也基本上是通过堡垒机完成,毕竟,安全第一嘛。

7 阅读:249
评论列表
  • 2024-04-17 19:01

    当年不懂raid,服务器出了故障,百度着修复的。无论怎么尝试服务器都起不来,已经准备连夜叫车送广州了。[呲牙笑][呲牙笑][呲牙笑]

    IT狂人日志 回复:
    下次发到苏州吧
  • 硬raid你系统有那么重要?重要的是数据吧。软raid留热备多简单。另外硬raid做5我本身就不可理解

  • 2024-04-22 20:21

    普通台式主板自带的raid硬盘坏了需要关机换硬盘吗

    IT狂人日志 回复:
    那只能关机换硬盘

IT狂人日志

简介:网络工程师,从事IT行业20年,写点原创技术类文章