一次失败的群晖(Synology)NAS 硬盘更换扩容

发布时间 2023-12-15 05:16:45作者: huyuchengus

对更换硬盘和扩容的时间知道要比较长,但是没有想到要这么长,同时还比较困难的获得更新的数据。

既然闲着也是闲着,并且每天都会查看下状态,所以就想着干脆记录下了。

需要有心理准备就是扩容和存储池的修复时间的单位不是分钟,也不是小时,而是天。

升级扩容计划

这次升级扩容的计划是准备替换到存储池有坏扇区的一块硬盘,并且新增加一块硬盘。

查询可以支持的硬盘。当前 NAS 的硬盘大小都比较大的,对于一些运行时间比较长的 NAS,不是所有的硬盘容量都支持的。

因此需要做下功课,你的 NAS 最大能支持到多大,可以到网站:Compatibility List | Synology Inc. 上根据你的型号进行查询下。

另外,不同的 NAS 对于独立卷可以扩展的大小也有限制的,不是无限扩展的,因此也需要注意下。所以在更换 HDD 的时候也不是越大越好。

 

 

因此,根据我们的情况,这次我们选择更换的硬盘就更换到最大的 14TB,以满足独立卷的需求。

第一块硬盘更换

第一块硬盘的更换和存储池修复扩容都比较快,在 2 天内就完成了。

在这块硬盘更换的的时候没有什么大的问题,存储也都可以正常使用,也能访问控制台界面

第二块硬盘更换

第二块硬盘更换的时候问题就非常多了。

首先的问题是耗时,在我们写这篇文章的时候,硬盘更换的校验时间已经超过 5 天了,还没有结果,同时我们也没有办法访问控制台界面来查看校验进度。

在这个校验的过程中,所有的后台进程都被锁死,无法提供任何服务,感觉还是有点郁闷。

但是我们也想到了一些办法能够跟踪进度。

访问控制台界面

如果在校验的过程中,你不能够打开控制台界面,没有关系,千万不要以为你的 NAS 已经死机了,然后尝试重启 NAS。这个会导致存储池崩溃,然后需要重新组织阵列,并且还会导致某块硬盘可能无法加入整列。

如果你的控制台界面在访问的时候,没有提示任何,就是不显示,或者一直显示在旋转,你需要做的就是耐心等待,千万别手欠去重启整列。

掉电

在对存储池进行修复的过程中,如果掉电,那么会有一大堆的问题,你可能需要面临重新来一次,前面做的所有工作都无效了。

因此,如果有条件的话,这个时候最好还是挂上 UPS,千万不要因为掉电而损坏存储池导致数据丢失,然后重新再来一次。

邮件

如果你的存储池修复的过程中有任何信息,那么你会收到邮件的通知的。

 

 

比如说,我们收到了电子邮件说我们的第 7 块硬盘有坏的扇区,我们这次更换硬盘郁闷的地方就在这里,这里说的第 7 块硬盘实际上就是我们前几天换上去的新硬盘,这运气实在是太好了。

虽然硬盘都在保质期内,都是可以换的,但是我们现在也没有办法把这个硬盘换下来进行更换,只能等存储池扩容完成后再说吧。

扩容开始

在经历过上面一堆重启乱七八糟的过程后,我们决定不再手欠的重启,让 NAS 自己修复吧。

这次扩容修复开始的时间是:2023年11月26日,4:21PM

2023年12月01日

在今天的凌晨 3 点多钟,又收到了第7块硬盘的坏扇区报警,然后存储说有关这个坏扇区已经被修复了。

虽然我们现在还不知道整体的进度,但是好在收到邮件就表面新加硬盘的扩容和校验还在继续过程中。

就是这过程太难熬了,到现在已经是第五天了,问题还是不知道那天是个头。

下午:5:21PM 的时候,NAS 系统再次提示了发现坏的扇区,实在是对这个新加的硬盘有点无语了。

2023年12月02日

今天检查了下当前硬盘修复的情况,感觉还是在修复存储池的过程当中。

然后找了一个当前的文档:How long does it take to expand or repair a storage pool, or change its RAID type? - Synology Knowledge Center

 

 

添加硬盘的速度是在 30MB/s 或者 10 MB/s 的情况,就算没有其他服务运行,那么 10TB 的硬盘需要差不多 97 个小时,那么 14TB 可能需要的是150 个小时,换算下时间是 1 周。

如果有其他程序运行,那么会降速到 10MB/s 就是1 周的 3 倍,那么可能需要整整 3 周的时间才能完成硬盘的添加。

并且这 3 周还不能掉电,如果掉电,一切重来。

从来没有感觉到 UPS 对现在的情况是这么急迫。

到本周日的下午正好为 1 周,如果能完成校验,则说明差不多是按照 30MB/s 进行校验的,如果不能完成,那么基本上可以确定是按照 10MB/s 进行校验的,那么还需要等 2 周。

【2023-12-02T9:34 PM】系统提示:第 7 块硬盘有坏的扇区,并已经修复。

2023年12月03日

系统还是在进行存储池的修复过程中。

【2023-12-03T5:31 AM】系统提示:第 7 块硬盘有坏的扇区,并已经修复。

这第 7 块硬盘实在是有点闹心,现在也看不到修复存储的进度,只能是等呀等。

不知道今天这系统抽了什么疯,居然能够让我登录了控制台的磁盘管理界面,虽然也是很长时间没有相应,但是好歹能上去看看了。

当上去看的时候,发现进度根本没有动,并且第 7 块硬盘还在报扇区错误的警告。

 

 

手动点了下 Ignore 了进行忽略,然后就没有响应了。

还是让硬盘修复自己进行吧,已经进行一周了,还是不要手欠为好。

2023年12月04日

【2023-12-04T8:59 AM】系统提示:第 7 块硬盘有坏的扇区,并已经修复。

2023年12月05日

暂未收到任何有关系统异常的警报,但系统能偶尔让登录下管理员控制台,查看了下修复进度,修复进度基本上没有动。

但是偶尔会收到硬盘的声音和有关硬盘的警报,所以认为当前的修复还是在进行当中的。

再等等时间再看看吧。

2023年12月06日

暂未收到任何有关系统异常的警报,但系统能偶尔让登录下管理员控制台,查看了下修复进度,修复进度基本上没有动。

2023年12月07日

【2023-12-07T10:52 AM】系统提示:第 7 块硬盘有坏的扇区,并已经修复。
【2023-12-07T11:01 PM】系统提示:第 7 块硬盘有坏的扇区,并已经修复。

2023年12月08日

暂未收到任何有关系统异常的警报,但系统能偶尔让登录下管理员控制台,查看了下修复进度,修复进度基本上没有动。

备份数据后重建

因为硬盘的故障,实在是没有办法再继续下去了。

只能备份数据后重建存储池了,在这个过程中有部分数据丢失了,不过好在大部分的重要数据都找回来了。

强烈提醒:当你准备对存储池进行扩容之前,备份好数据,这次我们是干脆备份到磁带上面去了。

 

https://www.isharkfly.com/t/synology-nas/15150