大毛子的硬盘修复软件Victoria,帮我的HGST找回了青春

作者:once375ml

为了讲述修复过程,先说下背景:

我在某宝上一共购买了三块HGST 6T

第一块,HGST 6T 氦气盘,购于LXSM,购买日期2020年10月6日,店保2年,用于DS218,昨天(2023年4月29日)在更换DS218的第二块硬盘时没有按规定操作,第二块初始化时,把HGST 6T 氦气盘搞崩了,提示系统分区无法读取,SMART 05显示4个扇区坏道,C5显示12个不稳定扇区。

第二块,HGST 6T 氦气盘,购于HCKJSM,购买日期2021年08月30日,店保2年,用于DS216+II,挂于2022年12月08日,第一天2个坏道,第二天10个坏道。

第三块,HGST 6T 空气盘(怕了上面的氦气盘了,所以买的空气盘),购于HCKJSM,购买日期2022年12月10日,店保2年,用于替换上述第二块6T 氦气盘的,当时未想到第二块盘的保修。Basic改RAID将数据同步过来后,RAID再改Basic。倒腾数据的过程中无意发现购买第二块盘还在保,联系店主后,很爽快的答应保修了,因为氦气盘故障了,为了保险,要求返一块HGST 6T 空气盘。

想知道群晖RAID无损降级位Basic的自己搜:mdadm --grow --raid-devices=1 --force /dev/md2,我已测试可行,这个不是今天重点,不详述了

截止于2023年4月29日的“现状”:

第三块盘,HGST 6T 空气盘,正常,替换后一直服役于DS216+II,但是存储管理器显示 UNKNOWN HUS726060ALE611,正常应该是显示HGST HUS726060ALE611,估计是退役盘,销售商为了避免麻烦,刷了固件,不显示OEM商了,可以添加个任务,每次启动后用root用户修改下Vendor就能正常显示了:

echo -n "HGST" > /run/synostorage/disks/sda/vendor

第二块,返修回来的HGST 6T 空气盘,群晖也显示UNKNOWN HUS726060ALE611,闲置,近期用于DS116,但是每次DSM重启会导致C7暴增。在这期间,我将HGST 6T 空气盘挂到Win 11下反复重启,没有问题,说明HGST 6T 空气盘没有问题;换了WD 320G安装DSM系统,正常,说明DS116没问题,升级DSM到7.2 RC,还是暴增。郁闷了一天,最后dmesg查看,是NCQ和DS116的Linux内核不兼容,写了ticket给群晖,已经回复我了。

第一块,HGST 6T 氦气盘,SMART 05=4,C5=12。

总结:

第一块,HGST 6T 氦气盘,SMART 05=4,C5=12,群晖正常显示HGST HUS726060ALA640

第二块,返修回来的HGST 6T 空气盘,因为系统兼容性原因,不是盘质量问题,SMART C7暴增中,群晖显示UNKNOWN HUS726060ALE611

第三快,买回来导数据的HGST 6T 空气盘,正常,群晖显示UNKNOWN HUS726060ALE611

Victoria 5.37上场,建议用5.37的英文版,汉化版容易出问题:

对于第二块SMART C7的盘,Victoria 的Service里,选HGST Vendor Specific,设置SATA III,再SMART int,就可以把C7重置了,但是对于SMART 05,通电时间,写入量,磁头启停次数等,则无法重置。这里忘记截图了

对于第一块SMART 05的盘,第一步,因为已经出现05了,说明磁盘的磁性已经有些不稳定了,要把不稳定的区域找出来,所以用“Test and Repair”,设置:全盘扫面,Read模式,timeout=50ms(你也可以设置成100,150,建议不要超过250ms),Remap,意思就是全盘读取,遇到超时达到50ms的视为坏道,Remap进G表,我6T的盘,用时11小时34分。

第二步,等第一步完了,还是进Service,选HGST Vendor Specific,然后Low Format,这时会提示硬盘被Freezen,不要紧,先拔掉SATA线,这是防止万一有数据传输时拔电源,磁头硬着陆,再拔掉SATA电源线,稍微等1-2分钟,等硬盘完全停下来;再先插上SATA电源线,等1-2分钟,让硬盘达到转速(5400 or 7200),后插上SATA数据线。点了Low Format后,系统任务管理器看不到该盘的任何读写,所有硬盘工具软件(DG,傲梅,包括Victoria)软件无法打开,已打开的任意操作均卡死,但是机箱的硬盘指示灯提示一直在读写,有人说:即便拔掉SATA数据线也不影响(我没试,也不建议试),这个Low Format是硬盘固件的功能,是底层操作,不需要数据线。所有硬盘工具软件卡死的直接叉掉即可,不影响低格。

这个过程没有输出,耐心等,等的时间是你上面扫盘的时间+1小时(你写一页纸总是慢于读一页纸,对吧)。低格完成的标志就是你机箱硬盘灯不长亮了。

切记不要断电,断电后会找不到硬盘!切记不要断电,断电后会找不到硬盘!切记不要断电,断电后会找不到硬盘!

这个过程会把SMART 05清掉(G-list写进P-list),同样这个也可以消除05 C5 C7,但是通电时间,磁头启停次数等无法重置。

这是12多个小时后,修复完的,顺便也证个伪吧:SMART的序列号和盘体标签不一样……

至此,HGST复活了,有了这个软件后,大家大胆的买HGST,来了先扫,太差的直接退,不太差的,timeout设置小点,把潜在坏道全部找出来,remap进G表,然后low format,G表转P表。6T的盘,就算你有100MB的坏道,修复后也基本没什么影响。

修复过的硬盘,装入群晖可以正常安装系统,但是无法正常创建存储空间,这时运行一次快速“快速检测”


下一篇:如何恢复Hyper Backup备份的数据