关于西数SMR盘故障率高问题大致说明:
目前市场上板号为2060-8000XX(统称800系列),大部分为SMR盘,此类盘由原先的垂直记录方式转向叠瓦记录方式,从而出现第二级翻译器(动态模块190,189模块为索引),硬盘要正常工作,190模块也要正常。
西数(WD)的二级译码表对应的模块文件为190模块,但190模块过大,1-5T移动硬盘在97-100M左右,而台式机硬盘是在120-2230M左右(或者有更大),相对应占用的扇区数为190000-460000S。占用的扇区数增大、磁道多,加之叠瓦式,坏一个扇区可能导致附件的扇区一起损坏,从而导致190第二翻译器不能正常工作,硬盘无法识别、提示格式化、未初始化、I/O口报错等故障。反之,看看老款PMR盘,不存在第二翻译器,31模块也很小,400KB左右(不到1M),占用的扇区、磁道小,由于坏扇区引起的连锁反应,可能不会波及,所以故障率低!而且对于新款盘,第二翻译器190时而改变,也增加了故障率。
对于没有原始190,大部分的二次恢复,都是只能按RAW格式恢复【文档、表格、图片、视频归类】,没有原始分区信息以及目录MFT。不过对于换头底层为00,及190模块有损坏、部分读取正常等,在没有重建的写新的190情况下,可以采用T2修复,从而得到原始分区信息MBR以及目录MFT。
所以一般二次恢复的SMR费用往往很高,而190的完整率有着决定性!
同时接触到不少台式机WD2TB、WD4TB,电路板号为2060-800077、2060-810011,这类盘190发生故障后,通电情况下会反反复复的起转停转。在换解密板读取出来后,发现190模块发生变化,大部分扇区有类似故障错误记录。我们如果将其全部填00,硬盘是可以正常认盘,但是无法正确访问数据区;或替换其他好盘的190模块,也能正常认盘。因此确定了是因为190模块损坏导致的硬盘反复断电上电【起转停转】的故障。
一,190模块的作用:
用于记录LBA对应的物理位置(磁头,柱面,扇区),即实现对逻 辑地址与物理地址的转换。由于WD已经有31模块负责此项转换工作,因此190模块被称之为二级译码表,简称T2。
二,文件头部结构(地址:0):
0-3:文件头版本“ROYL”
4-4:文件头类型,1=通用的,2=PS,3=Overlay,4=Flash
5-5:保留,未使用。
6-7:文件头大小
8-9:模块ID(0x190) 0x0A-0x0B:模块扇区数的低16位。(由于模块长度超过了16位范围,因此高位未 记录)
0x0C-0x0D:未使用(其它模块中为校验值)
三,TIS数据(地址:0xE3D000)
数据开始地址并非固定,不同家族地址不一样。
TIS头部(0xE3D000)
0-2:TIS标识
0x10-0x11:当前TIS扇区地址。
TIS数据(0xE3D000 + 0x200)
0-3:块大小
4-7:块个数
~:TIS数据部分
3.块数据:
TIS数据结束后,即为数据的开始
四,190故障现象
1.硬盘通电几秒后停转。
2.通电后出现敲击的声音,不识别硬盘或是识别比较慢,查看扇区时,所有扇区均
为0
3.通过镜像工具镜像时速度特别慢,速度低于1M/s
五,190常见问题。
1.模块内部发生逻辑错误,硬盘可能会出现敲盘。
2.固件区出现坏道,部分节点无法访问,导致用户区数据都是0.
3.模块出现问题后,硬盘自动或者手动重建,导致用户区数据全部变成0.
4.人为在WIN10下对硬盘重新分区并格式化,导致除文件系统信息外的用户区都变成0.
5.节点数量特别多,节点碎片严重,导致数据读取速度特别慢。