样例:linux
FLAG是标记,标准数值(VALUE)应当小于或等於关键值(THRESH)。WHEN_FAILED 表明错误信息,上面显示的WHEN_FAILED纵行是空行,说明硬盘没有故障。若是WHEN_FAILED显示数字,代表硬盘磁道可能有比较大的坏道。ide
- read error rate 错误读取率:记录读取数据错误次数(累计),非0值表示硬盘已经或者可能即将发生坏道;
- throughput performance 磁盘吞吐量:平均吞吐性能(通常在进行了人工 Offline S.M.A.R.T. 测试之后才会有值。);
- spinup time 主轴电机到达要求转速时间(毫秒/秒);
- start/stop count 电机启动/中止次数(能够看成开机/关机次数,或者休眠后恢复,均增长一次计数。全新的硬盘应该小于10);
- reallocated sectors count 重分配扇区计数:硬盘生产过程当中,有一部分扇区是保留的。当一些普通扇区读/写/验证错误,则从新映射到保留扇区,挂起该异常扇区,并增长计数。随着计数增长,io性能骤降。若是数值不为0,就须要密切关注硬盘健康情况;若是持续攀升,则硬盘已经损坏;若是重分配扇区数超过保留扇区数,将不可修复;
- seek error rate 寻道错误率:磁头定位错误一次,则技术增长一次。若是持续攀升,则多是机械部分即将发生故障;
- seek timer performance 寻道时间:寻道所须要的时间,越短则读取数据越快,可是若是时间增长,则可能机械部分即将发生故障;
- power-on time 累计通电时间:指硬盘通电时间累计值。(单位:天/时/分/秒。休眠/挂起不计入?新购入的硬盘应小于100hrs);
- spinup retry count 电机启动失败计数:电机启动到指定转速失败的累计数值。若是失败,则多是动力系统产生故障;
- power cycle count 电源开关计数:每次加电增长一次计数,新硬盘应小于10次;
- g-sensor error rate 坠落计数:异常加速度(例如坠落,抛掷)计数——磁头会当即回到landing zone,并增长一次计数;
- power-off retract count 异常断电次数:磁头在断电前没有彻底回到landing zone的次数,每次异常断电则增长一次计数;
- load/unload cycle count 磁头归位次数:指工做时,磁头每次回归landing zone的次数。(ps:流言说某个linux系统——不点名,在使用电池时候,会不断强制磁头归为,而磁头归位次数最大值约为600k次,因此认为linux会损坏硬盘,实际上不是这样的);
- temperature 温度:没嘛好说的,硬盘温度而已,理论上比工做环境高不了几度。(sudo hddtemp /dev/sda)
- reallocetion event count 重映射扇区操做次数:上边的重映射扇区还记得吧?这个就是操做次数,成功的,失败的都计数。成功好说,也许硬盘有救,失败了,也许硬盘就要报废了;
- current pending sector count 待映射扇区数:出现异常的扇区数量,待被映射的扇区数量。 若是该异常扇区以后成功读写,则计数会减少,扇区也不会从新映射。读错误不会从新映射,只有写错误才会从新映射;
- uncorrectable sector count 不可修复扇区数:全部读/写错误计数,非0就证实有坏道,硬盘报废;
SSD固态硬盘多出的Attributes 信息解释:性能
其中咱们比较关注的有如下四点:
一、Media_Wearout_Indicator: 使用耗费,100为没有任何耗费; 表示SSD上NAND的擦写次数的程度,初始值为100,随着擦写次数的增长,开始线性递减,递减速度按照擦写次数从0到最大的比例。一旦这个值下降到 1,就再也不降了,同时表示SSD上面已经有NAND的擦写次数到达了最大次数。这个时候建议须要备份数据,以及更换SSD。
上面的机器为099,按照100滴血算,目前只耗了1滴血
二、Reallocated_Sector_Ct: 出厂后产生的坏块个数, 初始值为100,若是有坏块,从1开始增长,每4个坏块增长1
这里offer的机器尚未任何坏块
三、Host_Writes_32MiB: 已写32MiB, 每写入65536个扇区raw value增长1。这个扇区仍是个数量单位,512字节
好比:这块盘就是 1284966 * 65536 * 512 = 40155.1875 GB
注意到每一个机器都有一块盘写的比较少,这块盘就是hotspare盘。
每台机器咱们有7块ssd盘。其中6块盘作的raid 5,第7块盘作的hotspare。
四、Available_Reservd_Space: SSD上剩余的保留空间, 初始值为100,表示100%,阀值为10,递减到10表示保留空间已经不能再减小