[Linux-31] disk dur HS ou pas ?

Pascal Hambourg pascal.news at plouf.fr.eu.org
Sam 2 Fév 10:40:31 CET 2013


Salut,

Christophe VANHOUTTE a écrit :
> Bonjour,
> j'ai mes machines virtuelles qui ne fonctionnent plus, alors que tout
> été ok jusqu'a présent!

Que se passe-t-il exactement ?

> Il y a quelquessemaines nous en avions parlé au local ...
> 
> Message suivant:
> 
> Message from syslogd at xxx at Feb  1 13:05:53 ...
>  kernel:[  118.637845] general protection fault: 0000 [#1] SMP

Il vaudrait mieux lire directement les messages du noyau via dmesg ou
/var/log/kern.log|syslog.

> === START OF READ SMART DATA SECTION
> === SMART Attributes Data Structure revision number: 16 Vendor
> Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE
> UPDATED  WHEN_FAILED RAW_VALUE
>   1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail
> Always       -       0
>   3 Spin_Up_Time            0x0027   183   177   021    Pre-fail
> Always       -       1841
>   4 Start_Stop_Count        0x0032   100   100   000    Old_age Always
>       -       475
>   5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail
> Always       -       0
>   7 Seek_Error_Rate         0x002f   200   200   051    Pre-fail
> Always       -       0
>   9 Power_On_Hours          0x0032   098   098   000    Old_age Always
>       -       1762
>  10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail
> Always       -       0
>  11 Calibration_Retry_Count 0x0032   100   100   000    Old_age Always
>       -       0
>  12 Power_Cycle_Count       0x0032   100   100   000    Old_age Always
>       -       448
> 183 Runtime_Bad_Block       0x0032   100   100   000    Old_age Always
>       -       0
> 184 End-to-End_Error        0x0033   100   100   097    Pre-fail
> Always       -       0
> 187 Reported_Uncorrect      0x0032   100   100   000    Old_age Always
>       -       0
> 188 Command_Timeout         0x0032   100   089   000    Old_age Always
>       -       30
> 190 Airflow_Temperature_Cel 0x0022   062   051   040    Old_age Always
>       -       38
> 191 G-Sense_Error_Rate      0x0032   095   095   000    Old_age Always
>       -       5
> 192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age Always
>       -       44
> 193 Load_Cycle_Count        0x0032   192   192   000    Old_age Always
>       -       26197
> 194 Temperature_Celsius     0x0022   109   098   000    Old_age Always
>       -       38
> 196 Reallocated_Event_Count 0x0032   200   200   000    Old_age Always
>       -       0
> 197 Current_Pending_Sector  0x0032   200   200   000    Old_age Always
>       -       0
> 198 Offline_Uncorrectable   0x0030   100   253   000    Old_age
> Offline      -       0
> 199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age Always
>       -       0
> 200 Multi_Zone_Error_Rate   0x0009   200   200   051    Pre-fail
> Offline      -       0
> 
> Je ne vois que: " G-sense error rate"   qui pourrait poser problème
> (électromécaniques) !?

La valeur normalisée (95) est largement au-dessus du seuil (0), donc a
priori rien d'alarmant. Je ne vois rien d'autre d'inquiétant.

La valeur de Load cycle count (26197) est plutôt élevée par rapport au
nombre d'heures de fonctionnement (1762) donc le disque a tendance à
décharger les têtes un peu trop rapidement (ce qui est assez courant sur
les disques durs de protables et se règle avec hdparm -b) mais là encore
la valeur normalisée (192) est encore loin du seuil (0) donc visiblement
le disque est prévu pour. En extrapolant, le seuil devrait être atteint
dans 42000 heures de fonctionnement, soit presque 5 ans de
fonctionnement 24h/24.



Plus d'informations sur la liste de diffusion Linux-31