d'abord merci à [EMAIL PROTECTED] pour l'info, même si
avec smartctl je n'obtiens aucun signe d'erreur !
à part quelques UDMA_CRC_Error_Count qui n'ont pas l'air d'alerter
   smartctl

de plus, "badblocks -s /dev/hdb" ne montre rien ...


par contre, c'est vrai qu'en cherchant dans les log :
grep hdb /var/log/kern.log /var/log/messages /var/log/syslog | grep error
j'ai beaucoup d'erreurs.

aussi, j'ai bien dans la config du kernel 
CONFIG_IDEDISK_MULTI_MODE=y


enfin
en farfouillant dans les log + google , l'origine serait dans la RAM :
/var/log/kern.log:May  5 02:35:56 copix kernel: Filesystem "ide0(3,73)":
      Corruption of in-memory data detected.  Shutting down filesystem:
      ide0(3,73)
je ne sais pas si cela concerne une partition ext3 ou xfs
 [ google donne plein de mail sur xfs et "Corruption of in-memory data
detected" ]

et puis
mais memtest86 n'a toujours pas vu d'erreur avec la memoire...



Je commence a avoir des doutes sur sarge et le kernel 2.4.27-8,
et alors un changement de disque ne m'avancerait a rien...
de plus, j'ai eu un probleme avec une partition ext3, et aussi avec une
xfs.



Une suggestion ???



- gilles missonnier -


ceussent que cela interessent peuvent voir des extraits de log ci dessous.


=====================================================
extrait de la commande : smartctl -a /dev/hdb

...
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED
WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   060    Pre-fail  Always
-       1
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline
-       0
  3 Spin_Up_Time            0x0007   100   100   024    Pre-fail  Always
-       163 (Average 166)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always
-       1680
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always
-       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always
-       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline
-       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always
-       5601
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always
-       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always
-       629
192 Power-Off_Retract_Count 0x0032   099   099   050    Old_age   Always
-       1824
193 Load_Cycle_Count        0x0012   099   099   050    Old_age   Always
-       1824
194 Temperature_Celsius     0x0002   144   144   000    Old_age   Always
-       38 (Lifetime Min/Max 17/58)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always
-       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always
-       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline
-       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always
-       57

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining 
LifeTime(hours)LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5600 -
# 2  Extended offline    Completed without error       00%      5592 -
# 3  Short offline       Completed without error       00%      5591 -
# 4  Extended offline    Completed without error       00%      4706 -
# 5  Short offline       Completed without error       00%      4706
-


===================================================================
extraits du résultat de la commande :
grep hdb /var/log/kern.log /var/log/messages /var/log/syslog | grep error 



/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: recal_intr:
   error=0x00 { }
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: set_multmode:
   error=0x00 { }
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: recal_intr:
   error=0x00 { }
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: set_geometry_intr:
   error=0x37 { DriveStatusError SectorIdNotFound TrackZeroNotFound
   AddrMarkNotFound }, LBAsect=255304785, sector=7728



/var/log/syslog:May 11 20:10:24 copix kernel: hdb: set_geometry_intr:
   error=0x37 { DriveStatusError SectorIdNotFound TrackZeroNotFound
   AddrMarkNotFound }, LBAsect=255304785, sector=21352
/var/log/syslog:May 11 20:10:24 copix kernel: end_request: I/O error, dev
   03:47 (hdb), sector 21352
/var/log/syslog:May 11 20:10:24 copix kernel: hdb: recal_intr: error=0x00
   { }
/var/log/syslog:May 11 21:16:29 copix kernel: hdb: status error:
   status=0x51 { DriveReady SeekComplete Error }
/var/log/syslog:May 11 21:16:29 copix kernel: hdb: status error:
   error=0x04 { DriveStatusError }
/var/log/messages:May 12 14:59:58 copix kernel: hdb: dma_intr: error=0x84
   { DriveStatusError BadCRC }
/var/log/syslog:May 12 16:28:34 copix kernel: hdb: status error:
   status=0x58 { DriveReady SeekComplete DataRequest }


/var/log/messages:May  9 14:30:12 copix kernel: hdb: dma_intr: error=0xb6
{ DriveStatusError BadCRC SectorIdNotFound TrackZeroNotFound },
LBAsect=11933521, sector=13288


====================================================================


->> => peut-on installer un mode simplifie de smartmontools sans bonobo ? 
->>    et comment ?
->
->On peut utiliser la commande /usr/sbin/smartctl dans un terminal (sous
->root).

->
->Oui, surtout si vous avez des messages d'erreur (genre ide ou hda)
->dans vos logs (/var/log/message, /var/log/syslog, /var/log/kern.log,
->dmesg) et/ou si smartctl vous l'indique. Sauvegardez vite vos données
->importantes et achetez un autre disque!
->
->A mon avis le plus urgent est de sauvegarder (par le réseau et/ou sur
->CD) vos données importantes... Votre disque est probablement mourant
->(et une sauvegarde ne fait jamais de mal).



Répondre à