Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Sébastien Bocahu
> >>- désactiver l'I/O ATDMA > >C'est à quel niveau, cette option ? BIOS/UEFI ? > C'est dans le BIOS. Bon dans mon cas, ce n'est pas ça: c'est déja désactivé ! Je vais voir ce que Dell en pense. ___ Liste de diffusion du FRsAG http://www.frsag.org/

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Sébastien Bocahu
Laurent CARON wrote: > On 22/01/2013 16:33, Sébastien Bocahu wrote: > >>J'ai eu ce comportement sur des R720. > >>La solution a été de: > >>- mettre à niveau le BIOS > >>- désactiver l'I/O ATDMA > >>- installer le package intel-microcode > > > >Merci Laurent pour ce retour :) > > > >ATDMA a quelque

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Laurent CARON
On 22/01/2013 16:33, Sébastien Bocahu wrote: J'ai eu ce comportement sur des R720. La solution a été de: - mettre à niveau le BIOS - désactiver l'I/O ATDMA - installer le package intel-microcode Merci Laurent pour ce retour :) ATDMA a quelquechose à voir avec DMA ou Time division multiple acce

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Sébastien Bocahu
> >>> sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production > >>> depuis > >>> plusieurs mois. 4 ont planté lamentablement dans le mois d'octobre, de > >>> manière > >>> aléatoire. > >>> > > Quel OS ? Pour Greg je ne sais pas :), en ce qui me concerne, Xen 4.1/Linux 3.2 __

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Sébastien Bocahu
> J'ai eu ce comportement sur des R720. > La solution a été de: > - mettre à niveau le BIOS > - désactiver l'I/O ATDMA > - installer le package intel-microcode Merci Laurent pour ce retour :) ATDMA a quelquechose à voir avec DMA ou Time division multiple access ? ça se recherche assez mal sur un

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet frederic ollivier
2013/1/22 Laurent CARON > On 22/01/2013 15:37, Sébastien Bocahu wrote: > >> Bonjour, >> >> (désolé j'ai plus le message-id, j'ai trouvé le mail sur les archives) >> >> >> sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production >>> depuis >>> plusieurs mois. 4 ont planté lamentabl

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Laurent CARON
On 22/01/2013 15:37, Sébastien Bocahu wrote: Bonjour, (désolé j'ai plus le message-id, j'ai trouvé le mail sur les archives) sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production depuis plusieurs mois. 4 ont planté lamentablement dans le mois d'octobre, de manière aléatoire.

Re: [FRsAG] Crash sur Dell R410

2013-01-22 Par sujet Sébastien Bocahu
Bonjour, (désolé j'ai plus le message-id, j'ai trouvé le mail sur les archives) > sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production depuis > plusieurs mois. 4 ont planté lamentablement dans le mois d'octobre, de manière > aléatoire. > > Rien dans les logs, le serveur reboo

Re: [FRsAG] Crash sur Dell R410

2011-10-31 Par sujet Aurelgadjo
Le 31/10/2011 15:18, Gregory Duchatelet a écrit : > Un diagnostique Dell donne ces erreurs : > > * Critical interrupt sensor (PCIE Fatal Err) Bus Fatal Error > * Processor sensor (CPU Machine Chk) transition to non-recoverable Quel diagnostique ? Que te remonte le log des événements de la

Re: [FRsAG] Crash sur Dell R410

2011-10-31 Par sujet Gregory Duchatelet
Le 31/10/2011 15:36, Cyril Bouthors a écrit : On 31 Oct 2011, greg-fr...@duchatelet.net wrote: Je fais des checks SNMP via Dell OMSA 5.5, pas en IPMI. Pas sûr que ce soit plus stable ... Désactive OMSA pendant 1 mois pour voir si tu évites les crashes. Il faudrait que je le désactive une ann

Re: [FRsAG] Crash sur Dell R410

2011-10-31 Par sujet Cyril Bouthors
On 31 Oct 2011, greg-fr...@duchatelet.net wrote: > Je fais des checks SNMP via Dell OMSA 5.5, pas en IPMI. Pas sûr que ce soit > plus > stable ... Désactive OMSA pendant 1 mois pour voir si tu évites les crashes. -- Cyril Bouthors - Administration Système, Infogérance ISVTEC SARL, 14 avenue de

Re: [FRsAG] Crash sur Dell R410

2011-10-31 Par sujet Gregory Duchatelet
Le 31/10/2011 15:25, Cyril Bouthors a écrit : Tu fais des checks IPMI réguliers avec quelque chose comme Munin ? Si oui, désactive le et ça évitera ce genre de blagues. Les drivers IPMI linux sur Dell sont pas stables. Je fais des checks SNMP via Dell OMSA 5.5, pas en IPMI. Pas sûr que ce so

Re: [FRsAG] Crash sur Dell R410

2011-10-31 Par sujet Cyril Bouthors
On 31 Oct 2011, greg-fr...@duchatelet.net wrote: > sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production depuis > plusieurs mois. 4 ont planté lamentablement dans le mois d'octobre, de manière > aléatoire. Tu fais des checks IPMI réguliers avec quelque chose comme Munin ? Si ou

[FRsAG] Crash sur Dell R410

2011-10-31 Par sujet Gregory Duchatelet
Bonjour, sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en production depuis plusieurs mois. 4 ont planté lamentablement dans le mois d'octobre, de manière aléatoire. Rien dans les logs, le serveur reboot et stop juste après le BIOS sur le message "System fatal error - press F1 to