On 01/14/13 09:33, Radek Krejča:
padaji mi 3 stroje na nasledujici chybu - je to ovladaci, ci cim to muze byt?
Fotka je zde: http://www.krejca.info/chyba.jpg
Pokud se to opakuje (a me se jevi, ze ano), je treba nejmene jeden z
tech stroju nechat bezet na kernelu s ladicimi informacemu
(/boot/kernel/kernel.debug)
Az takovy stroj spadne, vznikly coredump je dulezity zdroj informaci:
gdb -k kernel.debug /usr/crash/vmcore.0
(jmeno coredumpu se bude nejspis lisit)
Vypise totiz u funkci nejen binarni offsety, ale primo cisla radku
odkazujici do zdrojovych kodu. Tedy - misto
#5 0xffffffff8060c05a at turnstile_wait+0x01aa
bychom videli (ve vypisu gdb, ne pri samotnem panicu) neco jako:
#5 0x8060c05a in turnstile_wait (ts=???, lock=0x???, owner=0x???)
at /usr/src/sys/kern/subr_turnstile.c:???
Podstatne jsou ty otazniky. To by dovolilo exaktnejsi analyzu.
Bez toho muzu zkusit leda hadat - klicovy je ramec #5, funkce
turnstile_wait(). Ta mela problemy v zamcich uz driv, abendovalo to tam
uz pred cca osmi lety jeste na 5.2-R (nevim presne, ja se vsem 5.x
vyhnul obloukem).
Ja osobne bych nejspis zkusil aplikovat patche z techto dvou setu:
http://svnweb.freebsd.org/base?view=revision&revision=239585
http://svnweb.freebsd.org/base?view=revision&revision=240424
Myslim, ze ani v 9.1 jeste nejsou.
Tezko ale dokazu vysvetlit proc prave tyhle dva. Vybral jsem si je
postupem, kterej smrdi vestenim a samotne podklady pro vesteni uz jsou
taky "hadane". Takze vsechno co k tomu muzu rict, ze ja bych zkusil
prave tohle. Mozna to nezabere a mozna dokonce uskodi. C'est la vie.
Dan
--
FreeBSD mailing list (users-l@freebsd.cz)
http://www.freebsd.cz/listserv/listinfo/users-l