On 01/14/13 09:33, Radek Krejča:
padaji mi 3 stroje na nasledujici chybu - je to ovladaci, ci cim to muze byt?
Fotka je zde: http://www.krejca.info/chyba.jpg

Pokud se to opakuje (a me se jevi, ze ano), je treba nejmene jeden z tech stroju nechat bezet na kernelu s ladicimi informacemu (/boot/kernel/kernel.debug)

Az takovy stroj spadne, vznikly coredump je dulezity zdroj informaci:

gdb -k kernel.debug /usr/crash/vmcore.0

(jmeno coredumpu se bude nejspis lisit)

Vypise totiz u funkci nejen binarni offsety, ale primo cisla radku odkazujici do zdrojovych kodu. Tedy - misto

#5 0xffffffff8060c05a at turnstile_wait+0x01aa

bychom videli (ve vypisu gdb, ne pri samotnem panicu) neco jako:

#5 0x8060c05a in turnstile_wait (ts=???, lock=0x???, owner=0x???)
    at /usr/src/sys/kern/subr_turnstile.c:???

Podstatne jsou ty otazniky. To by dovolilo exaktnejsi analyzu.

Bez toho muzu zkusit leda hadat - klicovy je ramec #5, funkce turnstile_wait(). Ta mela problemy v zamcich uz driv, abendovalo to tam uz pred cca osmi lety jeste na 5.2-R (nevim presne, ja se vsem 5.x vyhnul obloukem).

Ja osobne bych nejspis zkusil aplikovat patche z techto dvou setu:
http://svnweb.freebsd.org/base?view=revision&revision=239585
http://svnweb.freebsd.org/base?view=revision&revision=240424

Myslim, ze ani v 9.1 jeste nejsou.

Tezko ale dokazu vysvetlit proc prave tyhle dva. Vybral jsem si je postupem, kterej smrdi vestenim a samotne podklady pro vesteni uz jsou taky "hadane". Takze vsechno co k tomu muzu rict, ze ja bych zkusil prave tohle. Mozna to nezabere a mozna dokonce uskodi. C'est la vie.

Dan




--
FreeBSD mailing list (users-l@freebsd.cz)
http://www.freebsd.cz/listserv/listinfo/users-l

Odpovedet emailem