On 01/30/16 10:21, Vladimír Drgoňa wrote:
mám malý domáci server:
core-i3, 16GB RAM, 2x3000GB WD RED, 120GB SSD-Intel
FreeBSD-10.2-RELEASE-p11, 2x3000GB mirror zfs, 120GB je ako cache a zil.

Nepochybne jsem nespravedlive zaujatej, ale nelze prehlednout, ze jak v posledni dobe resim nejakej "podivnej" problem okolo stability, tak logy maji zretelne stycne body. A temi spolecnymi body jsou pismena Z, F a S

Zrovna naposled jsem resil postupne ztracejici se pamet. A on ji postupne pozira kernelovy modul opensolaris, ktery tam je kvuli ...
... modri uz urcite vedi ...

Ak na server pristupujú súčasne všetci klienti, zfs začne masívne
využívať disky (hlavne cache na SSD), obsadí oveľa viac pamäte a
potrebuje použiť swap.

Uz v tyhle chvili tedy vime, ze stroj neni na zatez dimenzovanej. Za bezne se vyskytujici zateze (a tou se mysli i opakovane se vyskytujici spickove zateze) stroj swap pouzivat nesmi.


V takomto prípade sa občas celý server reštartne
aj bez toho, aby celý swap využil a bez zápisov do logov. Keď vypnem
dedup, server beží bez problémov aj rok.
Čo sa s tým dá robiť okrem vypnutia dedup?

Velmi nerad to uslysis, ale da se s tim udelat jedine - najit tu chybu. Coz znamena mit debugovaci kernel, nakonfigurovat system tak aby pri restartu udelal coredump (na to ale, zda se mi, nemas ten swap dost velkej, takze nejprve zvetsit swap - musi byt vetsi jez je mnozstvi fyzicke pameti) - doufat, ze to pri padu ten coredump udela.

Pak uz "jen" zjistit co to delalo v okamziku, kdy to spadlo, najit tu chybu a opravit ji. Pokud bych mel vystrelit zcela naslepo, tak jde o chybu pri praci s pameti, ktera je chybne oznacena jako zpusobila k odswapovani, nasledne odswapovana - a system spadne v okamziku, kdy kernelovy modul tu pamet chce pouzit v kontextu, ktery nedovoluje jeji nacteni ze swapu. Ale to jsem si jen hodil kostkama. Muze to byt i uplne neco jinyho.

Existuje pro tebe urcita mala sance na mene narocne reseni. Pokud nejde o memory-leak (kdy je spotreba pameti z dlouhodobeho hlediska shora neomezena), pak by ti problem mohlo vyresit pridani pameti - a to takoveho mnozstvi, aby swap nebyl potrebny.

Ostatne, uz nahore jsem naznacoval, ze to je minimalni mnozstvi pameti v kazdem pripade.

Alternativne se samozrejme muzes pokusit omezit pouzivani stavajici pameti - zkusit ZFS presvedcit, ze nesmi pouzivat vic pameti nez kolik ji je. I pokud se ti to povede, nebude to zadarmo, nejspis to bude mit negativni vliv na vykon.

Reštart nastane samozrejme v najnevhodnejší čas.

To je nejpravdepodobnejsi - v dobe nejvetsi zateze jsou nejvetsi naroky na pamet.

Za každú radu ďakujem.

Skutecne i za tuhle ? ;-)


Dan




--
FreeBSD mailing list (users-l@freebsd.cz)
http://www.freebsd.cz/listserv/listinfo/users-l

Odpovedet emailem