On Fri, Aug 05, 2011 at 10:15:06PM +0300, Денис Мажар wrote:
> Доброго времени суток, есть здесь кто-то кто использует Nagios
> для мониторинга большого количества хостов?

На последних двух lvee.org Николай Маржан из PortaOne рассказывал
о том, как они мониторят ~2000 хостов.

> У меня есть инсталляция, которая мониторит ~1000 хостов и ~12000 
> сервисов на этих хостах. Все это крутится на достаточно мощном сервере с 
> Intel Xeon E5520 2.27GHz (8 ядер с HT), 12 Gb RAM и 100 Mbit каналом. 
> Так же используется nagiosgrapher для рисования графиков.
> Проблема в том, что extinfo.cgi показывает, что средняя задержка 
> выполнения проверок 845.860 seс. Т.е. проверки вместо раз в 5 мин 
> выполняются примерно раз в 15-20 минут. LA сервера не превышает 2.

Насколько понимаю, на таких нагрузках всем пользователям nagios
становится грустновато.

Посмотрите collectd; на всякий также отмечу, что в рамках Clustrx
разработана система оперативного мониторинга с латентностью
порядка секунды на количестве хостов порядка 5000 и реакцией
(включая принятие решения) в течение 3--4 сек -- это особенно
актуально при высокой плотности размещения blade-серверов.
Код версии 1.0 в принципе под GPL (хотя ещё не публиковался);
думаю, что возможно обсудить, кому что может быть интересно.
(NB: это разработка отдела netch@)

-- 
 ---- WBR, Michael Shigorin <m...@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/20110806115319.ga11...@osdn.org.ua

Ответить