On Fri, Aug 05, 2011 at 10:15:06PM +0300, Денис Мажар wrote: > Доброго времени суток, есть здесь кто-то кто использует Nagios > для мониторинга большого количества хостов?
На последних двух lvee.org Николай Маржан из PortaOne рассказывал о том, как они мониторят ~2000 хостов. > У меня есть инсталляция, которая мониторит ~1000 хостов и ~12000 > сервисов на этих хостах. Все это крутится на достаточно мощном сервере с > Intel Xeon E5520 2.27GHz (8 ядер с HT), 12 Gb RAM и 100 Mbit каналом. > Так же используется nagiosgrapher для рисования графиков. > Проблема в том, что extinfo.cgi показывает, что средняя задержка > выполнения проверок 845.860 seс. Т.е. проверки вместо раз в 5 мин > выполняются примерно раз в 15-20 минут. LA сервера не превышает 2. Насколько понимаю, на таких нагрузках всем пользователям nagios становится грустновато. Посмотрите collectd; на всякий также отмечу, что в рамках Clustrx разработана система оперативного мониторинга с латентностью порядка секунды на количестве хостов порядка 5000 и реакцией (включая принятие решения) в течение 3--4 сек -- это особенно актуально при высокой плотности размещения blade-серверов. Код версии 1.0 в принципе под GPL (хотя ещё не публиковался); думаю, что возможно обсудить, кому что может быть интересно. (NB: это разработка отдела netch@) -- ---- WBR, Michael Shigorin <m...@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110806115319.ga11...@osdn.org.ua