2 апреля 2013 г., 0:36 пользователь "Артём Н." <artio...@yandex.ru> написал:
> 01.04.2013 08:30, Stanislav Vlasov пишет: > > Очень большое количество компонентов, требуемых для GFS2, взаимосвязь > > которых хреново настраивается. > > Под RHEL задача упрощается не слишком сильно. По-крайней мере, кластер > > менее, чем на три машины делать уже точно не стоит. > Понятно. Значит, стоит остановиться на OCFS2. > Это проще. > > Хотя, если имелось ввиду, что много дисков должно быть на тех же > > серверах, что и виртуалки, причём бекапы - туда же, то лучше всё-таки > > немного подумать над реорганизацией. Бекапы должны лежать отдельно от > > рабочих серверов. > Я и хочу отдельно... Но процессоры на старых серверах намного хуже, чем на > тех, > что под бэкапы (2 старых Xeon против Core2 Duo). Мда... > > К тому же, при создании бекапов будет довольно приличная дисковая > > нагрузка, процессор будет в основном в состоянии iowait, что повлияет > > на работу виртуалок. > Так ведь диски все давно с DMA (процессор будет ждать прерывания). Или > всё-равно? > А это неважно. Время случайного доступа никто не отменял. > >> 4. Коммутатор (говорят, что возможно найти лишний). > > Для надёжности лучше два. > Там, в принципе, несколько сетевых интерфейсов. Может, вообще, не нужен > коммутатор. Хм... Разве что сумеете обеспечить связь "каждый с каждым" без него, причём с двойным резервированием. > >> Что требуется: > >> 1. Сохранять резервные копии с машин внутренней сети. Для начала > возможно > >> ограничиться только настройками (думаю, что систему там смогут > поставить). Под > >> это вполне хватит 8 Тб. > >> 2. Иметь доступное хранилище для образов виртуальных машин. Под них за > глаза > >> хватит 2 Тб. > > Нормальное ТЗ, вобщем-то. > > К бекапам еще бы ленточек... > Георгиевских или вы про стриммеры? :-) Таки про стримеры. С одной м :-) > >> Что хочу: > >> 1. Организовать маленькое надёжное хранилище объёмом 2 Тб. Использовать > для > >> образов ВМ. > > DRBD поверх раздела в 2Тб. > > Как вариант - сделать этот раздел на стареньких серверах, объединить > > их в DRBD и потом отдавать по iscsi весь том на оба сервера > > виртуализации с одного из серверов. > На старых серверах нет места. Там SCSI не более, чем на 200-500 Гб (на > тех, что > сейчас, вообще 100 с чем-то Гб). Мда... Извращение... >> 2. Организовать ненадёжное хранилище объёмом 8 Тб. Использовать для > резервных > >> копий и базы данных (в т.ч. Zabbix). > >> 3. Иметь возможность менять конфигурацию СХД "на лету" (например, > убрать часть > >> дисков из ненадёжного хранилища и создать ещё одно надёжное). > > С DRBD настолько на лету не выйдет, проверено. Только переконфигурация > > томов, созданных поверх DRBD. > А с Lustre? > Я могу убрать два диска из Lustre и создать из них DRBD? > Можно и так. Но опять же - в оффлайне. > >> Как хочу реализовать (пока только задумки): > >> I. Надёжное хранилище. > >> 1. Выделить 2 диска на каждом сервере под RAID-0. > >> 2. Объединить в RAID-1, используя DRDB. > >> 3. ФС - OCFS2. > > 3 - может быть clvm (clustered lvm). Возможно, будет на несколько > > процентов быстрее. > В смысле? Ведь cLVM тоже нужна кластерная ФС? Или вы про замену DRBD на > cLVM? Нет, clvm не требуется кластерная фс. И оно не заменяет drbd, а живёт поверх. Просто это lvm, работающий в кластере, когда тома лвм доступны всем узлам кластера. > > > >> II. Ненадёжное хранилище. > >> Тут задумок пока мало. Либо создать RAID0 и пробросить через > iSCSI или лучше > >> AoE. Либо использовать, например, Lustre. > > > > AoE пробовал - были проблемы с объединением сетевых карт. iscsi в этом > > плане менее капризен. > Какие проблемы? При бондинге двух сетевых карт и на клиенте и на сервере скрость передачи упёрлась в одну сетевую карту. > > Lustrefs - для бекапов пойдёт, для рабочего раздела - врядли. > Вай? > По-идее, под бэкапы и хочу. > Но почему не под рабочий раздел? > Если бы оставить только LustreFS, конфигурация бы сильно упростилась... iops. Виртуалки тоже хотят писать на диск, причём часто. > >> А стоит ли вообще выдумывать со всякими "надёжными-ненадёжным > хранилищами"? > >> Может, возможно ограничиться LustreFS (чтобы не плодить лишних > наворотов)? Ведь > >> ей не нужен DRBD? > > Не нужен, но по iops оно значительно медленнее, чем iscsi. > Т.е., для виртуалок не подойдёт..? Угу, я тестировал как-то... Для текущих задач с iops порядка полутора тысяч на один сервер - не подойдёт. В тестах на таком же железе и 2x1Гб сети выходило порядка нескольких сотен в пределе. iscsi на этом же стенде упёрся в диски по iops. Скорость чтения/записи отличалась на несколько процентов (оба явно упирались в сеть), так что тут разночтений нет. > >> С другой стороны, я ведь могу использовать > >> паравиртуализованные ОС без потери производительности? > > Как обычно, вобщем-то. > Т.е., вполне нормальный вариант (тогда сервера виртуализации будут на > старых HP > Proliant)? Только для линуксов. > >>>> Ну я понял, что БД, всё-таки - крайне узкое место. > >>>> Но, насколько я понял, проблема с ней уже была решена Яндексом. > >>> Вначале рекомендую найти это решение. Лично я пока что видел только > >>> сообщение о его поиске. > >> Пока что, никаких результатов. Либо они его не предоставляли в общее > >> пользование, либо я плохо искал. > > Скорее, первое, если они вообще его довели до конца. > Довели, наверное... Для чего тогда была новость, если в публичном доступе > этого нет? Судя по той ссылке - это было приглашение на работу программиста, который должен будет переделывать заббикс. > >>>> 2. rsnapshot всё-таки не распределённая система. Хотя, он и > использует rsync с > >>>> бэкапом на сервер, я не помню возможно ли делать > инкрементальные/декрементальные > >>>> бэкапы таким образом (напрямую на сервер). > >>> Не совсем понял вопроса. Накой делать копии сервера на сам сервер? > >> Инкрементальную копию удалённой машины на сервер. Возможно? > >> Или нет? > >> Или не стоит? > > Гм... rsnapshot - средство создания копии дерева каталогов. > > Организация хранения дерева каталогов такова, что можно увидеть копии > > дерева на предыдущие моменты времени. > > А то, как именно сделано копирование - уже другой вопрос. > Так тот же самый, с точки зрения преимуществ перед другими системами. > Хм... man rsync. У rsnapshot можно и опции позадавать, хотя и по-умолчанию будет копироваться только изменившееся. Не помню, правда, будут ли по-умолчанию считаться контрольные суммы остальных файлов или всё по размеру/времени изменения определяется. > >>>> 1. rsnapshot подходит только для *nix-подобных, поскольку использует > жёсткие > >>>> ссылки (да, в NTFS тоже есть, но как-то не хочется). > >>> Не совсем. Это на сторадже должен быть *nix. А на бекапируемом сервере > - rsync. > >>> К тому же, для винды есть виндовые средства, которые лучше спрашивать > >>> там, где виндами пользуются больше. > >> Всё-равно, всё должно сливаться в одно место. Лучше иметь нечто > централизованное. > >> Из виндовых средств они пользовались Norton Ghost. > > Тогда - таки да, amanda. Но, насколько я помню, агента под винды надо > > скачивать отдельно. > Так а почему Amanda, а не Bacula? > Я не имею против неё ничего, кроме того, что я про неё почти ничего не > знаю (о > Bacula хотя бы общее представление есть) и того, что, кажется, она не > поддерживается. Хм... The most recent stable release is version 3.3.3, released on January 10, 2013. Но вообще - без разницы, если будет обеспечивать то, что требуется. > > Я имел ввиду это: > > http://www.percona.com/software/percona-xtrabackup/downloads > Да я понял. Но, кажется, InnoDB бэкапить она не умеет во время работы? It supports completely non-blocking backups of InnoDB, XtraDB, and HailDB storage engines. In addition, it can back up the following storage engines by briefly pausing writes at the end of the backup: MyISAM, Merge, and Archive, including partitioned tables, triggers, and database options. Раз бекап non-blocking - таки он онлайн! :-) >>> но mysqldump тож пойдёт :-) > >> Да, правда для MSSQL и Pervasive нужны отдельные инструменты... > >> Но бэкапы БД пока только в перспективе. > > Лучше всё-таки заранее продумать. Систему-то в крайнем случае можно и > > заново поставить. А вот БД - хрен. > Я и продумываю. Просто, на данный момент, надо хоть СХД сделать. > Под бекапы - пофиг что, можно и локально. >>> Не помню, умеет ли bacula запускать внешние скрипты для создания > >>> бекапов. rsnapshot точно умеет > >> Насчёт бэкапов я в рассылке как-то спрашивал, порекомендовали, в том > числе, и > >> такую штуку: > >> http://backuppc.sourceforge.net/ > >> Пишут, что "BackupPC is a high-performance, enterprise-grade system for > backing > >> up Linux and WinXX PCs and laptops to a server's disk." > >> И Web-интерфейс весьма приятный. > >> Не сталкивались? > > Нет, только слышал. > И что говорят? > Давно это было... Помню, что на предыдущей работе не подошло, почему - не помню. > Т.е.: > 1. Под виртуалки RAID0 из двух дисков, объединённые по DRBD. > 2. Сделать LustreFS на 8 Тб под бэкапы. > Примерно так. Хотя под бекапы можно и не сетевую фс. Сделать два бекапных сервера и всё. > Вопросы: > 1. Крутить СУБД на тех же машинах, на которых реализована СХД - глупо? > Может быть медленно. Хотя можно и приоритеты дискового ио расставить, конечно. > 2. А если падает один из дисков в LustreFS, что-то теряется? > Не терялось вроде. > 3. Лучше ли использовать RAID6, чем RAID0, в случае с RAID1 по DRDB? > Или это лишено смысла? > Если параноик - достаточно raid5 под drbdb > 4. А что скажете насчёт OpenStack? Ничего, я им не пользовался. -- Stanislav