Управление кластерами в Ubuntu - PullRequest
6 голосов
/ 05 апреля 2011

Я пытаюсь найти решение для управления набором Linux-машин (ОС: Ubuntu, ~ 40 узлов. То же оборудование).Предполагается, что эти машины являются образами друг друга, программное обеспечение, установленное в одном, должно быть установлено в другом.Мои требования к программному обеспечению: hadoop, R и servicemix.Пакеты R на всех машинах также должны быть синхронизированы (пакет, установленный на одном, должен быть доступен во всех остальных)

Одно из решений, которое я сейчас использую, - это использование NFS и pssh.Я надеюсь, что есть лучшее / более простое решение, которое сделало бы мою жизнь немного легче.Любое предложение приветствуется.

Ответы [ 2 ]

5 голосов
/ 05 апреля 2011

Два популярных варианта: Puppet от Puppet Labs и Chef от OpsCode.

Другим потенциальным механизмом является создание нового метапакета, который Requires: пакетов, которые вы хотитеустанавливается на все машины.Когда вы изменяете ваш метапакет, apt-get update && apt-get -u dist-upgrade установит новый пакет на все ваши системы одновременно.

Подход метапакета может потребовать меньше усилий для первоначальной настройки и использования, но Puppet или Chef могут обеспечить более высокую отдачу от инвестиций.в долгосрочной перспективе, поскольку они могут управлять гораздо большим, чем просто установка пакетов.

3 голосов
/ 05 апреля 2011

В прошлом я использовал для этого низкотехнологичное приложение, просто разделяя (хотя бы части) /usr/local/, чтобы сохранить общую библиотеку R в /usr/local/lib/R/site-library/. Я думаю, это может сработать и для вашей установки Hadoop.

Я пытался сохранить остальное в пакетах Debian / Ubuntu и поддерживал актуальность всех узлов. Локальные репозитории пакетов R и Ubuntu (для локально созданных пакетов) также могут помочь, но это немного больше работы.

...