Question

Мне недавно нужно сжать сотни файлов в формате hdf.Теперь я могу использовать GNU параллельно для работы на одном узле с помощью нескольких процессов.Однако мои серверы не позволяют SSH между собой, чтобы сделать его распределенным.Поэтому сейчас я ищу распределенную среду для своей работы.Удобно ли использовать hadoop, spark или flink для сжатия этих файлов на нескольких узлах?Большое спасибо!

Ole Tange · Answer 1 · 23 апреля 2019

Можете ли вы ssh всем хостам с главного сервера?Если это так, получите список файлов на главный сервер, запустите GNU Parallel с главного сервера с каждым из подчиненных серверов, указанных в -S (или --slf).

Как сжимать большое количество файлов в hdfs распределенным методом?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как сжимать большое количество файлов в hdfs распределенным методом?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы