У меня есть пять компьютеров, объединенных в сеть.Среди них один - главный компьютер, а четыре - подчиненные.
Каждый подчиненный компьютер имеет свой собственный набор данных (очень большая целочисленная матрица).Я хочу запустить четыре разные программы кластеризации в четырех разных ведомых устройствах.Затем перенесите результаты обратно в главный компьютер для дальнейшей обработки (например, визуализации).
Сначала я подумал использовать Hadoop.Но я не могу найти какой-либо хороший способ преобразовать вышеупомянутую проблему (в частности, выходные результаты) в инфраструктуру Map Reduce.
Существует ли какая-либо хорошая инфраструктура распределенных вычислений с открытым исходным кодом, с помощью которой я могу выполнить вышеуказанную задачулегко?
Заранее спасибо.