PCA - это относительно дешевая операция, поэтому ваше отношение связи (получение данных к узлам) относительно вычислений (фактическая операция, в данном случае PCA), вероятно, будет относительно низким.
Это означает, что кластеризация не может быть хорошим решением для этой конкретной проблемы.
Более того, PCA - это действительно операция линейной алгебры, поэтому вам лучше взглянуть на оптимизированные BLAS, такие как ATLAS, Goto, MKL, ... которые (в наши дни) могут использовать несколько ядер, что дает вам неявный параллелизм , который проще в использовании, чем явный параллелизм с использованием MPI.
Не поймите меня неправильно - мне очень нравится MPI (и у меня есть несколько уроков
здесь при использовании его с R ), но вы должны помнить, что не все инструменты подходят для всех проблем.