Как заметил @Speakjava в данный момент, использование SIMD-инструкций в коде Spark невозможно, потому что AVX512 был добавлен в Java 9, который еще не поддерживается Spark.Но в ближайшие годы произойдут радикальные изменения - Проект Панама .Как только векторный API будет готов, такие проекты, как Spark, смогут получить от этого огромную прибыль.Вы можете следить за JEP-338 на предмет предстоящих изменений.
Если вы заинтересованы в использовании низкоуровневого API-интерфейса Intel для повышения производительности, посмотрите на библиотеку Intel Data.Библиотека ускорения аналитики .Intel заявляет, что это может повысить производительность на MLlib
.Он имеет аналоги некоторых классов от Spark - org.apache.spark.mllib.feature.{PCA, PCAModel} -> daal_for_mllib.{PCA, PCAModel}
- подробный пример здесь .