Есть ли способ использовать PCA в Apache Flink?
PCA
Когда я прибегнул к поиску в Google, я думаю, что реализованный код не найден.
Если это так, следуетЯ сам это разрабатываю?
Спасибо.
Полагаю, это будет для пакетного режима Flink (обработка ограниченного набора данных), верно?
Эта (остановленная?) Работа выполняется для FLINK-1733 .Хотя на основе комментариев к обзору кода не похоже, что он готов к прайм тайм.
Не знаю, насколько это полезно, но вы можете прочитать здесь окак Mahout реализует свою версию распределенного PCA.Это дает вам общий обзор алгоритма, так как он написан с использованием синтаксиса R-ish Mahout, который преобразуется в задание Spark.
Что именно ты хочешь сделать?Тренировать модель?Применить существующий?На самом деле нет никаких ограничений.Проще говоря, Flink - это потоковая среда.Какая операция применяется к вашим данным, зависит только от вас (Flink).