Анализ основных компонентов в FLink - PullRequest
0 голосов
/ 13 февраля 2019

Есть ли способ использовать PCA в Apache Flink?

Когда я прибегнул к поиску в Google, я думаю, что реализованный код не найден.

Если это так, следуетЯ сам это разрабатываю?

Спасибо.

Ответы [ 2 ]

0 голосов
/ 14 февраля 2019

Полагаю, это будет для пакетного режима Flink (обработка ограниченного набора данных), верно?

Эта (остановленная?) Работа выполняется для FLINK-1733 .Хотя на основе комментариев к обзору кода не похоже, что он готов к прайм тайм.

Не знаю, насколько это полезно, но вы можете прочитать здесь окак Mahout реализует свою версию распределенного PCA.Это дает вам общий обзор алгоритма, так как он написан с использованием синтаксиса R-ish Mahout, который преобразуется в задание Spark.

0 голосов
/ 13 февраля 2019

Что именно ты хочешь сделать?Тренировать модель?Применить существующий?На самом деле нет никаких ограничений.Проще говоря, Flink - это потоковая среда.Какая операция применяется к вашим данным, зависит только от вас (Flink).

...