Spark Структурированная потоковая передача применяет различные модели Mllib на основе значения столбца - PullRequest
0 голосов
/ 23 февраля 2019

Я использую структурированную потоковую передачу с Kafka.В HDFS хранится около 10 различных моделей ML_Lib.

На основе столбца значения клиента в строке должна быть применена конкретная модель.

Строковые операции с кадрами данных невозможны при структурированной потоковой передаче.Использование цикла for приводит к тому, что код запускается на одной машине и не распараллеливается.

Существует ли групповая операция, а затем фильтрация по группе клиентов и применение конкретной модели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...