Разрабатывая новый проект ML с помощью Spark, мы хотим сначала сгладить входные данные, чтобы иметь меньший шум (а затем лучшие результаты, поскольку мы могли бы тренироваться с небольшим количеством данных).
Странно, я не могу найти сглаживающий фильтр в Spark-ML (как, например, Kalman). Разработчики Spark-ML разработали свои собственные или они сначала не фильтруют входные данные? Есть ли такие реализации?