Влияние скейлеров на категориальные столбцы в PySpark - PullRequest
0 голосов
/ 19 января 2019

Когда я посмотрел на реализацию PySpark ml, я увидел стандартизированный скейлер, примененный после того, как функции были собраны в вектор. Тем не менее, мой собранный вектор объектов состоит из некоторых объектов, которые проиндексированы (категориальный тип).

  1. Преобразует ли скейлер и категориальные функции? Или игнорировать это из-за метаданных?
  2. Если категориальные объекты масштабируются, следует ли применять стандартизацию к соответствующим столбцам и затем собирать столбцы в вектор объектов?
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...