Pyspark: среднее (целевое) кодирование для категориальных функций spark dataFrame - PullRequest
0 голосов
/ 20 сентября 2018

Я хочу закодировать категориальные характеристики кадра данных искры (df), используя средний (целевой) кодер в PySpark.Есть ли у вас какие-либо идеи, если для этого есть appraoch build-it?

* Я знаю, что уже существуют некоторые пакеты для кодирования pandas dataframe, но я не хочу преобразовывать мой dataframe в pandas.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...