Панды get_dummies медленно работают с большими данными - PullRequest
0 голосов
/ 18 декабря 2018

Я имею дело с относительно большим фреймом данных: 1M + строки и 400+ столбцов.Из этих 400 столбцов около 10 необходимо преобразовать в одну горячую.Я полагаю, что число различных значений в столбце посредственное (50-100).Я задаюсь вопросом, есть ли альтернативный подход к этому, поскольку pd.get_dummies(df, columns=df.select_dtypes("object").columns.values) отнимает уйму времени.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...