sklearn_pandas DataFrameMapper портит имена столбцов OneHotEncoder - PullRequest
1 голос
/ 02 ноября 2019
import pandas as pd
import sklearn.preprocessing
import sklearn_pandas

df = pd.DataFrame({'z': ['a', 'b', 'b', 'c']})

sklearn_pandas.DataFrameMapper([
    (['z'], sklearn.preprocessing.OneHotEncoder(drop='first'))
], df_out=True).fit_transform(df)

вывод

   z_x0_b  z_x0_c
0     0.0     0.0
1     1.0     0.0
2     1.0     0.0
3     0.0     1.0

Почему имена столбцов перепутаны? Я не хочу, чтобы там было x0.

Связано

...