Глядя на документацию OneHotEncoder
, кажется, нет способа включить имена объектов в качестве префикса векторов OneHot. Кто-нибудь знает способ обойти это? Я что-то упустил?
Пример кадра данных:
df = pd.DataFrame({'a':['c1', 'c1', 'c2', 'c1', 'c3'], 'b':['c1', 'c4', 'c1', 'c1', 'c1']})
from sklearn.preprocessing import OneHotEncoder
onehot = OneHotEncoder()
onehot.fit(df)
onehot.get_feature_names()
array(['x0_c1', 'x0_c2', 'x0_c3', 'x1_c1', 'x1_c4'], dtype=object)
Где при условии, что кодировщик получает кадр данных, я ожидаю возможность получить что-то вроде:
array(['a_c1', 'a_c2', 'a_c3', 'b_c1', 'b_c4'], dtype=object)