Я предполагаю, что вы хотите удалить один столбец и для недвоичных категориальных функций, чтобы избежать мультиколлинеарности, которая может вызвать проблемы для линейных моделей.Это так же просто, как предоставить drop_first=True
аргумент pd.get_dummies()
.Кажется, что sklearn.preprocessing.OneHotEncoder
не имеет простого интерфейса для этого, и в любом случае его использование сложно, так как категориальные особенности должны быть заранее закодированы в int
.