Итак, у меня есть набор данных (shape = (1000,38)
), почти половина из которых должна быть категоричной, но в настоящее время в формате int64
или object
.Я немного новичок в Python, поэтому мои навыки слабые, но я могу конвертировать каждый столбец вручную, используя:
data[col] = data[col].astype('category')
, но я уверен, что есть более простой способ сделать это с помощью цикла for.Моя мысль была:
for col in data :
if data.col.unique() <= 3
print(data[col] = data[col].astype('category'))
else print(data[col])
Я знаю, что это неправильно, но я хочу сделать цикл, чтобы определить любой column
, который имеет >=
3 unique()
values
и преобразовать этот столбецкатегорически.Любая помощь будет оценена!