У меня есть набор данных, полный категориальных значений, которые не закодированы в данный момент. Например, у меня есть переменная с именем condition
, которая имеет следующие значения:
Very Excellent
, Excellent
, Very Good
Я хочу закодировать их (дать им целочисленные значения), чтобы я мог использовать их в качестве категориальных фиктивных переменных в регрессии. Однако в моем фрейме данных их много, поэтому я бы хотел перебирать каждый столбец и кодировать все объекты dtype.
Это моя попытка:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
enc=LabelEncoder()
for column in df_06:
if df_06["column"].values==object:
df_06["column"]=enc.fit_transform(df_06["column"])
Мой фрейм данных
Ошибка:
<ipython-input-48-ea6aec86108f> in <module>()
1 for column in df_06:
----> 2 if df_06[column].values==object:
3 df_06[column]=enc.fit_transform(df_06[column])
ValueError: The truth value of an array with more than one element is
ambiguous. Use a.any() or a.all()