Я хотел закодировать целевую категориальную переменную моего набора данных! Но я получаю эту ошибку индекса при этом. Вот код:
#impoting the dataset
data = pd.read_csv(r'C:\Users\aakash\Desktop\Python Programming Course\iris.csv')
X = data.iloc[:,4:]
#Encoding the categorical data
from sklearn.preprocessing import LabelEncoder
labelencoder = LabelEncoder()
X = labelencoder.fit_transform(X)
#OneHotEncoder
from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0])
X = onehotencoder.fit_transform(X).toarray
LabelEncoder работает нормально, но OnehotEncoder выдает эту ошибку:
Traceback (most recent call last):
File "<ipython-input-40-3e36b8c72249>", line 7, in <module>
X = onehotencoder.fit_transform(X).toarray
File "C:\Users\aakash\Anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py", line 624, in fit_transform
self._handle_deprecations(X)
File "C:\Users\aakash\Anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py", line 453, in _handle_deprecations
n_features = X.shape[1]
IndexError: tuple index out of range
Я пытался использовать без .toarray, но все равно получала ту же ошибку.