следующий код:
Кодирование категориальных данных
X = pd.DataFrame(X)
X = pd.get_dummies(X,columns=[0,1,27,28,29,30,31,32,33,34])
X = X.values
X = pd.DataFrame(X)
прогнозирование данных нескольких строк
X_from_chk = pd.read_excel('ERC_CHK.xlsx')
X_from_chk=X_from_chk.iloc[:, 1:33].values
X_from_chk = pd.DataFrame(X_from_chk)
X_from_chk = pd.get_dummies(X_from_chk,columns=[0,1,23,24,25,26,27,28,29,30,31])
X_test_chk = sc.fit_transform(X_from_chk)
predictions = classifier.predict(X_test_chk)
predictions = (predictions>0.5)
ValueError: Ошибка при проверке ввода: ожидаетсяПлотность_в_положим, чтобы иметь форму (391,), но получил массив с формой (96,)
Я понимаю, что эта ошибка связана с тем, что в наборе данных прогнозирования у нас не так много категориальных значений.
Вопрос в том, как нам подготовить наш набор данных прогнозирования к модели?как количество столбцов может быть меньше после кодирования категориальных данных с использованием get_dummies или кодирования меток?