Мне нужно закодировать категориальные значения в моем тестовом наборе, так или иначе он выдает TypeError: argument must be a string or number
. Я не знаю, почему это происходит, потому что я мог сделать это с моим поездом. Я имею в виду, что они представляют собой набор функций для обучения и тестирования, поэтому они абсолютно одинаковы, и их отличает только количество рядов. Я не знаю, как это исправить, я пытался использовать разные LabelEncoder для каждого, но это все еще не исправляет ошибку. Пожалуйста, кто-нибудь, помогите мне.
Для вашей информации категориальные данные находятся в столбце 8 в наборе функций поезда и теста
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
from sklearn.impute import SimpleImputer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestRegressor
import scipy.stats as ss
avo_sales = pd.read_csv('avocados.csv')
avo_sales.rename(columns = {'4046':'small PLU sold',
'4225':'large PLU sold',
'4770':'xlarge PLU sold'},
inplace= True)
avo_sales.columns = avo_sales.columns.str.replace(' ','')
x = np.array(avo_sales.drop(['TotalBags','Unnamed:0','year','region','Date'],1))
y = np.array(avo_sales.TotalBags)
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
impC = SimpleImputer(strategy='most_frequent')
X_train[:,8] = impC.fit_transform(X_train[:,8].reshape(-1,1)).ravel()
imp = SimpleImputer(strategy='median')
X_train[:,1:8] = imp.fit_transform(X_train[:,1:8])
le = LabelEncoder()
X_train[:,8] = le.fit_transform(X_train[:,8])
X_test[:,8] = le.fit_transform(X_test[:,8])