как я могу сделать normalize () или StandardScaler (), если данные все еще в строковом формате? параметр должен быть tfidf? и как я могу вручную преобразовать строку в tfidf, когда я не использую конвейер? я получил ошибку, как это: ValueError: не удалось преобразовать строку в плавающее: 'お 気 に 入 り の Ubuntu: 無償 OS & amp; う ソ フ ト で 何 で も 揃 う! : 10 04 LTS 日本語 Remix 版 '
после того, как я позвонил
X_train, X_test, y_train, y_test = train_test_split(
df.body_wakati, #data
y, #here the y is classification
test_size=0.2,
random_state=10,
shuffle=True
)
X_train - строка
редактировать: код