Я работаю над набором данных ключевых слов для многоцелевой регрессии. и я должен предсказать эффективность ключевых слов, предоставив ввод ключевых слов (строка) и цены за клик (числовой) и рынка (числовой). и модель будет прогнозировать производительность и будет давать вывод в виде показов и кликов. поэтому мои целевые переменные - это показы. Как мы знаем, мы должны преобразовать ключевые слова (строки) в некоторый вектор, чтобы компьютер понимал это и использовал для обработки в модели. Я применяю tf-idf к ключевым словам, чтобы преобразовать его в числовую форму. но это выдает ошибку. Кроме того, я прилагаю свой код модели сниппета. и изображение преобразованного столбца ключевых слов в числовой.
Другими словами, я дам ввод [Market, CPC, TKeyword], и модель будет предсказывать [Показы, клики]
Код здесь ::
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.multioutput import MultiOutputRegressor
rng = np.random.RandomState(1)
max_depth = 30
regr_multirf = MultiOutputRegressor(RandomForestRegressor(n_estimators=100, max_depth=max_depth, random_state=0))
regr_multirf.fit(xTrain, yTrain)
regr_rf = RandomForestRegressor(n_estimators=100, max_depth=max_depth, random_state=2)
regr_rf.fit(xTrain, yTrain)
y_multirf = regr_multirf.predict(xTest)
y_rf = regr_rf.predict(xTest)
'' '