У меня есть список URLs
, где каждому из них назначается rank
(Примечание. Для одного ранга может быть несколько URL. Например, rank 1
назначается для 10 URL-адресов).
Часть моего набора данных упоминается следующим образом:
**URL Rank**
url1 5
url2 1
url3 3
url4 1
url5 2
url6 2
url7 3
url8 1
url9 5
url10 4
url11 3
url12 1
url13 5
url14 4
url15 2
url16 3
url17 2
url18 3
В настоящее время я использую pointwise-regression
с использованием регрессора xgb следующим образом, используя sklearn
в python.
X = df[selected_features]
y = df['rank']
x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)
rfc = XGBRegressor(random_state = 42)
k_fold = StratifiedKFold(n_splits=5, shuffle=True, random_state=0)
print(cross_val_score(rfc, X, y, cv=k_fold).mean())
Однако результаты моего pointwise regression
работают очень плохо. Поэтому я заинтересован в выполнении pairwise/listwise
регрессии для моей проблемы, чтобы проверить, могу ли я улучшить результаты регрессии.
Я хотел бы знать, возможно ли применить pairwise or listwise
регрессию для моей проблемы. Если так, то как?
Я с удовольствием предоставлю более подробную информацию, если это необходимо.