Как использовать парную и листовую регрессию в Python - PullRequest
0 голосов
/ 05 мая 2019

У меня есть список URLs, где каждому из них назначается rank (Примечание. Для одного ранга может быть несколько URL. Например, rank 1 назначается для 10 URL-адресов).

Часть моего набора данных упоминается следующим образом:

**URL   Rank**
url1   5
url2   1
url3   3
url4   1
url5   2
url6   2
url7   3
url8   1
url9   5
url10  4
url11  3
url12  1
url13  5
url14  4
url15  2
url16  3
url17  2
url18  3

В настоящее время я использую pointwise-regression с использованием регрессора xgb следующим образом, используя sklearn в python.

X = df[selected_features]
y = df['rank']
x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)
rfc = XGBRegressor(random_state = 42)
k_fold = StratifiedKFold(n_splits=5, shuffle=True, random_state=0)
print(cross_val_score(rfc, X, y, cv=k_fold).mean())

Однако результаты моего pointwise regression работают очень плохо. Поэтому я заинтересован в выполнении pairwise/listwise регрессии для моей проблемы, чтобы проверить, могу ли я улучшить результаты регрессии.

Я хотел бы знать, возможно ли применить pairwise or listwise регрессию для моей проблемы. Если так, то как?

Я с удовольствием предоставлю более подробную информацию, если это необходимо.

...