Случайный лес против регрессии - PullRequest
0 голосов
/ 01 ноября 2018

Я пытаюсь предсказать намерение пользователей выполнить клик. Итак, я попробовал два подхода RandomForest и LinearRegression, используя библиотеку sklearn в Python.

регрессия:

 from sklearn import linear_model
    linreg = linear_model.LinearRegression()
    linreg.fit(X_train, y_train)

RandomForest:

 from sklearn import ensemble
    forest = ensemble.RandomForestRegressor()
    forest.fit(X_train, y_train)

Вывод регрессии:

enter image description here

Вывод RandomForest:

enter image description here

Как видите, для одного и того же набора функций и одинаковых данных результаты обеих моделей сильно различаются. Кроме того, важность каждого набора функций в обеих моделях различна, и их относительная важность также различна. Итак, кто-нибудь может объяснить это поведение? Мне кажется, что Регрессия неплохо справляется с разделением нулей на ненулевые, верно?

...