Я пытаюсь предсказать намерение пользователей выполнить клик. Итак, я попробовал два подхода RandomForest и LinearRegression, используя библиотеку sklearn в Python.
регрессия:
from sklearn import linear_model
linreg = linear_model.LinearRegression()
linreg.fit(X_train, y_train)
RandomForest:
from sklearn import ensemble
forest = ensemble.RandomForestRegressor()
forest.fit(X_train, y_train)
Вывод регрессии:
Вывод RandomForest:
Как видите, для одного и того же набора функций и одинаковых данных результаты обеих моделей сильно различаются. Кроме того, важность каждого набора функций в обеих моделях различна, и их относительная важность также различна. Итак, кто-нибудь может объяснить это поведение? Мне кажется, что Регрессия неплохо справляется с разделением нулей на ненулевые, верно?