почему дерево решений и другие ансамблевые модели предсказывают один и тот же результат для разных невидимых данных - PullRequest
0 голосов
/ 24 июня 2019

Я создал несколько регрессионных моделей, включая линейную регрессию, KNN, дерево решений и т. Д. Я обнаружил, что DT дает наилучший результат с точки зрения R2 (наивысший) и RMSE (наименьший) как для набора поездов, так и для наборов проверки, с небольшим переоснащением. Таким образом, я использовал DT, чтобы предсказать результат двух тестовых / невидимых наблюдений. они дают один и тот же результат / прогноз. То же самое происходит со всеми другими регрессорами, за исключением LR, который дает немного другой результат среди двух тестовых наблюдений. Когда я использую тот же метод tree.predict () для отображения прогнозов для набора задержек / проверок, я вижу, что модель дает разные результаты. Я пришел к выводу, что метод tree.predict () работает правильно. но по какой-то причине он дает одинаковый результат для этих двух совершенно невидимых наблюдений.

...