У меня есть разные функции в моем поезде и тестовом наборе для Random Forest - PullRequest
0 голосов
/ 04 октября 2018

Должен ли я выбирать только важные функции из набора поездов и использовать их для прогнозов или создавать столбцы с 0 значениями для тех функций, которые не включены?

обучающий набор 6160 функций тестовый набор 4000 функций

1 Ответ

0 голосов
/ 04 октября 2018

Использование только соответствующих функций, которые на самом деле влияют на ваш прогноз - это путь.Использование ненужных столбцов функций просто не помогает, скорее увеличивает время и сложность обучения.

А несовместимые функции, наборы для обучения и тестирования просто не работают.Поэтому удалите столбцы из набора данных, которые не соответствуют ни тестовым, ни обучающим наборам, или попробуйте получить другие данные.

Не добавляйте столбцы объектов со значениями 0, так как это само значение объекта и будет рассматриваться как неверные данные, что приведет к неточной модели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...