Оптимизация моделей - PullRequest
0 голосов
/ 22 марта 2020

Я все еще очень плохо знаком с машинным обучением и пробовал несколько соревнований на Kaggle, а именно, цену за жилье. Я сделал все в соответствии с учебником, и это сработало нормально. Тем не менее, я читал в другом месте, что если результат обучения намного лучше, чем результат тестирования, это признак переобучения. Таким образом, я скорректировал max_depth случайного леса на 3 в надежде исправить его, и моя оценка тренировок и тестирования приблизилась, как я и надеялся. Однако, когда я представил свой новый CSV, я получил худший результат. Что не так с моей логикой c, я что-то упустил? Я заметил, что и тренировочный, и тестовый баллы, хотя он был ближе, стал хуже, чем раньше, является ли вероятной причиной того, что я сейчас недостаточно тренируюсь?

Спасибо!

К вашему сведению - числа (средняя абсолютная ошибка):
начальный:

Test Score: 21,857
Train Score: 8,584

после max_depth of 3:

Test Score: 28,745
Train Score: 28,072
...