Результаты точности XgBoost отличаются при каждом запуске с одинаковыми параметрами.Как я могу сделать их постоянными? - PullRequest
0 голосов
/ 04 июня 2018

Результаты 'merror' и 'logloss' из мультиклассовой классификации XGB отличаются примерно на 0,01 или 0,02 при каждом запуске с одинаковыми параметрами.Это нормально?

Я хочу, чтобы значения 'merror' и 'logloss' были постоянными, когда я запускаю XGB с одинаковыми параметрами, чтобы я мог точно оценить модель (например, когда я добавляю новую функцию).

ТеперьЕсли я добавляю новую функцию, я не могу точно сказать, оказала ли она положительное влияние на точность моей модели или нет, потому что мои 'merror' и 'logloss' отличаются при каждом запуске независимо от того, вносил ли я какие-либо изменения в модель илиданные, введенные в него с момента последнего запуска.

Должен ли я попытаться это исправить, и если я должен, как я могу это сделать?

1 Ответ

0 голосов
/ 06 июня 2018

удалось решить это.Сначала я установил для параметра 'seed' XgBoost фиксированное значение, как предложил Хадус.Затем я обнаружил, что ранее использовал функцию sklearn's train_test_split в блокноте, не устанавливая для параметра random_state фиксированное значение.Поэтому я установил для параметра random_state значение 22 (вы можете использовать любое целое число), и теперь я получаю постоянные результаты.

...