Question

Я строю модель классификации, используя sklearn's GradientBoostingClassifier. Для одной и той же модели я пробовал разные методы предварительной обработки: StandarScaler, Scale, and Normalizer для одних и тех же данных, но каждый раз я получаю разные f1_scores. Для StandardScaler он самый высокий и самый низкий для Normalizer. Почему это так? Есть ли другой метод, за который я могу получить еще более высокий балл?

Hugolmn · Answer 1 · 10 июля 2020

Разница заключается в их соответствующих определениях:

StandardScaler: стандартизация функций путем удаления среднего и масштабирования до единичной дисперсии
Нормализатор: нормализовать выборки индивидуально до единичной нормы.
Масштаб: стандартизируйте набор данных по любой оси. Отцентрируйте среднее значение и по компонентной шкале до единичной дисперсии.

Данные, используемые для соответствия вашей модели, изменятся, также как и оценка F1.

Вот полезная ссылка для сравнения различных скейлеры: https://scikit-learn.org/stable/auto_examples/preprocessing/plot_all_scaling.html#sphx -glr-auto-examples-preprocessing-plot-all-scaling-py

Различные оценки F1 для разных методов предварительной обработки - sklearn

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Различные оценки F1 для разных методов предварительной обработки - sklearn

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы