Различные оценки F1 для разных методов предварительной обработки - sklearn - PullRequest
0 голосов
/ 10 июля 2020

Я строю модель классификации, используя sklearn's GradientBoostingClassifier. Для одной и той же модели я пробовал разные методы предварительной обработки: StandarScaler, Scale, and Normalizer для одних и тех же данных, но каждый раз я получаю разные f1_scores. Для StandardScaler он самый высокий и самый низкий для Normalizer. Почему это так? Есть ли другой метод, за который я могу получить еще более высокий балл?

1 Ответ

0 голосов
/ 10 июля 2020

Разница заключается в их соответствующих определениях:

  • StandardScaler: стандартизация функций путем удаления среднего и масштабирования до единичной дисперсии
  • Нормализатор: нормализовать выборки индивидуально до единичной нормы.
  • Масштаб: стандартизируйте набор данных по любой оси. Отцентрируйте среднее значение и по компонентной шкале до единичной дисперсии.

Данные, используемые для соответствия вашей модели, изменятся, также как и оценка F1.

Вот полезная ссылка для сравнения различных скейлеры: https://scikit-learn.org/stable/auto_examples/preprocessing/plot_all_scaling.html#sphx -glr-auto-examples-preprocessing-plot-all-scaling-py

...