f1 или оценка точности после понижающей выборки - классификация, svm - Python - PullRequest
0 голосов
/ 04 ноября 2018

У меня есть набор данных, состоящий из 15 столбцов и 3000 строк, чтобы обучить модель для двоичной классификации. Существует дисбаланс для у (1: 2). Оба результата (0,1) одинаково важны.

После понижающей дискретизации (поскольку параметр class_weight = сбалансированный не работал должным образом), я использовал параметр scoring = "f1", потому что я прочитал, что это было рядом с кривой ROC, лучшим измерением производительности.

Вопрос в следующем: Обращаюсь ли я к своим данным после понижающей дискретизации как к несбалансированным и, следовательно, применяю f1 или могу вернуться к нормальной точности?

f1 = 2 * (точность * отзыв) / (точность + отзыв)

Ура заранее! :)

1 Ответ

0 голосов
/ 04 ноября 2018

Если вы перебалансировали свои данные, то они больше не несбалансированы, и я не вижу проблем с использованием точности в качестве показателя успеха.

Точность может ввести вас в заблуждение в очень искаженных наборах данных, но, поскольку она больше не перекошена, она должна работать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...