Я получаю Average_precision_score (y_test, y_predict) = 1. что за интуиция за этим стоит? - PullRequest
0 голосов
/ 30 октября 2018

Я работаю над несбалансированной двоичной классификацией, и данные на 97% в пользу класса. Я использую наивный байесовский классификатор, и я получаю тест балл как 1. Я использовал medium_precision_score () также как 1. какова интуиция этого результата и как я могу лучше классифицировать эту проблему.

Ответы [ 2 ]

0 голосов
/ 30 октября 2018

Общие вещи, которые вам нужно сделать: 1. CV подход, который учитывает дисбаланс классов (что-то вроде StraifiedKFold). Таким образом, вы можете быть уверены, что в вашем тестовом наборе всегда есть младший класс 2. Другой показатель (возможно, даже пользовательский, который использует разные веса для разных типов ошибок). Например, посмотрите на потерю фокуса 3. Методы передискретизации / понижающей дискретизации (imblearn в Python)

Дальнейшие шаги 4. Визуализация (ЦНЭ). Могу дать вам некоторые идеи об общей схеме 5. Важность функций и разработка функций на основе важных функций (может упростить классификацию) 5. Другие модели (зависят от (4)), повышающие

0 голосов
/ 30 октября 2018

Чтобы лучше классифицировать проблему, вам нужно решить проблему дисбаланса классов. Попробуйте прочитать статьи о том, как справляться с дисбалансом классов, как этот:

https://www.analyticsvidhya.com/blog/2017/03/imbalanced-classification-problem/
...