Почему weight_column в Estimator влияет на оценку? - PullRequest
0 голосов
/ 23 марта 2019

У меня есть проблема бинарной классификации с дисбалансом класса (80% класса 1, 20% класса 2). Я использую weight_column, чтобы уравновесить это, который прекрасно работает. Мой единственный вопрос: почему это также влияет на метод estimator.evaluate ()? Я ожидал бы, что единственное значение оценки, которое будет затронуто, это precision_baseline.

Я провожу оценку одной и той же модели дважды, сначала с установленным параметром weight_column, как на тренировке, а вторым с набором weight_column, равным 1,0. Вот результаты:

весовой столбец такой же, как на тренировке

{'precision': 0.881877, 'precision_baseline': 0.5110572, 'auc': 0,9571304, «auc_precision_recall»: 0,9640416, «средняя_отход»: 0,26740322, «метка / среднее»: 0,5110572, «потеря»: 0,43359837, «точность»: 0,94018126, «прогноз / среднее значение»: 0,48013598, «отзыв»: 0,821_816 ': 1716}

weight_column установлен на 1,0

{'precision': 0.9196458, 'precision_baseline': 0.79282826, 'auc': 0,9571304, «auc_precision_recall»: 0,9023722, «средняя_отход»: 0,22132985, «метка / среднее»: 0,201717175, «потеря»: 0,22132985, «точность»: 0,7971311, «прогноз / среднее значение»: 0,27698752, «отзыв»: 0,82110816, «глобальный_» ': 1716}

Мне любопытно, почему затрагиваются такие значения, как точность и отзыв?

...