ROC-кривая из результата классификации или кластеризации - PullRequest
0 голосов
/ 21 марта 2012

Скажите, что я кластеризовал обучающий набор данных из 5 классов, содержащих 1000 экземпляров, в 5 кластеров (центров), используя, например, k-means.Затем я построил матрицу путаницы, проверив набор тестовых данных.Затем я хочу использовать график кривой ROC, как это можно сделать?

1 Ответ

3 голосов
/ 21 марта 2012

Кривые Roc показывают компромисс между истинным положительным и ложным положительным уровнем. Другими словами

Графики ROC - это двумерные графики, на которых график TP показан на ось Y и скорость FP нанесены на ось X Графики ROC: примечания и практические рекомендации для исследователей

Когда вы используете дискретный классификатор, этот классификатор создает только одну точку в пространстве ROC. Обычно вам нужен классификатор, который выдает вероятности. Вы изменяете свои параметры в классификаторе, так что ваши ставки TP и FP меняются. После этого вы используете эти точки, чтобы нарисовать ROC-кривую.

Допустим, вы используете k-средства. K-средства дают вам членство в кластере дискретно. Точка принадлежит ClusterA или .. ClusterE. Поэтому вывод кривой ROC из k-средних не является простым. Ли и Фудзита описывает алгоритм для этого. Вы должны посмотреть на их бумагу. Но алгоритм что-то вроде этого.

  1. Применить к-значит
  2. рассчитать TP и FP, используя данные испытаний.
  3. изменить членство точек данных с одного кластера на второй кластер.
  4. снова рассчитать TP и FP, используя данные испытаний.

Как вы видите, они получают больше точек в пространстве ROC и используют эти точки для рисования кривой ROC

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...