Матрица путаницы байесовской сети - PullRequest
3 голосов
/ 31 мая 2010

Я пытаюсь понять байесовскую сеть. У меня есть файл данных, который имеет 10 атрибутов, я хочу получить таблицу путаницы этой таблицы данных, я подумал, что мне нужно вычислить tp, fp, fn, tn всех полей. Это правда ? если это то, что мне нужно сделать для байесовской сети.

Действительно нужно какое-то руководство, я потерялся.

Ответы [ 3 ]

4 голосов
/ 05 июня 2010

Процесс обычно происходит следующим образом:

  • У вас есть несколько помеченных экземпляров данных, которые вы хотите использовать для обучения классификатора, чтобы он мог предсказать класс новых немеченых экземпляров.
  • Используя выбранный вами классификатор (нейронные сети, сеть Байеса, SVM и т. Д.), Мы создаем модель с вашими данными обучения в качестве входных данных.
  • На этом этапе вы обычно хотели бы оценитьпроизводительность модели перед ее развертыванием.Таким образом, используя ранее неиспользованное подмножество данных (набор тестов), мы сравниваем классификацию модели для этих экземпляров с классификацией фактического класса.Хороший способ суммировать эти результаты - запутанная матрица, которая показывает, как прогнозируется каждый класс экземпляров.

Для задач двоичной классификации принято назначать один класс как положительный, а другой какотрицательный.Таким образом, из матрицы путаницы процент положительных случаев, которые правильно классифицируются как положительные, известен как показатель истинного положительного результата (TP).Другие определения следуют тому же соглашению ...

3 голосов
/ 03 июня 2010

Матрица путаницы используется для оценки производительности классификатора, любой классификатор .

0 голосов
/ 03 февраля 2016

То, что вы спрашиваете, - это путаница с более чем двумя классами. Вот как это сделать:

  • Построить классификатор для каждого класса, где тренировочный набор состоит из набор документов в классе (положительные метки) и его дополнение (отрицательные метки).
  • С учетом тестового документа применять каждый классификатор отдельно.
  • Присвойте документ классу с максимальной оценкой, максимальное значение достоверности или максимальная вероятность

Вот ссылка на статью, вы можете получить больше информации:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.
...