Как рассчитывается столбец «прогноз» в выходных данных Weka Naive Bayes? - PullRequest
2 голосов
/ 01 марта 2012

Я сделал наивную байесовскую классификацию, используя 10-кратную перекрестную проверку, получив прогноз таблицы на основе данных испытаний, который выглядит следующим образом:

=== Predictions on test data ===

   inst#     actual  predicted   error  prediction      (name)
     1    3:no_chang 3:no_chang           0.943       (region_1)
     2    1:active_K 1:active_K           1           (region_2)
     3    3:no_chang 3:no_chang           0.912       (region_3)
     4    3:no_chang 3:no_chang           0.858       (region_4)
     5    3:no_chang 2:active_G   +       0.518       (region_5)

Я хочу знать, как рассчитывается столбец «прогноз». Я знаю, что оно изменяется от 0 до 1, что означает, что предсказание «лучше», но это все, что я мог найти после значительного времени поиска в Google и просмотра книги Weka.

Я знаю, что есть много информации о Weka онлайн, но я немного ошеломлен этим и не могу легко найти ответ на мой простой вопрос. Кроме того, кто-то может указать мне хорошее подробное руководство по weka для пользователя командной строки? Книга Weka, кажется, слишком сосредоточена на объяснении того, как работает GUI, что меня не особо интересует, поскольку я сейчас в основном работаю с инструментами командной строки.

Спасибо,

Juan

1 Ответ

1 голос
/ 29 ноября 2012

При просмотре исходного кода для класса NaiveBayes есть переменная m_ClassDistribution, которая отслеживает прогнозирование класса.

На этапе обучения эта переменная обновляется, чтобы отразитьаприорная вероятность каждого класса.Он используется на этапе тестирования для вычисления апостериорной вероятности того, что данный образец относится к данному классу.

Я бы порекомендовал посмотреть код для DiscreteEstimator и NaiveBayes.В частности, функция distributionForInstance, которая используется на этапе тестирования.Он немного отличается от обычного вычисления наивных байесов, поскольку он также учитывает вес, связанный с каждой функцией.

...