В настоящее время у меня есть набор данных с 3 столбцами, загруженными в WEKA:
- Номинальный {Walk_in, Scheduled_walk_in, Scheduled}
- Номинал {Да, Нет}
- Номинал {Да, Нет}, который я сделал классом для классификации
Я успешно обучил модель NaiveBayes с точностью 68% и каппой 0,23 (я знаю, что это низко, но это должно быть справедливое соглашение, верно?).
Я также вижу, что WEKA возвращает F-меру, но я не совсем уверен, является ли это жизнеспособным тестом статистической гипотезы, поскольку я узнал только о p-тесте и t-тесте.
Я пытался вычислить p-тест или t-тест, но я не могу понять, как это сделать на номинальных значениях. Я попытался изменить номинальные значения на числа, но это привело к странным результатам.
Кто может помочь мне выяснить, как я могу провести проверку гипотезы на наборе данных только с номинальными точками данных?
Заранее спасибо