Интерпретация результатов с использованием J48 для разделенного атрибута интереса по уровням x (WEKA) - PullRequest
0 голосов
/ 07 апреля 2019

Я новичок в области интеллектуального анализа данных и Weka. Я построил классификатор с J48 в Weka, используя графический интерфейс, с J48 (обучающим набором) для интересующего атрибута на пяти уровнях. Я должен оценить точность модели, но я не очень хорошо знаю, как это сделать! Некоторая информация может представлять интерес:

== Detailed Accuracy By Class ===
Precision
0.80
?
0.67
0.56
?
?

Во-первых, Мне бы хотелось узнать значение «?» в столбце точности. При поиске с атрибутом интереса на двух уровнях я не получил "?". Дерево теперь больше, чем при разделении на два уровня. Я подвергаю сомнению, означает ли это, что получение интересующего атрибута на пяти уровнях может создать менее эффективное дерево с точки зрения классификации и времени вычислений. Это кажется совершенно очевидным, так как количество правильно классифицированных экземпляров, когда у атрибута было 2 уровня, составляло до 72%.

Заранее спасибо, все интересные ответы будут вознаграждены!

1 Ответ

1 голос
/ 08 апреля 2019

«Я хотел бы знать значение«? »В столбце точности»

Обратите внимание, что для этих же классов показатели TP и FP равны 0. Похоже, чтоJ48 не назначил ни одного из ваших наблюдений этим классам.

Эти классы относительно малы?Если это так, вы можете рассмотреть возможность использования фильтра ClassBalancer.При этом используются веса, чтобы все классы выглядели одинаково.

Конечно, после того, как вы получите модель, вам нужно «вернуться обратно» в реальную ситуацию.Это похоже на исправление для физической передискретизации или недостаточной выборки.Смотрите мой ответ здесь: https://stats.stackexchange.com/questions/211174/how-to-exact-prediction-from-over-sampled-dataundoing-oversampling/257507#257507

...