выбор атрибута + weka + наивный байесовский - PullRequest
0 голосов
/ 26 марта 2012

Интересно, какой метод из следующих трех методов является лучшим для выбора атрибутов:

  1. с использованием мета-классификатора
  2. фильтрация
  3. нативный подход, использующий классы выбора атрибутов напрямую

Используемый мной классификатор - Наивный Байес.

Может ли кто-нибудь помочь мне найти лучший выбор?

Ответы [ 2 ]

1 голос
/ 26 марта 2012

Существует теория под названием Нет бесплатного обеда . Вы должны попробовать все три из них в своей задаче, чтобы получить результат в вашем домене.

0 голосов
/ 30 марта 2012

Ну, нет единого ответа.

  1. Вы можете использовать классификатор дерева решений (например, пакетирование) и выбрать атрибуты, по которым решения о ветвлении принимаются классификатором.Конечно, вы можете увидеть дерево, чтобы увидеть ветвление и атрибут, на основе которого сделано ветвление (и эти атрибуты важны).

  2. Вы можете использовать метод прямого выбора или обратного исключения,(a) при прямом выборе используйте одну особенность, для которой ошибка при проверке / наборе испытаний является наименьшей.Затем, включив эту функцию в свой пул функций, попробуйте остальные функции по одной и выберите ту, которая, опять же, дает наименьшую ошибку.(б) в обратной ликвидации, используйте все функции и принять уровень ошибок.Затем исключите каждую функцию по одному.Затем выберите тот, который нужно убрать из пула функций, который дает максимальное уменьшение ошибки.

Продолжайте процесс, если вы не удовлетворены количеством функций (критериями остановки).

  1. Я лично использую алгоритм ранкера и оценщик атрибутов Infogain для ранжированияАтрибуты сначала, а затем используйте 2 (a) или 2 (b) для выбора атрибутов.

Ошибки - вы можете рассмотреть среднеквадратическую ошибку.Другие тоже могут делать добро.

...