Грубое сокращение на основе набора атрибутов - PullRequest
0 голосов
/ 08 декабря 2010

Я попробовал RSAR, бесплатный пакет, но мне интересно, есть ли другие хорошие редукторы атрибутов там. Даже пакеты для R или matlab, любой ресурс, позволяющий мне найти минимальный набор атрибутов, которые классифицируют данные. Например, имея набор с сотнями примеров почты и различных атрибутов, которые описывают их и классифицируют как спам или не спам, я хочу найти минимальный набор атрибутов, которые описывают все данные, чтобы отбросить бесполезную информацию.

Я надеюсь, что я проявил себя, если нет, я открыт для ваших предложений.

Спасибо.

Ответы [ 2 ]

0 голосов
/ 06 сентября 2015

вы можете использовать пакет RoughSets на языке R.См. Описание FS.one.reduct.computation в R (после установки пакета RoughSets)

, например: HIRING2Matrix - это таблица решений с количеством атрибутов.reduct1 - сокращенный набор атрибутов

reduct1 <- FS.one.reduct.computation (HIRING2Matrix, жадный = ИСТИНА, мощность = 1) </p>

0 голосов
/ 16 мая 2011

Учитывая тип проблемы, которую вы описываете, а именно: выбор правильных атрибутов для классификации электронной почты, лучшим способом может быть использование Weka ( Weka home ). Он имеет несколько алгоритмов выбора признаков, которые можно применять как в интерактивном режиме для визуализации их эффекта, так и в сочетании с различными алгоритмами классификации для оценки их влияния на фактическую классификацию. (обратите внимание, что выбор атрибутов для классификации без надлежащей проверки для конкретного классификатора может привести к неоптимальным результатам в реальной жизни).

Некоторые соответствующие ссылки:

Руководство Weka относительно выбора атрибутов

Практический пример (несколько устаревший)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...