Фильтрация атрибутов с помощью Weka - PullRequest
2 голосов
/ 28 мая 2010

У меня простой вопрос о фильтрации атрибутов в WEKA.

Допустим, у меня есть 500 атрибутов, 30 классов и 100 выборок для каждого класса, что составляет 3000 строк и 500 столбцов. Это вызывает проблемы со временем и памятью, которые вы можете догадаться.

Как отфильтровать атрибуты, которые встречаются только один или два (или n раз) в 3000 строк. И это хорошая идея?

Спасибо

1 Ответ

6 голосов
/ 07 июня 2010

Используйте следующий фильтр

weka.filters.unsupervised.attribute.RemoveUseless

Этот фильтр удаляет атрибуты, которые не меняются вообще или слишком сильно различаются. Все постоянные атрибуты удаляются автоматически вместе с любыми, которые превышают максимальный процент отклонения параметра.

...