Поскольку ответ в значительной степени зависит от характера ваших данных, я бы посоветовал поиграть с несколькими вариантами, возможно, с помощью набора для проверки.
Самый простой путь, вероятно, будет использовать Weka или RapidMiner для экспериментов. Выбирая из множества предоставляемых ими вариантов, вы, вероятно, познакомитесь с несколькими другими методами.
Сказав это, я обнаружил, что Взаимная информация / Infogain полезна для решения широкого круга проблем.