LibSVM и нечисловые данные - PullRequest
       54

LibSVM и нечисловые данные

2 голосов
/ 25 ноября 2010

Я заинтересован в категоризации текста с использованием LibSVM.Как вы рекомендуете конвертировать термины / слова в числовые данные, чтобы LibSVM мог это понять?

Спасибо!

1 Ответ

2 голосов
/ 26 ноября 2010

В категоризации текста люди склонны строить гистограммы слов, используемых в домене, иногда они смотрят на комбинации двух слов и помещают это в свою гистограмму (это называется биграммами). Но это действительно зависит от ваших данных и ваших целей.

...