Получить категорию для текстов - PullRequest
1 голос
/ 30 октября 2011

Я хочу выбрать категорию текста (статьи) (например, спорт, эконом), строку, и я хочу знать, лучший ли способ сделать с функцией similar_text() или иным образомМне нужно сравнить тексты.Одна статья - это описание, которое должно быть отнесено к категориям.Второй текст на самом деле является текстом со всеми ключевыми словами, которые описывают категорию.Сравнивая два текста с учетом процента сходства.Текст, который имеет наибольшее сходство с конкретной категорией, на самом деле и есть эта категория.Должен ли я сделать это криптографическое similar_text() или иным образом?

1 Ответ

1 голос
/ 30 октября 2011

Я бы использовал Байесовский классификатор , чтобы определить степень сходства.

...