Классификация английского слова - PullRequest
0 голосов
/ 22 июня 2011

Обнаружение английского слова из строки + классификация У меня есть большая база данных URL-адресов, и я хочу извлечь английское слово из этих данных, а затем классифицировать слова, содержащиеся в URL

Например, apple.com -> apple:Фрукты и приложение: компьютер

Существуют и другие PHP-скрипты, в которых я бы добавил слова на строку, но мне нужна помощь с открытым источником данных для английских слов для классификации

Например, ниндзя =Единоборства

PHP часть их просто ищет.Я видел байесовские сценарии для классификации содержимого страницы, но это больше о паре слов ... и это может быть более сложным, чем то, что нужно.

Заранее спасибо,

1 Ответ

0 голосов
/ 22 сентября 2014

Вы должны посмотреть на Wordnet .Это лексический ресурс, который классифицирует слова, группируя их с их набором синонимов (synset).Это должно помочь вам получить значимую классификацию.

...