Как сортировать сайты по категориям на основе содержания ключевых слов - PullRequest
0 голосов
/ 25 февраля 2010

Я пишу веб-робота, который классифицирует сайты на основе ключевых слов / мета / ссылок в заранее определенный список категорий.

Я изучал различные подходы к онтологии и смотрел на Wordnet (для гиперного / гипонима), ResearchCyc, WebKb и задавался вопросом, было ли это такой же сложной проблемой, как я думаю, или она была решена где-то еще до этого.

По сути, у меня большие стеки отсортированных значений ключевых слов, и я хотел бы использовать их для сопоставления с именем категории. Мои нынешние мысли состоят в том, чтобы проверить соответствие имени категории в какой-то иерархии онтологий.

Кто-нибудь еще подходил к такой проблеме на основе онтологий?

Ура!

1 Ответ

0 голосов
/ 25 февраля 2010

Возможно, вы захотите взглянуть на анализ текста, в частности поиск ключевых слов или предметную индексацию , исследование.

...