Я пишу веб-робота, который классифицирует сайты на основе ключевых слов / мета / ссылок в заранее определенный список категорий.
Я изучал различные подходы к онтологии и смотрел на Wordnet (для гиперного / гипонима), ResearchCyc, WebKb и задавался вопросом, было ли это такой же сложной проблемой, как я думаю, или она была решена где-то еще до этого.
По сути, у меня большие стеки отсортированных значений ключевых слов, и я хотел бы использовать их для сопоставления с именем категории. Мои нынешние мысли состоят в том, чтобы проверить соответствие имени категории в какой-то иерархии онтологий.
Кто-нибудь еще подходил к такой проблеме на основе онтологий?
Ура!