Алгоритм, предлагающий пользователям список тегов - PullRequest
2 голосов
/ 16 июня 2010

Учитывая свободный текст, мне нужно проанализировать этот текст и предложить список тегов из ранее существующего списка.
Какие алгоритмы есть на рынке? Могут ли они обрабатывать случай, когда, например, в тексте есть слово типа

высокий уровень холестерина

и я бы хотел так предложить

порок сердца

хотя «высокий уровень холестерина» может не существовать (изначально) в предварительно определенном списке.

Ответы [ 3 ]

0 голосов
/ 16 июня 2010

Посмотрите на эту статью:

http://en.wikipedia.org/wiki/Association_rule_learning

Может быть, это помогает

0 голосов
/ 11 октября 2012

Существуют уже существующие базы данных и плагины для связанных тем и рекомендаций по тегам - посмотрите некоторые из них:

Autotags (js)

Yahoo Term Extractor

OpenCalais

Существует также множество сервисов для автозаполнения / предложения. Вы также можете рассмотреть запрос к Twitter // API некоторых других социальных сетей, чтобы найти теги, основанные на тексте.

0 голосов
/ 16 июня 2010

Звучит так, как будто вам нужны отношения многие ко многим между ключевыми словами (свободный текст) и вашим списком тегов.Таким образом, вы можете применить все правильные ассоциации.

Сам компьютер не будет достаточно умен, чтобы знать, что high cholesterol и heart disease связаны без определения кем-либо отношения в базе данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...