Как сформировать список возможных тегов? - PullRequest
2 голосов
/ 28 мая 2011

Мой сайт должен разработать обширный список ключевых слов и ключевых фраз, относящихся к его отрасли, чтобы, когда пользователи публикуют определенные вещи, публикация могла быть помечена соответствующим образом.

Помимо ручного создания списка из тысячслов и фраз, что является обычной практикой для создания такого списка?

Это делается путем разбора сообщений на общие ключевые слова или что-то еще?

THOUGHT:

Мне кажется, что полагаться на анализ сообщений в том виде, в котором они размещены, поначалу будет довольно ограниченно, и это будет означать, что только после более продолжительной разработки контента на сайте у меня будет приличный список ключевых слов.

Ответы [ 2 ]

2 голосов
/ 28 мая 2011

Я бы попросил помощи у пользователя;когда пользователь публикует сообщение, он может выбрать уже существующие теги и добавить новые.Новые могут появиться напрямую или перейти в очередь для модерации вами.

1 голос
/ 28 мая 2011

Вы можете попытаться обучить экспертную систему, возможно, байесовский классификатор, для классификации документов (тегов), аналогично тому, как эксперты (люди) классифицировали подобные документы. Тем не менее, вам нужна человеческая тренировка, так что вы должны начать работать в первую очередь. Тогда вы, вероятно, обнаружите, что попытка рекомендовать теги пользователям является большой работой и подвержена ошибкам, и пропустите эту часть.

...