Lucene - Zend_Search_Lucene - как создать индекс для «помеченного» контента - PullRequest
0 голосов
/ 22 января 2010

У меня следующая проблема, мне нужно создать индекс lucene для статей с тегами.

Вот упрощенная структура данных и предложение Lucene:

article_id -> unindexed
article_title -> UnStored
article_content -> UnStored
article_tags -> ????? (here is the problem)

Таким образом, статья может иметь несколько тегов. Допустим, у нас есть статья А, которая имеет следующие теги: T1, T2, T3. Проблема в том, что T1, T2, T3 представлены идентификатором (номером), я не могу сохранить его в индексе как текстовое представление, потому что его можно изменить (тогда мне нужно будет перестроить индекс, ища все статьи с тегом, который был изменен удалите и добавьте их в индекс еще раз). Затем мне нужно искать в статьях с тегами T1 и T2. Количество тегов, присваиваемых статье, не ограничено (отношение 1-n). Есть ли возможность поиска по статьям с определенными тегами (идентификаторами тегов)?

Надеюсь, мне ясно. У кого-нибудь есть эффективное решение этой проблемы?

Заранее спасибо.

1 Ответ

0 голосов
/ 27 января 2010

Вы можете сделать это с Lucene. Одним из способов является создание документа для каждой пары тег-статья и поиск тегов с помощью AND.

Вы должны использовать Lucene? Я не уверен В вашем описании вы не используете полнотекстовый поиск. Почему бы не использовать базу данных? Я предлагаю вам прочитать Поисковая система и СУБД и выбрать в соответствии с определенными там критериями.

...