Создание хранилища документов с возможностью поиска - PullRequest
2 голосов
/ 26 января 2012

Мне нужно создать хранилище документов с возможностями поиска. Звучит просто ... Это означает, что у меня есть документы, которые мне нужно хранить в базе данных. Я думал о CouchDB и о нескольких других документно-ориентированных базах данных, но я все еще не уверен, что будет лучшим решением.

С другой стороны, я думал об интеграции Solr в какое-то веб-приложение, которое я собираюсь использовать для загрузки, индексации, поиска, обновления, удаления документов. И, конечно же, основная проблема заключается в том, что большинство этих документов написаны с использованием кириллических символов.

Может быть, я пытаюсь объединить вещи, которые не совпадают друг с другом. Может ли кто-нибудь дать мне совет, как лучше всего реализовать подобное решение?

Лучший, Joksimovic

Ответы [ 3 ]

0 голосов
/ 26 января 2012

Я также работаю над такой системой управления контентом.До сих пор я собираюсь использовать базу данных для хранения метаданных.Храните документы в файловой системе.Не идите для хранения документов в базе данных, как SQL-сервер.поскольку у него есть ограничения и стоимость лицензирования. Для поиска вы можете использовать Solr (лучше с точки зрения поддержки и принятия в open source через sphinx)

Выбор автономного сервера полнотекстового поиска: Sphinxили SOLR?

.В любом случае вам нужно заполнить индексы.затем вызовите методы API для поиска.

0 голосов
/ 26 января 2012

Brate Srbine / Crnogorče:)
Я предлагаю вам использовать MongoDB в качестве базы данных и использовать Solr для получения индекса / возможности поиска.

Я использовал Solr в своем предыдущем (правительствонежный) проект, и он БОЛЬШОЙ.
Нет ошибок, прост в использовании, когда вы в него входите, и он невероятно быстрый.

0 голосов
/ 26 января 2012

Похоже на твои нужды. Думающий сфинкс может помочь. Вы можете хранить документы в любой базе данных (ориентированной на SQL или нет) и искать их с помощью sphinx. Sphinx поддерживает кириллические символы из коробки, также можно использовать стволовые, многогранный поиск, нечеткий поиск и т.д.

Подробнее о сфинксе здесь

...