Является ли Solr хорошим решением для проблемы, описанной ниже? - PullRequest
3 голосов
/ 24 августа 2011

Я работаю добровольно для некоммерческой организации, и генеральный директор хотел бы приложение, которое хранит резюме профессоров университета. Резюме должны быть доступны для поиска, чтобы их могли найти возможные работодатели. Резюме может быть в различных форматах, включая PDF или Word.

Сайт в настоящее время основан на Joomla !, но может перейти на Drupal. В любом случае разработчики знакомы с PHP. Я знаком с PHP и Java.

Какая архитектура лучше всего подходит для этого приложения? Я рассматриваю:

  1. Установка версии SOLR для Java или PHP и ссылки на нее через PHP, используя расширение PHP Solr.
  2. Использование PHP-версии Lucene напрямую и в обход Solr.
  3. Используйте расширение Search Lucene API Drupal, которое обеспечивает Solr-подобную функциональность.

Если я упустил какие-либо возможности, пожалуйста, дайте мне знать.

Кроме того, я не смог найти хорошую книгу о Solr на Амазонке. Тем не менее, на Lucene есть хороший (серия In Action). К сожалению, в нем лишь кратко упоминается Solr. Стоит ли читать хорошую книгу по Lucene, чтобы понять, как лучше использовать Solr, или я трачу свое время / деньги? Я также не смог найти хороших книг по Solr ... но, может быть, вы можете порекомендовать одну.

Ответы [ 3 ]

2 голосов
/ 24 августа 2011

Да, Solr хорошо подходит:

  • Solr выходит из коробки с функцией под названием ExtractingRequestHandler , которая позволяет легко индексировать Word, PDF и другие проприетарные форматы..
  • Solr легко настраивается, когда дело доходит до полнотекстового поиска, вы, вероятно, получите лучшие результаты, чем с полнотекстовым MySQL.
  • Solr работает быстро.Полнотекстовый MySQL, не так много .
  • Solr включает многогранную навигацию .
  • Для Solr есть два модуля интеграции Joomla (JSolr , TNR ESearch ) и one для Drupal .

Выбор Solr - это не только его производительность, но и его функции и гибкость.

О книгах Solr, см .:

Книги о Lucene помогут вам понятькак обрабатывается текст под капотом, что может пригодиться, если вам нужно настроить анализ текста, однако я бы рекомендовал начать с книги о Solr.

0 голосов
/ 24 августа 2011

Solr - отличный вариант, однако, исходя из ваших требований, я предлагаю вам воспользоваться поисковой системой Sphinx, которая имеет превосходно документированный PHP API.Обратите внимание, что я люблю Solr за некоторые из его замечательных возможностей, однако Solr не может победить Sphinx по отношению к алгоритмам индексации (т. Е. Время индекса и размер индекса на диске).

На сервере корпоративного поиска Solr - Solr 1.4 [PACKT PUBLISHING] имеется отличная книга.Вы также можете пройти через IBM Developer прекрасно работает статья о Solr.Ищите «Поиск в Smart с помощью Solr IBM Developerworks» в Google.

PS: Тем не менее я считаю, что Sphinx будет для вас лучшим выбором.

0 голосов
/ 24 августа 2011

Судя по тому, что вы объяснили, ни один Solr не подходит.

Вы были бы более чем способны иметь возможность выполнять полнотекстовый поиск через MySQL, если вам нужно.Тот факт, что вы упоминаете Joomla и Drupal, явно указывает на то, что вы используете RDMS.

Если бы я начал этот проект заново, я бы, вероятно, использовал какой-нибудь движок noSQL, например MongoDB, для создания своих документов резюме. www.mongodb.com

Так я бы сохранил своих данных.

Если затем возникнет необходимость в поиске документов, я рассмотрю использование Solr только в том случае, если рассчитываю на тысячи и тысячи поисков в день.Это действительно не требует усилий по внедрению приложения Solr, если вы ожидаете только 100-1000 поисков в день.

И, чтобы ответить на вопрос о книге «Solr», книга, которой я владею и которой я бы порекомендовал, является http://www.packtpub.com/solr-1-4-enterprise-search-server/book, но я уверен, что вы, возможно, найдете что-то более новое.Я купил это как 18-24 месяца назад.

Сначала вы захотите сохранить данные о каждом человеке ... так что

...