Question

Имея в виду stackoveflow.com (команда из 2-3 инженеров, создающих проект веб-сайта, предназначенный для масштабирования), имеет смысл тратить усилия на ранних этапах разработки, чтобы построить поиск, основанный на Lucene / Autonomy… в отличие от база данных на основе полнотекстового поиска.

Плюсы / Минусы:
При зрелой реализации Lucene, такой как Nutch или автономия, стоимость перехода на Lucene (что неизбежно) на более позднем этапе незначительна.
В больших объемах добавить дополнительные серверы индекса (скажем, с помощью Nutch) для поддержки растущего поискового индекса довольно просто.
При реализации Lucene мне, скорее всего, понадобится дополнительный сервер для поддержки индекса в памяти (гораздо раньше, в процессе масштабирования).

Seun Osewa · Answer 1 · 24 ноября 2008

Производительность полнотекстового поиска в базе данных варьируется от базы к базе данных, но это, безусловно, самый простой вариант для настройки. Поэтому начните с этого и перейдите к люцену или сфинксу, если он окажется слишком медленным.

ripper234 · Answer 2 · 22 июля 2009

Вы должны держать его изолированным - не начинайте бросать SELECTS по всему коду, если вы знаете, что замените их поисковым запросом. Оберните полнотекстовый поиск в вашей БД тонким слоем абстракции, который гарантирует, что вы не используете возможности базы данных там, где вы не должны.

Я второй принятый ответ - преждевременная оптимизация здесь, безусловно, зло.

Сравнение: БД Полнотекстовый поиск в поисковике (Lucene)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сравнение: БД Полнотекстовый поиск в поисковике (Lucene)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы