Функция поиска для загрузочного приложения Spring на основе Apache Solr - PullRequest
0 голосов
/ 27 января 2020

Мы находимся на этапе планирования для создания функции поиска с автозаполнением для нашего загрузочного приложения Spring, которая будет очень похожа на функцию поиска в Pinterest. Мы рассматриваем вопрос о разработке поисковой системы на основе Apache Solr. Тем не менее, наша команда (2 человека) не имеет предварительного опыта работы с поисковыми системами и будет внедрять решение по мере обучения.

Хотя, я не предоставил наше подробное требование для поисковой системы. Я хотел бы получить информацию от других участников, прежде чем мы начнем вкладывать больше ресурсов в это. Пожалуйста, укажите ваш вклад по следующим пунктам:

  1. Какова кривая обучения для Apache Solr для опытного разработчика Java 7-8 лет?
  2. Какими должны быть усилия оценка (в часах) для построения такой поисковой системы. И оценка доставки с учетом того, что над ней работают два человека?
  3. Какие дополнительные затраты на инфраструктуру следует учитывать для Apache Solr?

Спасибо за ваш вклад.

Обновление Кто-то проголосовал за закрытие вопроса, потому что ответ на вопрос основан на мнении. Что ж, этот вопрос требует от других участников поделиться своим мнением, чтобы мы могли принять лучшее решение о конкретном c сценарии, описанном в вопросе. Это не должно быть проблемой.

1 Ответ

0 голосов
/ 28 января 2020

Я попытался дать ответ на ваши вопросы. Невозможно дать вам точный ответ, пока все вопросы не будут решены. Но если у вас есть ответы на поставленный мной вопрос, это поможет вам провести подробный анализ.

  1. Какова кривая обучения для Apache Solr для 7-8 опыт работы Java разработчик?

    Не нужно никакого java фона как такового для обучающегося solr. Соль разработан на люцене. Lucene - это поисковая библиотека, разработанная в java. Solr основан на конфигурации. Но все же все зависит от того, как вы хотите его использовать. Существует множество опций, с помощью которых вы можете индексировать данные, публикуя данные в виде xml, json et c. Вы можете проиндексировать структурированные данные, такие как rdbms, используя функцию Solr DIH. Вы также можете индексировать данные, используя solrJ api, предназначенные для Java разработчика.

  2. Какой должна быть оценка усилий (в часах) для создания такой поисковой системы. И оценка доставки с учетом двух человек работают над этим?

    Все зависит от объема поисковой системы. Как вы хотите проиндексировать данные? Как вы хотите запросить данные? Какие функции вы хотите реализовать, например, автозаполнение, фасетирование, выделение, фильтрация и т. Д. c. Есть ли необходимость периодически переиндексировать данные.

  3. Какие дополнительные расходы на инфраструктуру следует учитывать для Apache Solr? Solr поставляется с облачной функцией solr. Где solr может использоваться в кластерном или распределенном режиме. Здесь можно использовать функции шардинга и репликации. Если вы хотите использовать облачное решение Solr, необходимо рассмотреть возможность установки узлов zookeeper и solr. Если вы хотите запустить solr в автономном режиме, то вам не нужно много. но опять же все зависит от размера данных, которые были проиндексированы. Как часто это обновляется? Сколько пользователей его запрашивают и т. Д. c.

...