Solr и индексация сайта для создания поиска по сайту - PullRequest
7 голосов
/ 20 марта 2010

Я пытался создать «поиск по сайту» на простом http-сайте.

У меня есть сайт, давайте назовем его www.mycompany.com, это чистый HTML.

Есть ли простой способ использовать solr для индексации всего сайта для построения полнотекстового поиска с использованием solr в качестве движка?

Я немного погуглил и не смог найти ничего конкретного: Сделать До Б ... прибыль!

Дайте мне также знать, если я немного не согласен с тем, для чего solr: P

Заранее спасибо.

Ответы [ 3 ]

6 голосов
/ 21 марта 2010

Solr предназначен только для индексации и поиска текста, у него нет сканера, поскольку он выходит за рамки проекта.

Однако взгляните на Nutch , который является гусеничным и не слишком сложным для первоначальной настройки.

Nutch и Solr могут быть интегрированы , если вам нужна особая функция Solr для поиска в индексе.

4 голосов
/ 22 декабря 2015
$ bin/solr create -c corename
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1

Это будет основной индекс сайта, но он не будет лучшим. Если вы хотите просто, то вот оно. Это можно сделать.

Я думаю, что это работает только на Solr 5 +.

1 голос
/ 07 июня 2011

Два других варианта, которые вы можете посмотреть: Сканирование в любом месте и Heritrix

...