Я хотел бы реализовать поисковую систему, которая должна сканировать набор веб-сайтов, извлекать конкретную информацию со страниц и создавать полнотекстовый индекс этой конкретной информации.
Мне кажется, что Xapian может быть хорошим выбором для библиотеки поисковых систем.
Какие есть варианты интеграции сканера / сканера с Xapian?
Будет ли Solr лучшим выбором, чем Xapian, интегрироваться с сканерами / анализаторами с открытым исходным кодом?