Я ищу поисковую систему, которая может регулярно (ежедневно) сканировать около 100 страниц на наличие изменений и индексировать связанный сайт, если обнаружены изменения с момента последнего сканирования. Он должен иметь возможность обрабатывать около 100 сайтов, каждый из которых в среднем 4000 страниц среднего размера около 5 000, каждый на своем сервере (но только на одной централизованной поисковой системе) Каждый из этих сайтов будет иметь форму поиска, которая будет отправлена в эту поисковую систему. Возвращаемые результаты должны быть привязаны к сайту, который их отправил. Я создаю шаблоны для внешних сайтов, поэтому могу предоставить форме поиска скрытое поле, в котором указывается, с какого сайта отправляется форма.
Что бы вы посоветовали мне посмотреть?
Я бы хотел использовать для этого систему на основе Python, если это возможно.
В настоящее время я использую то, что называется iSearch2 . В этом масштабе он выглядит не очень стабильным, в описании продукта говорится, что он не предназначен для работы с несколькими сайтами, он написан на PHP (что мне менее удобно, чем на Python) и имеет несколько других недостатков для моего конкретного ситуация.