Я использовал Nutch 1.4 для сканирования веб-сайтов и проиндексировал данные для Solr 3.5. это было успешно. Я использовал Люка для проверки данных индекса и обнаружил, что было получено 1678 документов. но когда я ввел строку запроса (всего несколько ключевых слов) в интерфейсе solr для поиска, были получены все 1678 документов. это странно, поскольку большинство найденных веб-страниц вообще не содержат этих ключевых слов.
Есть идеи для этой проблемы?
Спасибо.
Гром