Хиты не найдены с помощью Zend Lucene Search - PullRequest
0 голосов
/ 23 мая 2009

Итак, я работал над сценарием сканирования, чтобы проиндексировать все страницы на моем сайте с помощью поиска Zend Lucene. Я смог заставить скрипт работать, но по некоторым причинам не могу найти другие ссылки на страницах. Похоже, проблема в том, что скрипт выполняет поиск методом:

$hits = $index->find('url:'.$targets[$i]);

Когда я выполняю скрипт, в массиве нет попаданий, поэтому сканер индексирует только начальный URI. Любые идеи о том, что я могу попробовать?

Ответы [ 2 ]

2 голосов
/ 28 мая 2009

Существует инструмент для просмотра индекса lucene, который позволит вам увидеть, что индексируется. Люк должен показать, что было проиндексировано, и протестировать некоторые поиски.

Вы уверены, что поле URL индексируется при создании индекса, возможно, вы просто сохраняете информацию, а не делаете доступным для поиска:

AddField (Zend_Search_Lucene_Field :: UnIndexed

не будет найдено, так как не проиндексировано

0 голосов
/ 20 июля 2009

Если у вас есть цифры в индексе, это поможет.

Для распознавания чисел используйте: Zend_Search_Lucene_Analysis_Analyzer :: setDefault (новый Zend_Search_Lucene_Analysis_Analyzer_Common_TextNum_CaseInsensitive ()); в качестве анализатора по умолчанию. Для получения дополнительной информации обратитесь http://framework.zend.com/manual/en/zend.search.lucene.extending.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...