Как получить последний измененный документ или время создания документа, отсканированного и проиндексированного с помощью nutch + solr? - PullRequest
0 голосов
/ 15 октября 2018

Мне нужно получить последний измененный документ или время создания документа в некоторой внутренней сети, отсканированные и проиндексированные с помощью команды nutch + solr?Я попытался использовать поле Metadata.LAST_MODIFIED, но оно вернуло меня пустым.Они нужны мне при отображении результатов поиска.Дата возвращает дату сканирования.Я не очень опытен в этом, поэтому любая помощь приветствуется!Большое спасибо.С уважением, Алекс

Ответы [ 2 ]

0 голосов
/ 31 октября 2018

Я нашел здесь возможный ответ, но он не совсем то, что я ищу, он более сложный, чем этот, но может быть полезен для других: www.ryanpfister.com/2009/04/how-to-sort-по дате-с-Nutch /

0 голосов
/ 17 октября 2018

Скорее всего, проверенный вами URL не вернул заголовок последнего изменения.Большинство веб-страниц не возвращают эту информацию.Поскольку он находится в вашей интрасети, я предлагаю протестировать его с помощью какого-либо инструмента (например, сетевого монитора Chrome Developer Tools), чтобы убедиться, что заголовок действительно возвращен.

...