SOLR Индекс удаленного файла - PullRequest
3 голосов
/ 15 марта 2011

Кто-нибудь знает, как индексировать удаленный файл с помощью SOLR?Я безуспешно попробовал следующее

curl http://localhost:8983/solr/update/extract?literal.id=rem1&uprefix=attr_&fmap.content=body&commit=true" -F stream.url=http://fakesite.com

.

Эквивалент локального хоста

curl http://localhost:8983/solr/update/extract?literal.id=rem1&uprefix=attr_&fmap.content=body&commit=true" -F "stream.url=http://duke.edu/web/aepi/"

отлично работает.

Спасибо!djs22

1 Ответ

4 голосов
/ 15 марта 2011

В целях безопасности удаленная потоковая передача по умолчанию отключена.Из Solr wiki :

Если потоковая передача включена, необходимо убедиться, что Solr настолько безопасен, насколько это необходимо.Когда потоковая передача включена, параметры «stream.url» перейдут на удаленный сайт и загрузят контент.Аналогично, «stream.file» будет читать файл на диске.

Потоковая передача по умолчанию отключена и настроена из solrconfig.xml

 <requestParsers enableRemoteStreaming="false" ... />
...