Google Search Appliance - лучший способ фильтрации типов файлов - PullRequest
0 голосов
/ 06 февраля 2012

Я пытаюсь настроить фильтр для пользователей по типу файла.

Использование специальных условий запроса Фильтрация типов файлов или Фильтр расширений файлов добавляет текст вконец термина запроса.Который, в свою очередь, отображает запрос "abc etx: pdf", а также добавляет это к предложениям, что вряд ли идеально.

Настройка отдельного внешнего интерфейса для каждого типа файла или использование as_filetype также приводит к результатам.в подобном затруднительном положении.

Я действительно не хочу настраивать отдельные коллекции для каждого, потому что тогда я получу более 70 коллекций (есть 10 сайтов, которые я сканирую).

Существуют ли другие альтернативы, которые фильтруют результаты по mime или расширению, которые не добавляются в термин запроса?Каков наилучший способ фильтрации по MIME или расширению?

1 Ответ

0 голосов
/ 01 апреля 2015

Если расширение файла появляется в его URL, вы можете использовать Entity Recognition, чтобы добавить специальную запись метаданных с расширением файла в качестве значения. Или вы можете вернуть специальный HTTP-заголовок ответа с вашего веб-сервера для файла, который вы можете настроить в GSA как дополнительные метаданные для файла.

Если у вас есть определенное поле метаданных для файла (ов), вы можете использовать параметр requiredfields, чтобы отфильтровать их без загрязнения условий поиска. Например, скажем, все PDF-файлы имеют поле метаданных с именем «FileType» со значением «PDF», ваш поисковый URL будет выглядеть как

...&q=<what user searched>&requiredfields=FileType:PDF

...