Поиск Openwayback не работает с арабским веб-сайтом в URL - PullRequest
0 голосов
/ 06 ноября 2018

Я установил и настроил basic of openwayback и теперь пытаюсь заставить его работать со следующим ресурсом

https://moj.gov.ae/documents/21128/102233/قرار+مجلس+الوزراء+رقم+18+لسنة+2017+بشأن+اعتماد+قائمة+الاشخاص+والتنظيمات+الارهابية.pdf

Установка:

  1. Я использовал webrecorder.io для загрузки указанного выше файла warc.
  2. Конфигурирование openwayback до минимума и помещение файла warc в папку данных
  3. Откройте веб-приложение и попробуйте найти точный адрес

Результаты:

  1. Ничего не найдено. Адрес превращается в

    http://localhost:8855/wayback/19960101000000-20181231235959*/ https://moj.gov.ae/documents/21128/102233/????+????+???????+???+18+????+2017+????+??????+?????+???????+??????????+?????????.pdf

  2. Но, например, если я поставлю только https://moj.gov.ae, я смогу найти документ в виде URL encoded. Но даже если я скопирую всю эту кодировку URL в строку поиска, ничего не появится.

Что я ожидаю:

  1. Если вы скопируете весь URL, арабский или нет, этот конкретный документ должен отображаться
  2. Результат поиска должен быть в незашифрованном виде

Есть какие-то настройки, которые я пропустил?

...