Расшифровка заданной закодированной строки с юникода на иврит - PullRequest
0 голосов
/ 25 октября 2019

Я хочу автоматически скачивать файлы из pdf (в котором есть ссылки). Я уже написал скрипт, который находит все эти ссылки и прекрасно работает, проблема, с которой я сталкиваюсь, связана с именами файлов. Я хочу сохранить их под именами по умолчанию, чтобы было легко понять, что представляет собой каждый файл, без необходимости вручную менять каждое имя. Проблема в том, что каждое имя кодируется с использованием Unicode (UTF-8) в соответствии с этим сайтом https://www.webatic.com/url-convertor, который прекрасно конвертирует закодированные строки, но Python не позволяет мне использовать функцию decode для декодирования этого.

Например: эта строка% D7% 97% D7% 95% D7% 9E% D7% A8% D7% 99 +% D7% 9C% D7% 99% D7% 9E% D7% 95% D7% 93 должнастать חומרי לימוד после расшифровки.

1 Ответ

0 голосов
/ 25 октября 2019

Python имеет парсер URL:

>>> import urllib.parse
>>> urllib.parse.unquote_plus('%D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93')
'חומרי לימוד'
...