Question

Я хочу автоматически скачивать файлы из pdf (в котором есть ссылки). Я уже написал скрипт, который находит все эти ссылки и прекрасно работает, проблема, с которой я сталкиваюсь, связана с именами файлов. Я хочу сохранить их под именами по умолчанию, чтобы было легко понять, что представляет собой каждый файл, без необходимости вручную менять каждое имя. Проблема в том, что каждое имя кодируется с использованием Unicode (UTF-8) в соответствии с этим сайтом https://www.webatic.com/url-convertor, который прекрасно конвертирует закодированные строки, но Python не позволяет мне использовать функцию decode для декодирования этого.

Например: эта строка% D7% 97% D7% 95% D7% 9E% D7% A8% D7% 99 +% D7% 9C% D7% 99% D7% 9E% D7% 95% D7% 93 должнастать חומרי לימוד после расшифровки.

Mark Tolonen · Answer 1 · 25 октября 2019

Python имеет парсер URL:

>>> import urllib.parse
>>> urllib.parse.unquote_plus('%D7%97%D7%95%D7%9E%D7%A8%D7%99+%D7%9C%D7%99%D7%9E%D7%95%D7%93')
'חומרי לימוד'

Расшифровка заданной закодированной строки с юникода на иврит

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Расшифровка заданной закодированной строки с юникода на иврит

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы