Строка декодирования в UTF-8 (строки кодирования URL / процента) - PullRequest
0 голосов
/ 27 января 2020

В моей программе Python 3 я встречал странно закодированные строки, такие как "abol% C3% A2t" (abolât) и "% C5% 93ufs" (œufs). Я получаю их из WiktionaryParser.

Я нашел только способы, чтобы закодировать его в UTF-8 для строк в кавычках для печати, что здесь не так. Как я могу изменить строку с "% C3% A9vitables" на "évitables"?

1 Ответ

0 голосов
/ 27 января 2020

Эти строки в процентах . Используйте модуль urllib.parse для их декодирования:

import urllib.parse

s = "%C5%93ufs"
s = urllib.parse.unquote(s)
...