неизвестная кодировка в Unicode - PullRequest
0 голосов
/ 09 ноября 2010

Какое будет название этой кодировки?

СМБ: // NAS / музыка / _lib / v / воевода / воевода-ррр% C3% B6% C3% B6% C3% B6aaarrr / 01% 20-% 20voivod% 20-% 20rrr% C3% B6% C3 % B6% C3% B6aaarrr% 20-% 20korg% C3% BCll_the_exterminator.mp3

Я хотел бы преобразовать такую ​​строку в Unicode, используя Python. Как бы я это сделал?

Ответы [ 3 ]

3 голосов
/ 09 ноября 2010

Это кодировка URL в кодировке UTF-8. URL-декодировать его, затем декодировать как UTF-8.

0 голосов
/ 04 декабря 2010
import urllib

>>> m="smb://nas/music/_lib/v/voivod/voivod-rrr%C3%B6%C3%B6%C3%B6aaarrr/01%20-%20voivod%20-%20rrr%C3%B6%C3%B6%C3%B6aaarrr%20-%20korg%C3%BCll_the_exterminator.mp3"
>>> m1= urllib.unquote(m)
>>> print(repr(m))
'smb://nas/music/_lib/v/voivod/voivod-rrr\xc3\xb6\xc3\xb6\xc3\xb6aaarrr/01 - voivod - rrr\xc3\xb6\xc3\xb6\xc3\xb6aaarrr - korg\xc3\xbcll_the_exterminator.mp3'
>>> m2= m1.decode('utf8')
>>> print(m2)
smb://nas/music/_lib/v/voivod/voivod-rrröööaaarrr/01 - voivod - rrröööaaarrr - korgüll_the_exterminator.mp3
0 голосов
/ 09 ноября 2010

Попробуйте urllib.unquote ().

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...