Всякий раз, когда я вижу (искаженную) строку, например, строку, составленную из этого списка символов:
['\\', '\\', '6', '4', '\\', '\\', '2', 'e', '\\', '\\', '9', 'b', '\\', '\\', '3', '8']
когда предназначался этот список символов
['\x64', '\x2e', '\x9b', '\x38']
Я достигаю метода decode('string_escape')
.
Но чтобы использовать его, нам нужно заменить два символа r'\\'
на r'\x'
.
Для этого вы можете использовать метод replace(...)
.
In [37]: hexstring=r'\\64\\2e\\9b\\38'
In [38]: struct.unpack('f',(hexstring.replace(r'\\',r'\x').decode('string_escape')))
Out[38]: (7.3996168794110417e-05,)
In [39]: struct.unpack("f", "\x64\x2e\x9b\x38")
Out[39]: (7.3996168794110417e-05,)
PS. Такое использование метода decode
работает в Python2, но не будет работать в Python3. В Python3 codecs.decode
предназначен исключительно для преобразования байтовых объектов в строковые объекты (ошибочно, то, что Python2 называет объектами юникода), тогда как в приведенном выше примере decode
фактически преобразовывает строковый объект в строковый объект. Большинство кодеков декодирования в Python2 действительно преобразуют строковые объекты в объекты Unicode, но некоторые, такие как 'string_escape'
, не делают. Как правило, они были перемещены в другие модули или вызваны каким-либо другим способом.
В Python3 эквивалент hexstring.decode('string_encode')
равен codecs.escape_decode(hexstring)[0]
.
Редактировать: Другой способ, похожий по духу на ответ jsbueno, заключается в использовании binascii.unhexlify
:
In [76]: import binascii
In [81]: hexstring=r"\\64\\2e\\9b\\38"
In [82]: hexstring.replace('\\','')
Out[82]: '642e9b38'
In [83]: binascii.unhexlify(hexstring.replace('\\',''))
Out[83]: 'd.\x9b8'
Эти timeit
результаты предполагают, что binascii.unhexlify
является самым быстрым:
In [84]: %timeit binascii.unhexlify(hexstring.replace('\\',''))
1000000 loops, best of 3: 1.42 us per loop
In [85]: %timeit hexstring.replace('\\','').decode('hex_codec')
100000 loops, best of 3: 2.94 us per loop
In [86]: %timeit hexstring.replace(r'\\',r'\x').decode('string_escape')
100000 loops, best of 3: 2.13 us per loop
Редактировать, по комментариям:
Этот ответ содержит необработанные строки.
Департамент общественного здравоохранения консультирует
что есть сырые или недоваренные строки
представляет опасность для здоровья для всех, но
особенно пожилым, молодым
дети до 4 лет, беременные женщины
и другие очень восприимчивые
лица с ослабленным иммунитетом
системы. Тщательное приготовление сырья
Струны снижает риск заболевания.