У меня есть строка. В этой строке двойные обратные слеши. Я хочу заменить двойную обратную косую черту одинарной обратной косой чертой, чтобы коды символов Юникода можно было правильно проанализировать.
(Pdb) p fetched_page
'<p style="text-align:center;" align="center"><strong><span style="font-family:\'Times New Roman\', serif;font-size:115%;">Chapter 0<\\/span><\\/strong><\\/p>\n<p><span style="font-family:\'Times New Roman\', serif;font-size:115%;">Chapter 0 in \\u201cDreaming in Code\\u201d give a brief description of programming in its early years and how and why programmers are still struggling today...'
Внутри этой строки вы можете видеть экранированные коды символов Юникода, такие как:
\\u201c
Я хочу превратить это в:
\u201c
Попытка 1:
fetched_page.replace('\\\\', '\\')
но это не работает - он ищет четырехкратные обратные слеши.
Попытка 2:
fetched_page.replace('\\', '\')
Но это приводит к ошибке конца строки.
Попытка 3:
fetched_page.decode('string_escape')
Но это никак не повлияло на текст. Все двойные обратные косые черты остались как двойные обратные косые черты