В заданной строке я пытаюсь заменить backsla sh, за которым следует двойная кавычка, но ничего не работает. Я также пробовал искать в SO, но, хотя существует множество решений для замены обратной косой черты, а также для замены кавычек, я не смог найти ни одного, где можно было бы заменить оба вместе. Здесь я даю образец строки.
sample_str = '{"source": "<a href=\"http://twitter.com/download/iphone\" rel=\"nofollow\">Twitter for iPhone</a>", "in_reply_to_status_id": null}'
Я хотел бы преобразовать его в строку, подобную следующей -
sample_str = '{"source": "<a href=http://twitter.com/download/iphone rel=nofollow>Twitter for iPhone</a>", "in_reply_to_status_id": null}'
Итак, единственное, что я хочу заменить, это где кавычкам предшествуют обратные косые черты (а не ВСЕ кавычки, что возможно, если я удалю обратные косые черты и кавычки отдельно).
Я пробовал следующее, но ни один из них, похоже, не работает (также пробовал с регулярным выражением, но не повезло !). Я уверен, что мне не хватало чего-то очень очевидного.
sample_str = sample_str.replace(r'\"', '')
sample_str = sample_str.replace('\\"', '')
Я читаю их из JSON дампа твитов и пытаюсь декодировать как JSON. Но оказывается, что из-за этого библиотека JSON не может читать его как словарь Python. Я предположил, что об этом должна была позаботиться библиотека, но, похоже, это не работает. Так что любое решение, которое дает мне словарь Python без этой замены, также подойдет мне (а также предпочтительнее).
Если я пропустил некоторую информацию, сообщите мне, и я добавлю ее. Любая помощь в этом будет принята с благодарностью.