Замените экранированные двойные кавычки на одинарные в Python, используя регулярные выражения - PullRequest
0 голосов
/ 24 сентября 2019

Я пытаюсь заменить экранированные двойные кавычки на одинарные в паре ключ-значение

import re
import json
js = r'{"result":"{\"key\":\"How are you? \"Great!\" he said. \"Coffee ?\"\"},{\"key\":\" 2. \"Why not sure\". They walked away\"}"}'
#print(js)
data1 = json.loads(js)
s = data1['result']
#print(s)
# {"key":"How are you? "Great!" he said. "Coffee ?""},{"key":" 2. "Why not, sure.". They walked away"}
p = re.compile(r"\"key\":\"(.*\"(.*)\".*)\"")
print(p.sub(r'\'\2\'',s))
# {\'Why not, sure.\'}
json_string = "[{0}]".format(p.sub(r'\'\1\'',s))
data_list = json.loads(json_string)

Используя приведенный выше код, я получил вывод «Coffee?» Вместо всей строки.Я хотел бы заменить двойную кавычку только в части значения.

Строка:"ключ": "Как дела?" Отлично! "Сказал он." Кофе? "",

Ожидаемая строка:"ключ": "Как дела? 'Отлично!'он сказал. «Кофе?»,

Ответы [ 2 ]

2 голосов
/ 24 сентября 2019

Этот ответ следует только за комментариями, которыми мы обменялись:

import json
js = r'{"result":"{\"key\":\"How are you? \"Great!\" he said. \"Coffee ?\"\"},{\"key\":\" 2. \"Why not sure\". They walked away\"}"}'
data1 = json.loads(js)
s = data1['result']

good_characters = [":","{","}", ","]
result = "" 
for key, value in enumerate(s):
    if (value == "\"" and s[key-1] not in good_characters) and (value == "\"" and s[key+1] not in good_characters):
        result += '\''  
    else:
        result += value

print (result)

Вывод

{"key":"How are you? 'Great!' he said. 'Coffee ?'"},{"key":" 2. 'Why not sure'. They walked away"}
0 голосов
/ 26 сентября 2019

Если ключ согласован в строке, это будет работать

s = data1['result']
','.join([d[:8] + d[8:-2].replace('"',"'") + d[-2:] for d in s.split(',')])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...