У меня простой (но чрезвычайно сложный) вопрос.
Я ищу способ преобразовать текстовый файл, который содержит этот тип кода смайликов (\ud83d\udc40)
и заменить его на тот, который будет содержать - настоящий символ смайликов 4
Е.Г.
with open(OUTPUT, "r+") as infileInsight:
insightData = infileInsight.read()\
.replace('\ud83d\udc40','?')\
......
with open(OUTPUT, "w+") as outfileInsight:
outfileInsight.write(insightData)
По поводу того, что оно дублируется:
Если я сделаю так:
with open(OUTPUT, "r+") as infileInsight:
insightData = infileInsight.read()\
.replace('\ud83d\udc40','?')\
......
with open(OUTPUT, "w+") as outfileInsight:
outfileInsight.write(insightData.decode('unicode-escape'))
У меня ошибка:
UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ u2600' в позиции 30: порядковый номер не в диапазоне (128)