У меня есть столбец в CSV-файле, в котором значения Unicode (\ x) записаны как обычный текст. У меня есть следующий код (не мой), который я пытаюсь использовать для декодирования этого текста, но он выдает синтаксическую ошибку при попытке его использовать.
with open("fixed_datasetssscopy.csv", "r") as fp:
file_buffer = io.StringIO()
for line in fp.read().splitlines():
file_buffer.write(eval('''b"{}".decode('utf-8')'''.format(line)))
file_buffer.write('\n')
file_buffer.seek(0)
df = pandas.from_csv(file_buffer)
При просмотре записей, которые выбрасывают ошибки, они заключаются в кавычки "", когда я печатаю их в своей IDE, хотя в самом файле CSV их нет. Пример некоторых записей, которые дают ошибки, приведены ниже.
ER...in the end it's a job. So, fair dos. https:/asdasd
When i started using Gutenberg like a month ago, I didn't care for the workflow but now it makes it easy to do thin\xe2\x80\xa6 https:/asdasd
Фактическое сообщение об ошибке:
Traceback (most recent call last):
File "C:/Users", line 8, in <module>
file_buffer.write(eval('''b"{}".decode('utf-8')'''.format(line)))
File "<string>", line 1
b""ER...in the end it's a job. So, fair dos. https://u",,,,,,,,,".decode('utf-8')
^
SyntaxError: invalid syntax
Как я могу исправить эту ошибку?