Чтение Python CSV мешает UTF-8 кодирования - PullRequest
0 голосов
/ 15 ноября 2018

Я пытаюсь прочитать CSV-файл, используя панды в Python, а позже я пытаюсь прочитать текстовый файл и заменяю содержимое значениями в CSV Я получаю ниже ошибки:

 lines = [line.decode('utf-8').strip() for line in lines]
  File "/usr/local/lib/python2.7/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 140: invalid start byte

1 Ответ

0 голосов
/ 15 ноября 2018

попробуйте использовать ниже. У меня это очень просто получилось.

 str= str.decode('unicode_escape').encode('utf-8') 

если вы читаете текстовый файл, то здесь вам нужно пробежаться по каждому элементу списка, вы можете попробовать что-то ниже

lines= open("file.text", "r")
lines = fileread.readlines()
lines = [line.decode('unicode_escape').encode('utf-8') for line in lines]

Надеюсь, это поможет ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...