UnicodeDecodeError: код «utf-8» c не может декодировать байт 0xb4 в позиции 4: недопустимый начальный байт - PullRequest
0 голосов
/ 11 марта 2020

Я экспортировал CSV-файл из Microsoft Excel. В блокноте Jupyter он показывал правильно с pandas и numpy, как показано ниже:

import pandas as pd
pd1 = pd.read_csv('test1.csv', encoding='utf-8')

В первый раз не было сообщений об ошибках, но я просто открыл файл CSV, а затем просто сохранил его под новым именем.

все время я получаю сообщение Unicodeerror

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 4: invalid start byte

Данные имеют странные буквы, как показано ниже. Даже если были странные буквы, вначале проблем не было.

2 столбца, 6 строк

data

Я должен справиться все языки, поэтому я действительно хочу знать, как их кодировать. Как решить эту проблему?

1 Ответ

0 голосов
/ 24 марта 2020

При сохранении как, будет выбран формат кодирования

How to select

Попробуйте сохранить как и посмотреть, работает ли он .?

...