Чтение не алфавитного символа c с использованием pandas из excel - PullRequest
0 голосов
/ 26 мая 2020

Я пытаюсь прочитать этот файл , используя pandas в кодировке UTF-8.

Engli sh alphabeti c символы читаются правильно, но те символы, которые не являются Английский алфавит sh читается неправильно. Я пробовал читать, изменив кодировку с utf8 на cp1252, ASCII, но у меня ничего не сработало.

Подробнее см. Изображение. UTF8 encoded

ascii encoded

1 Ответ

0 голосов
/ 30 мая 2020
>>> import pandas as pd
>>> file = "D:\\Python\\SO3\\data\\62015078.xlsx"
>>> data = pd.read_excel(file,encoding='utf8')
>>> data.en
0     Release note
1    Sales package
2        Schematic
3         Software
4        Statistic
5            Video
Name: en, dtype: object
>>> data.ja
0    リリースノート
1    販売パッケージ
2        回路図
3     ソフトウェア
4         統計
5         動画
Name: ja, dtype: object
>>> data.zh
0    版本说明
1     销售包
2     示意图
3      软件
4      统计
5      视频
Name: zh, dtype: object

Фрагмент кода работает. Символ - это Символ замены (U+FFFD). Вам необходимо установить правильный шрифт консоли / терминала:

output with proper terminal font

То же окно с общим шрифтом консоли:

output with improper terminal font

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...