Я пытаюсь импортировать csv, содержащий китайские символы.
эта команда загружает файл csv
!wget -O wm.csv https://raw.githubusercontent.com/hierarchyJK/compare-LIBSVM-with-Linear-and-Gassian-Kernel/master/%E8%A5%BF%E7%93%9C3.0.csv
Хранилище не мое, поэтому я не уверен, чтоон закодирован правильно.
Я могу быть уверен, что правильно отображает .
этот код
pd.read_csv('wm.csv',encoding = 'utf-8')
вызывает эту ошибку
Кодек 'utf-8' не может декодировать байт 0xb1 в позиции 0: неверный стартовый байт
Я искал эту ошибку, не нашел подходящего rcaи решение.
этот код выполнен правильно
pd.read_csv('wm.csv',encoding = 'cp1252')
, но отображает искаженные
![enter image description here](https://i.stack.imgur.com/wGtvY.png)
, которые система отображаетКитайские иероглифы правильно.
![enter image description here](https://i.stack.imgur.com/KnnnE.png)
с командой открытия Python
with open('wm.csv', 'r', encoding='cp1252') as f:
for line in f.readlines():
print(line)
break
этот код отображает что-то искаженное без каких-либо предупреждений или ошибок.
±àºÅ,É«Ôó,¸ùµÙ,ÇÃÉù,ÎÆÀí,Æ겿,´¥¸Ð,ÃܶÈ,º¬ÌÇÂÊ,ºÃ¹Ï,Ðò¹Øϵ