Как исправить ошибку кодирования кода c при использовании Pandas - PullRequest
0 голосов
/ 15 апреля 2020

Я читаю CSV и выполняю небольшую очистку данных и получаю следующую ошибку ...

UnicodeEncodeError: код 'charmap' c не может закодировать символ ' \ x96 'в позиции 6193: символ отображается в неопределенное значение

Если я закомментирую функции sort_values или drop_duplicates, ошибка не возникает. Как я могу исправить эту ошибку? Я новичок и провел сегодня часы, пытаясь найти ответ, но у меня ничего нет. Код ниже ...

import pandas as pd

theData = pd.read_csv(r'my.csv', encoding='latin1')

theData = theData.drop_duplicates(subset=['BROADCAST','ARTIST','SONG','LABEL','ALBUM'])
epNums = theData['BROADCAST'].str[15:]
epNums = epNums.str[:3]
theData['ep num'] = epNums
theData['ep num'] = theData['ep num'].astype(int)
theData = theData.sort_values(by=['ep num'])

print(theData)

1 Ответ

0 голосов
/ 16 апреля 2020

Эта ошибка, кажется, происходит только на моем P C, так как она прекрасно работает на Ma c моего друга. Но что решило проблему, заменив encoding= на engine='python.

...