Я читаю CSV и выполняю небольшую очистку данных и получаю следующую ошибку ...
UnicodeEncodeError: код 'charmap' c не может закодировать символ ' \ x96 'в позиции 6193: символ отображается в неопределенное значение
Если я закомментирую функции sort_values
или drop_duplicates
, ошибка не возникает. Как я могу исправить эту ошибку? Я новичок и провел сегодня часы, пытаясь найти ответ, но у меня ничего нет. Код ниже ...
import pandas as pd
theData = pd.read_csv(r'my.csv', encoding='latin1')
theData = theData.drop_duplicates(subset=['BROADCAST','ARTIST','SONG','LABEL','ALBUM'])
epNums = theData['BROADCAST'].str[15:]
epNums = epNums.str[:3]
theData['ep num'] = epNums
theData['ep num'] = theData['ep num'].astype(int)
theData = theData.sort_values(by=['ep num'])
print(theData)