ASCII и UTF проблемы в датафрейме - PullRequest
0 голосов
/ 27 мая 2018

У меня есть фрейм данных , где у меня есть такие символы, как% 22, и я пытаюсь заменить их с помощью urllib.Для других файлов этот код работал отлично, но по какой-то причине я получаю эту ошибку.Любые идеи, как я могу это исправить.Насколько я знаю, я использую utf-8.

df = pd.read_csv('Data\Genres\cleanedGenreArtistSong.csv',engine = 'python', encoding = 'utf-8-sig')
df['Song'] = df['Song'].apply(lambda x:urllib.unquote(x).decode('utf8') )

Я получаю ошибку:

UnicodeEncodeError: 'ascii' codec can't encode character u'\xe4' in position 1: ordinal not in range(128)

Это снимок моего фрейма данных:

введите описание изображения здесь

...