Я использую beautifulSoup для очистки страницы, имеющей кодировку ISO-8859-1, однако наткнулся на мой маленький сбой.
У меня есть строка, которая гласит:
logging.info("Processing [%s]" % (link))
Переменная link
является одним из значений, извлеченных из Beautifulsoup. Это строка Unicode, и я могу напечатать ее, набрав print link
. Он отображается на консоли точно так же, как он был очищен, но строка выше выдает эту ошибку:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 14: ordinal not in range(128)
Я уже читал об Unicode, но не могу понять, почему он может распечатать его, но не может его записать.
Строка, о которой идет речь, такова:
booba-concert-à-bercy
Есть идеи, где я все это испорчу?
Спасибо.