Beautiful Soup, похоже, не работает должным образом (для меня), если HTML содержит юникоды, ascii которых превышает 128. Какое подходящее декодирование-кодирование следует использовать для этого?
raw = open('index.html').read()<br>
BeautifulSoup.BeautifulSoup(raw)
Ошибка
...stacktrace...<br>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe9' in position 8094: ordinal not in range(128)