.html сохранен на локальный диск, и я использую BeautifulSoup (bs4) для его анализа.
Все работало нормально, пока в последнее время не было изменено на Python 3.
Я тестировал то же самое.html файл на другом компьютере Python 2, он работает и возвращает содержимое страницы.
soup = BeautifulSoup(open('page.html'), "lxml")
Компьютер с Python 3 не работает, и он говорит:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x92 in position 298670: illegal multibyte sequence
Обыскани я попробовал ниже, но ни один не работал: (будь то 'r', или 'rb' не имеет большого значения)
soup = BeautifulSoup(open('page.html', 'r'), "lxml")
soup = BeautifulSoup(open('page.html', 'r'), 'html.parser')
soup = BeautifulSoup(open('page.html', 'r'), 'html5lib')
soup = BeautifulSoup(open('page.html', 'r'), 'xml')
Как я могу использовать Python 3 для анализа этой HTML-страницы?
Спасибо.