Я продолжаю получать следующую ошибку при попытке разобрать html с помощью BeautifulSoup:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xae in position 0: ordinal not in range(128)
Я пытался расшифровать html, используя решение для вопросов ниже, но продолжаю получать ту же ошибку. Я испробовал все решения для приведенных ниже вопросов, но ни один из них не сработал (публикуя сообщения, чтобы я не получал повторяющихся ответов и в случае, если они помогают кому-либо найти решение, просматривая соответствующие подходы к проблеме).
Кто-нибудь знает, где я здесь не так? Это ошибка в BeautifulSoup и стоит ли устанавливать более раннюю версию?
РЕДАКТИРОВАТЬ: код и трассировка ниже:
from BeautifulSoup import BeautifulSoup as bs
soup = bs(html)
Traceback (most recent call last):
File "<console>", line 1, in <module>
File "/var/lib/python-support/python2.5/BeautifulSoup.py", line 1282, in __init__
BeautifulStoneSoup.__init__(self, *args, **kwargs)
File "/var/lib/python-support/python2.5/BeautifulSoup.py", line 946, in __init__
self._feed()
File "/var/lib/python-support/python2.5/BeautifulSoup.py", line 971, in _feed
SGMLParser.feed(self, markup)
File "/usr/lib/python2.5/sgmllib.py", line 99, in feed
self.goahead(0)
File "/usr/lib/python2.5/sgmllib.py", line 133, in goahead
k = self.parse_starttag(i)
File "/usr/lib/python2.5/sgmllib.py", line 285, in parse_starttag
self._convert_ref, attrvalue)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xae in position 0: ordinal not in range(128)
РЕДАКТИРОВАТЬ: сообщение об ошибке на комментарий ниже:
Traceback (most recent call last):
File "<console>", line 1, in <module>
File "/var/lib/python-support/python2.5/BeautifulSoup.py", line 1282, in __init__
BeautifulStoneSoup.__init__(self, *args, **kwargs)
File "/var/lib/python-support/python2.5/BeautifulSoup.py", line 946, in __init__
self._feed()
File "/var/lib/python-support/python2.5/BeautifulSoup.py", line 971, in _feed
SGMLParser.feed(self, markup)
File "/usr/lib/python2.5/sgmllib.py", line 99, in feed
self.goahead(0)
File "/usr/lib/python2.5/sgmllib.py", line 133, in goahead
k = self.parse_starttag(i)
File "/usr/lib/python2.5/sgmllib.py", line 285, in parse_starttag
self._convert_ref, attrvalue)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xae in position 0: ordinal not in range(128)
Спасибо за вашу помощь!
Ошибка кодека 'ASCII' в BeautifulSoup
UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xef' в позиции 0: порядковый номер не в диапазоне (128)
Как преобразовать формат файла из Unicode в ASCII, используя Python?
python UnicodeEncodeError> Как я могу просто удалить тревожные символы Юникода?
UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xef' в позиции 0: порядковый номер не в диапазоне (128)