Бросая красивую ошибку кодирования Soup с перерывами - PullRequest
0 голосов
/ 08 июня 2018

Я использую BeautifulSoup для разбора html-страниц, иногда выдает ошибку кодирования, такую ​​как «ошибка кодирования: преобразование ввода не выполнено из-за ошибки ввода, байты 0x9D 0x3C 0x2F 0x74» Я пытался отловить эту ошибку при попытке, кроме блока, чтобы точно знатькакие строки вызывают ошибку, потому что у меня много строк с BeautifulSoup, но это не сработало, потому что похоже, что BeautifulSoup сообщает об ошибке только в stderr, игнорирует эти символы и продолжает работать

r  = requests.get("someurl")
try:
     soup = BeautifulSoup(r.content,"lxml")
except Exception as e:
     print(e)

есть ли способзнаете, какая именно строка выдает ошибку, и какие символы вызывают ошибку кодирования?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...