UnicodeEncodeError при разборе HTML с Beautiful Soup - PullRequest
0 голосов
/ 27 мая 2018

Я учусь разбирать HTML с помощью Beautiful Soup.Я работал с NetBeans как IDE в виртуальной среде (Python 3.6), и у меня не было проблем.

Я удивился, когда попробовал очень простой код, чтобы найти все элементы 'a' извеб-сайт я получил ошибку.Если я попытался выбрать все «h3» или любой другой элемент, он работает, но не при попытке «a».

import requests
import bs4
url = 'https://www.python.org/events/'
req = requests.get(url)
req.raise_for_status()
reqText = req.text
soup = bs4.BeautifulSoup(reqText, "html.parser")
selection1 = soup.find_all('a')
print(selection1)

Ошибка говорит:

Traceback (most recent call last):
  File "C:\PROJECTS\Python36\src\new_main.py", line 9, in <module>
    print(selection)
  File "C:\Anaconda2\envs\env1a\lib\encodings\cp1252.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\u25bc' in position 211: character maps to <undefined>

У меня есть другойIDE установлен (Spyder) и он работал при его использовании.

Похоже, это проблема с кодеками.Может кто-нибудь сказать мне, как я могу решить эту проблему.Почему Netbeans дает сбой при выборе очень определенного элемента, и это работает иначе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...