Я пытался прочитать ссылки из списка URL-адресов, которые я успешно извлек. Моя проблема в том, что я получаю TypeError Traceback (most recent call last)
, когда пытаюсь прочитать весь список. Однако когда я читаю отдельную ссылку, строка urlopen(urls).read()
выполняется без проблем.
response = requests.get('some_website')
doc = BeautifulSoup(response.text, 'html.parser')
headlines = doc.find_all('h3')
links = doc.find_all('a', { 'rel':'bookmark' })
for link in links:
print(link['href'])
for urls in links:
raw_html = urlopen(urls).read() <----- this row here
articles = BeautifulSoup(raw_html, "html.parser")