Извлечение названия книги и автора с сайта - Python 3 - PullRequest
0 голосов
/ 04 апреля 2020

Я пытаюсь создать два Python списка - один из названий книг и один из авторов книг с веб-сайта издателя, который скоро появится.

Я пробовал аналогичный подход на других Сайты издателя с успехом, но на этом сайте он вроде не работает. Я новичок в разборе html, поэтому я явно что-то упускаю, просто не могу понять, что. Функция find_all просто возвращает пустой список, поэтому мои списки заголовков и авторов также пусты.

Для справки, это то, что показывает html, когда я нажимаю «проверить» в моем браузере для первого заголовка и автор, соответственно. Я просмотрел документацию по BS4 и до сих пор не могу понять, что я делаю здесь не так.

<h3 class="sp__the-title"><a href="/books/9781250182937">Flame</a></h3>


<p class="sp__the-author">Donna Grant</p>

Спасибо за вашу помощь!

import requests
from bs4 import BeautifulSoup

page = 'https://us.macmillan.com/search?collection=coming-soon'
page_response = requests.get(page) 
soup = BeautifulSoup(page_response.content, "html.parser") 

titles = []
for tag in soup.find_all("h3", {"class":"sp__the-title"}):
    print(tag.text)
    titles.append(tag.text)

authors = []   
for tag in soup.find_all("p", {"class":"sp__the-author"}):
    print(tag.text)
    authors.append(tag.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...