Получение текста между тегами HTML <a>с красивым супом - PullRequest
0 голосов
/ 21 марта 2020

Я пытаюсь очистить все имена mov ie с веб-сайта.

url = 'https://www.boxofficemojo.com/year/world/2019/'
content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie = soup.find('a', {'class': 'a-link-normal'})
print(movie)

С этим кодом я получаю следующий результат

<a class="a-link-normal" href="/?ref_=bo_nb_ydw_mojologo"></a>

Однако, когда я проверяю страницу, я получаю результат ниже. Текст между тегом 'a' - это то, что мне нужно.

<a class="a-link-normal" href="/releasegroup/gr3511898629/?ref_=bo_ydw_table_1">Avengers: Endgame</a>

Как мне его получить?

1 Ответ

1 голос
/ 21 марта 2020
movie = soup.find('td', class_='a-text-left mojo-field-type-release_group')
print(movie.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...