Очистка нескольких классов div с одним и тем же именем с помощью Beautiful Soup в Python - PullRequest
0 голосов
/ 14 февраля 2020

Я успешно удалил изображение и заголовок веб-страницы (URL в коде). Я хочу сделать это для всех фильмов, которые есть на этой странице. 'movie_list' содержит все это, но только первая информация mov ie очищается.

Я пытался изменить .find на .find_all, но это выдает ошибку.

url = 'https://5movies.to/movie/'
content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie_list = soup.find_all('div', {'class': 'movie-list'})
all_item = []

for allContainers in movie_list:
    filmName = allContainers.find('img').get('alt')
    filmFoto = allContainers.find('img').get('src')
    filmLink = allContainers.find('a').get('href')
print(filmName)

1 Ответ

0 голосов
/ 15 февраля 2020

Перемещение оператора print внутри for l oop заставило его распечатать весь список. На самом деле я заменил print на all_item.append((filmName, filmFoto, filmLink)), чтобы отправить его на мой интерфейс.

Спасибо @furas за информацию!

content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie_list = soup.find_all('div', {'class': 'movie-list'})
all_item = []

for allContainers in movie_list:
    filmName = allContainers.find('img').get('alt')
    filmFoto = allContainers.find('img').get('src')
    filmLink = allContainers.find('a').get('href')
    print(filmName)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...