Вы можете попробовать выбрать на основе структуры верхнего уровня. Если присмотреться, всегда есть тег article
, а затем фотография находится в 4-м делении, прямо под заголовком.
![enter image description here](https://i.stack.imgur.com/QgXJ4.png)
Вы можете сделать это с BeautifulSoup
примерно так:
from BeautifulSoup import BeautifulSoup as soup
article = soup.find('article')
divs_in_article = article.find_all('div')
divs_in_article[3]
должны иметь данные ты ищешь. Если BeautifulSoup
захватывает погружения под первым тегом header
, возможно, вам придется проявить творческий подход и сначала пропустить этот тег. Я бы сам попробовал, но сейчас у меня не работает ChromeDriver.
В качестве альтернативы вы можете попробовать:
images = soup.find_all('img')
, чтобы получить все теги изображений на странице. Это тоже может сработать.
BeautifulSoup имеет множество удобных методов, позволяющих вам помечать объекты на основе структуры. Взгляните на , идущие туда-сюда , , идущие вбок , , понижающиеся и , повышающиеся . Вы должны быть в состоянии различить структуру, используя инструменты разработчика в вашем браузере, а затем придумать способ выбрать коллекции, которые вас интересуют, для комментариев.