Используя следующий URL в качестве примера, код получает только 35 элементов вместо 85, перечисленных на странице. Это тот случай, когда нужно использовать селен для загрузки страницы с исходным видом? Как может bs4 пропустить остальные элементы li?
r = requests.get(url=url)
soup = bs(r.text, 'html.parser')
jobkeys = []
jobs = soup.findAll("li", {"class": "cmp-JobListItem"})
for job in jobs:
s = job.attrs.get('data-tn-entityid')
jobkey = s[s.find(',')+1:s.rfind(',')]
jobkeys.append(jobkey)
Редактировать:
Используя селен, я смог «увидеть», что происходит, когда страница загружается. URL автоматически перенаправляется на предварительно отфильтрованный мобильный сайт.
С этим новым сайтом я могу удалить фильтр, получить новый URL и получить правильный номер.
Спасибо!