Проблема в том, что ваш первоначальный вызов find()
возвращает пустой <div>
, и поэтому ваш последующий вызов find_all
возвращает пустой список:
>div = soup.find("div",{"class":"pana jobResultPaging tab-paging-top"
>div
<div class="pana jobResultPaging tab-paging-top">
</div>
>div.find_all("a")
[]
Обновление:
Причина, по которой вы не можете проанализировать содержимое <div>
, о котором идет речь (т. Е. Почему он пуст), связана с тем фактом, что данные, извлеченные с сервера, «разбиты на страницы» JavaScript-кодом на стороне клиента (код в вашем браузере). Ваш код Python анализирует только тот HTML-код, который возвращается запросом к iworkfor.nsw.gov.au
; данные, которые вам нужны (и которые превращаются в «страницы»), запрашиваются тем же javascript и возвращаются сервером в формате, называемом JSON
.
Итак, плохая новость заключается в том, что предоставленные вам инструкции не будут работать. Вам нужно будет проанализировать JSON, возвращенный сервером, и затем декодировать экранированный HTML, который он содержит.